扫描手机二维码

欢迎您的访问
您是第 位访客

开通时间:..

最后更新时间:..

  • 李先毅 ( 高级工程师 )

    的个人主页 http://faculty.dlut.edu.cn/lxy/zh_CN/index.htm

  •   高级工程师
论文成果 当前位置: 李先毅中文主页 >> 科学研究 >> 论文成果
基于Hadoop/Hive的web日志分析系统的设计

点击次数:
论文类型:期刊论文
发表时间:2011-10-30
发表刊物:广西大学学报(自然科学版)
收录刊物:PKU、ISTIC
卷号:36
期号:z1
页面范围:314-317
ISSN号:1001-7445
关键字:web日志;云计算;Hadoop;Hive
摘要:互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大.如何存储、处理大规模数据就成了新的挑战.云计算技术的出现,为这类问题的解决提供了一种思路.云计算将数据通过网络分布到集群的各个计算节点上,从而完成大规模数据的存储和运算.Hadoop是一个用于构建云计算平台的流行的开源框架,广泛应用于海量数据的处理.但利用Hadoop处理数据,用户必须自己开发Map/Reduce程序.这种程序处于比较低的层次,用户不容易掌握,而且难于维护.Hive是一个基于Hadoop的开源数据仓库工具,它能够将文件映射成数据表,并提供类SQL语句,简化了用户的开发.利用Hadoop、Hive设计了一个用于处理web日志分析的系统,既充分利用了Hadoop的海量数据处理的能力,又降低了开发的难度.通过与单机实验的对比,证明系统是有效的和有价值的.

 

辽ICP备05001357号 地址:中国·辽宁省大连市甘井子区凌工路2号 邮编:116024
版权所有:大连理工大学