Skip to content

Thinkgamer/weiboHotWord

Repository files navigation

weiboHotWord

基于hadoop和hive的微博热词跟踪系统

对应的blog地址为:

http://blog.csdn.net/gamer_gyt/article/details/51940211
<1>首先是利用微博的api得到每天的微博数据
<2>编写hadoop项目对微博内容进行分词统计,设置一个阀值,当一个词的出现的数目超过这个阀值时就将其加入到热词列表里,在以后的每天就对其进行统计
<3>将处理后的数据写入hive

About

基于hadoop和hive的微博热词跟踪系统

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published