Skip to content

微信朋友圈LDA建模发现最常讨论的主题

Notifications You must be signed in to change notification settings

wut0n9/Wechat_LDA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

##微信朋友圈LDA主题建模发现最常讨论的主题##

  1. 朋友圈数据获取程序,导出微信朋友圈部分字段数据(移除用户名、评论和点赞好友),执行 mongoexport -d wechatDB -c wechatcollection --type=csv -f content,reason_artile,artile_title -o wechat.csv
  2. 执行: python Wechat_LDA.py wechat.csv
  3. 使用Tagul做词云可视化点我 将上一步程序运行生成的文件top_words.txt导入Tagul中即可。需要注意的是使用Tagul制作中文词云,Fonts选项必须设置为Noto Sans S Chinese Regular

附:stop_words.txt是我整理的停用词文件,可根据需求再添加新的停用词。同时,这里也附上主题特征词文件top_words.txt

示例图1 示例1

示例图2 示例2

About

微信朋友圈LDA建模发现最常讨论的主题

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages