Skip to content

TSOTDeng/zhihu-analysis-python

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

知乎社交网络分析

简介

项目包含基于zhihu-python的多线程爬虫,数据I/O(SQLite,csv),以及基于用户关注网络的分析(使用networkx作为图算法库)。

注:目前zhihu-python最新版本已与本项目不兼容,但在这里你可以找到其在本项目中所使用的源代码版本。

文件说明

  • crawler文件夹:爬虫部分,以广度优先策略爬取知乎数据,并以csv格式储存
  • zhihu_schema.sql:SQLite数据库的schema
  • zhihu_database.py:将csv中的数据导入至数据库中
  • zhihu_analysis.py:从数据库中提取数据并进行分析

详细内容

About

Data analysis of Zhihu with Python

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 98.7%
  • PLpgSQL 1.3%