Skip to content

爬取网站信息,分词存入数据库实现检索。检索结果的排序使用多种指标,如tf-idf,距离文件头的距离等。同时基于bayes所属类别的概率值。

JaminJiang/spiderAndAnalysis

About

爬取网站信息,分词存入数据库实现检索。检索结果的排序使用多种指标,如tf-idf,距离文件头的距离等。同时基于bayes所属类别的概率值。

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published