2021 不易,愿祖国繁荣昌盛
基于 Tensorflow 框架,使用双向 LSTM 模型,进行文本分类。半监督学习方法。新浪微博热门微博爬虫(Selenium)
2. 抽取式文本摘要
借助 SnowNLP 中实现的 TextRank 算法,提取新闻文本中的摘要和关键词 + Django Web APP
【非本人项目,帮忙调试】通过爬虫获取豆瓣电影的评论,借助 SnowNLP、jieba 分词等工具,分析情感和影评评分,进行推荐 + Flask
分析用户搜索相关数据:搜索次数、关键词、时间、点击 URL、找搜索关键词的用户 + 简单用户注册登录功能 + Django
5. LSTM 模型股价预测
【非本人项目,帮忙调试】tushare 接口获取历史股价信息,通过 LSTM(似乎其实是 MLP)训练预测模型 + Flask
【非本人项目,帮忙调试】51job 招聘信息获取,可视化数据与简单的统计分析,Scrapy + Flask
7. 新闻摘要与分类系统
从新浪滚动新闻获取多个类别的新闻,TextRank 生成新闻摘要,PaddlePaddle 训练深度神经网络多分类模型 + Django Demo
8. 比价网实现
【非本人项目,帮忙调试】通过爬虫获取比价网的信息,多了一些新的展示信息。该网站反爬策略较强,建议手动访问该网站,并且把 cookie 复制出来再发请求
9. 贝叶斯垃圾邮件分类系统
Java 实现朴素贝叶斯分类 + Spring Boot + Thymeleaf
是一个以前写过的 Bayes + SVM + Decision Tree 三种算法的大融合,Django GUI