Skip to content

15810856129/Tag_word_recognition

Repository files navigation

Tag_word_recognition

动态更新现有的部分标签词


---Tag_word_recognition |--实验结果 | |--标签词扩充.xmind 整个实验的设计思路,自己画的思维导图. | |--标签词识别实验结果.pdf 实验过程及结果的记录,并包括自己的一些改进想法. |----------------------------------------------------------------------------------- |--conf | |--tag_library_v1.0_20170616文件是现有的标签词集 | |--stop_words.yaml 停用词表 | |--log.yaml 运行配置文件 |----------------------------------------------------------------------------------- |--data | |--weibo_account_info_v1.2_20180606 爬取的微博语料 |----------------------------------------------------------------------------------- |--w2c | |--model 训练好的word2vec模型 |----------------------------------------------------------------------------------- |--clustering.py 词聚类函数 |--compute_text_similarity.py 计算与文本语义相似的标签词 |--sentence_to_vector.py 将一条文本表示成词向量的形式 |--tag_word_vetor.py 获取标签词的词向量 |--tag_word_association.py 计算与标签词相关的词 |--text_preprosess.py 文本预处理函数 |--tags_performance_tests.py 对新发掘的标签词进行性能测试 |--main.py 标签词识别主函数


About

动态更新现有的部分标签词

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages