Skip to content

kjs1715/IR_system

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 

Repository files navigation

IR_system

How to use

  1. 进入到flask_app/
  2. 打开main.py,取消Indexer(INDEX_DIR)的注释,INDEX_DIR为用户将存储和读取索引数据的文件夹,根据自身环境修改,在indexer.py修改CORPUS_DIR(改成已处理好的语料库的路径)
  3. python main.py等待建立完成
  4. 之后要启动flask时,将2中的语句注释掉

启动后:

  • 一般搜索:在搜索栏里输入关键词
  • 词性搜索:在搜索栏里输入关键词,格式为词语/词性,EX:比较/v (动词), 比较/d(副词)
  • 距离限制搜索:在搜索栏里输入关键词,并且在window size栏里输入距离大小。(1到6以内)6之后结果没有太大变化,建议设定为2到5。
  • 多词条搜索:在搜索栏里输入两个以上的关键词,或是两个词语以上组成的句子(确定组成的词不是固有名词,否则系统会认为是一个词语进行搜索,很有可能查不到结果

通用标记集(适用于所有版本)

n/名词 np/人名 ns/地名 ni/机构名 nz/其它专名
m/数词 q/量词 mq/数量词 t/时间词 f/方位词 s/处所词
v/动词 a/形容词 d/副词 h/前接成分 k/后接成分 i/习语 
j/简称 r/代词 c/连词 p/介词 u/助词 y/语气助词
e/叹词 o/拟声词 g/语素 w/标点 x/其它

About

Final project for IR of CST, Tsinghua

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published