Vector Space Model

Web Mining and Search course practice project

Establish vector space model in practice to retrieve relevence top 10 document with user query.

How to run the code

Initiate environment

pip install -r requirements.txt

Run

python main.py --query {query_str}

Notice :

query_str should be input within " " .
queries should be seperated by space .

Example :

python main.py --query "Trump Biden Taiwan China"

Output : top 10 news ID with scores

Term Frequency Weighting + Cosine Similarity
Term Frequency Weighting + Euclidean Distance
TF-IDF Weighting + Cosine Similarity
TF-IDF Weighting + Euclidean Distance
Relevence Feedback - TF-IDF + Cosine Similarity

The code runs for a long time on my computer. It costs more than 30 minutes :(

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
ChineseNews		ChineseNews
EnglishNews		EnglishNews
__pycache__		__pycache__
Parser.py		Parser.py
PorterStemmer.py		PorterStemmer.py
README.md		README.md
VectorSpace.py		VectorSpace.py
VectorSpace_chinese.py		VectorSpace_chinese.py
english.stop		english.stop
main.py		main.py
main_chinese.py		main_chinese.py
requirements.txt		requirements.txt
tfidf.py		tfidf.py
util.py		util.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ChineseNews

ChineseNews

EnglishNews

EnglishNews

pycache

pycache

Parser.py

Parser.py

PorterStemmer.py

PorterStemmer.py

README.md

README.md

VectorSpace.py

VectorSpace.py

VectorSpace_chinese.py

VectorSpace_chinese.py

english.stop

english.stop

main.py

main.py

main_chinese.py

main_chinese.py

requirements.txt

requirements.txt

tfidf.py

tfidf.py

util.py

util.py

Repository files navigation

Vector Space Model

How to run the code

Initiate environment

Run

About

Releases

Packages

Languages

jiangjiangjiangseana/wsm-vector-space-model

Folders and files

Latest commit

History

Repository files navigation

Vector Space Model

How to run the code

Initiate environment

Run

About

Resources

Stars

Watchers

Forks

Languages