- Xây dựng mô hình tóm tắt văn bản dựa trên phương pháp trích xuất (extraction-based) với 3 mô hình chính:
- Clustering (Kmean)
- TextRank (ý tưởng cơ bản giống với pagerank)
- Lsa
- Chạy ứng dụng trên nền web (chi tiết trong file report)
- Cách chạy:
- cd vào thư mục chứa file main.py (
viet_summarizer/tree/main/src/main.py
) - Chạy lệnh:
streamlit run main.py
- cd vào thư mục chứa file main.py (
- Cách chạy:
- Các thư viện liên quan:
- numpy, pandas, matplotlib
- sklearn
- nltk
- gensim
- pyvi
- networkx
- streamlit
trongtuyen99/viet_summarizer
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
Tóm tắt văn bản tiếng việt sử dụng machine learning, textrank
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published