Skip to content

Near-Tam/NLPClassify

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 

Repository files navigation

NLPClassify

基于朴素贝叶斯算法进行文本分类

安装库

1.sklearn 2.jieba 3.gensim 4.numpy

导入模块

from classify import Classify import numpy as np

训练

1.导入数据

X_train = np.array([u"我想听张学友的歌",u"周杰伦的龙卷风",u"鹿晗有什么歌好听",u"姚明打篮球好厉害",u"张继科会打乒乓球",u"詹姆士是体育明星"])
Y_train = np.array([1,1,1,2,2,2])	
Test_data = [u"我想听薛之谦的演员","邓亚萍是体育明星","刘翔是体育明星"]
//将X_train的数据分成1, 2两类

2.加载word2vec模型

Model = Classify()
Model.load_W2V_Model("word2vec.model")

3.训练模型

Model.train(X_train,Y_train)

4.利用模型进行预测

Model.predict(Test_data)
//Test_data = [u"我想听薛之谦的演员","邓亚萍是体育明星","刘翔是体育明星"]
//result:[1 2 2]

5.保存模型

Model.save_NBmodel( "NB.model")

6.加载模型并使用

NBmodel_test = Classify()
NBmodel_test.load_NBmodel("NB.model")
NBmodel_test.predict(Test_data)

数据与模型

   下载地址: 链接: https://pan.baidu.com/s/1jIdwM7W 密码: 加我微信943272448

AllMusicLibrary.txt

   字典词库

NB.model

   朴素贝叶斯训练生成的模型

word2vec.model word2vec.model.syn1neg.npy word2vec.model.wv.syn0.npy

   利用gensim库训练出来的一个word2vec模型所导出的文件

=======

About

基于朴素贝叶斯算法进行文本分类

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages