Python LanguageDetector.detect示例

编程语言: Python

命名空间/包名称: language_detector

类/类型: LanguageDetector

方法/功能: detect

hotexamples.com的示例: 2

Python LanguageDetector.detect - 已找到2个示例。这些是从开源项目中提取的最受好评的language_detector.LanguageDetector.detect现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

LanguageDetector(4)

detect(2)

detect_language(1)

detect_languages_df(1)

guess_language(1)

process(1)

示例#1

显示文件

文件： sentanalisis.py 项目： popimardones/Proyecto2017

ch = CorpusHelper(language='spanish')
ch.load()
cm=CorpusModel(corpus=ch)
params = cm.fit()
print('Our model has an AUC of {}'.format(cm.x_validation(params)))
#el data_json hay que rellenarlo con un ciclo para que vaya cambiando los candidatos y el post
#ocupando lo que había hecho la popi, les cambié los nombres a esto para que sea más fácil jeje
datas_json = ['data1.json', 'data2.json', 'data3.json', 'data4.json','data5.json','data6.json', 'data7.json', 'data8.json', 'data9.json', 'data10.json']
for data_json in datas_json:
	with open (data_json, mode = 'r', encoding='utf-8',) as file:
		lector = json.load(file) #esto lee el json
		comentarios = []
		for x in range(0, len(lector)):	
			comentarios.append(lector[x]['message'])	 #aqui accede al indice x del arreglo y al contenido 'message'
	Id = LanguageDetector()
	comentarios = [text for text in comentarios if Id.detect(text) == 'es']
	lista=cm.predict(comentarios, params) #esto es magia
	print(lista)
	comentariosPositivos = 0
	total= len(lista)
	for index in range(0, len(lista)):
		comentariosPositivos += lista[index]
	porcentajePositivo = ((comentariosPositivos/total)*100)
	print(porcentajePositivo)
	print("% aprobación")
	comentariosNegativos = total - comentariosPositivos
	porcentajeNegativo = ((comentariosNegativos/total)*100)
	print(porcentajeNegativo)
	print("% de reprobación")

示例#2

显示文件

from corpus import CorpusHelper, CorpusModel

from language_detector import LanguageDetector

if __name__ == '__main__':
    ch = CorpusHelper(language='spanish')
    ch.load()
    cm = CorpusModel(corpus=ch)
    params = cm.fit()
    print(cm.x_validation(params))

    texts = [
        'El candidato es un ladrón y un mentiroso',
        '@AlgoMortal Muchas felicidades que lo pases muy bien :)',
        '@eslatarde @PPopular En una palabra, INSULTANTE!!!'
    ]
    ld = LanguageDetector()
    texts = [text for text in texts if ld.detect(text) == 'es']
    print(cm.predict(texts, params))