ch = CorpusHelper(language='spanish') ch.load() cm=CorpusModel(corpus=ch) params = cm.fit() print('Our model has an AUC of {}'.format(cm.x_validation(params))) #el data_json hay que rellenarlo con un ciclo para que vaya cambiando los candidatos y el post #ocupando lo que había hecho la popi, les cambié los nombres a esto para que sea más fácil jeje datas_json = ['data1.json', 'data2.json', 'data3.json', 'data4.json','data5.json','data6.json', 'data7.json', 'data8.json', 'data9.json', 'data10.json'] for data_json in datas_json: with open (data_json, mode = 'r', encoding='utf-8',) as file: lector = json.load(file) #esto lee el json comentarios = [] for x in range(0, len(lector)): comentarios.append(lector[x]['message']) #aqui accede al indice x del arreglo y al contenido 'message' Id = LanguageDetector() comentarios = [text for text in comentarios if Id.detect(text) == 'es'] lista=cm.predict(comentarios, params) #esto es magia print(lista) comentariosPositivos = 0 total= len(lista) for index in range(0, len(lista)): comentariosPositivos += lista[index] porcentajePositivo = ((comentariosPositivos/total)*100) print(porcentajePositivo) print("% aprobación") comentariosNegativos = total - comentariosPositivos porcentajeNegativo = ((comentariosNegativos/total)*100) print(porcentajeNegativo) print("% de reprobación")
from corpus import CorpusHelper, CorpusModel from language_detector import LanguageDetector if __name__ == '__main__': ch = CorpusHelper(language='spanish') ch.load() cm = CorpusModel(corpus=ch) params = cm.fit() print(cm.x_validation(params)) texts = [ 'El candidato es un ladrón y un mentiroso', '@AlgoMortal Muchas felicidades que lo pases muy bien :)', '@eslatarde @PPopular En una palabra, INSULTANTE!!!' ] ld = LanguageDetector() texts = [text for text in texts if ld.detect(text) == 'es'] print(cm.predict(texts, params))