def reproceso_delimitacion():
    start=time.strftime("%H:%M:%S")
#    IMPORTA DATAFRAME LIMPIO DE GALERIAS REFERENCIA
    DF_Ref=pd.read_csv('''D:\\endeca\\ReprocesoSentimiento\\Pues_va_de_new\\Pruebas_con_negocio\\REPROCESO_JULIO_CON_NEOGIOCO'''+os.sep+'GaleriasRS_Referencia_limpio.csv',encoding='utf8',sep='\t')
#    IMPORTA DATAFRAME LIMPIO DE GALERIAS REPROCESADO
    DF_Reproc=pd.read_csv('''D:\\endeca\\ReprocesoSentimiento\\Pues_va_de_new\\Pruebas_con_negocio\\REPROCESO_JULIO_CON_NEOGIOCO'''+os.sep+'GaleriasRS_limpio.csv',encoding='utf8',sep='\t')
    ext1=DF_Ref[['event_id_no','Mensaje','Sentimiento']]
    ext2=DF_Reproc[['event_id_no','Sentimiento']]
    M1=pd.merge(ext1,ext2,on='event_id_no',how='inner')
    M1Mensaje=[]
    M1Mensaje_sucio=[]
    for l in M1.index:
        basura,auxiliar=limp.replacing_substrings(M1['Mensaje'][l])
        seq=['Posteo',str(M1['event_id_no'][l]),'Limpieza',str(basura)]
        text_to_log=ejc.concat_espacesep(seq)
#        print(text_to_log)
        try:
            ejc.escribe_log(text_to_log)
        except Exception as msg:
            ejc.escribe_log(ejc.concat_espacesep(str([M1['event_id_no'][l],msg])))
            print(ejc.concat_espacesep([M1['event_id_no'][l],msg]))
        M1Mensaje+=[auxiliar.strip(' ').strip('\n').strip('\t')]
        M1Mensaje_sucio+=[M1['Mensaje'][l]]
    M1['Mensaje_original']=M1Mensaje_sucio
    M1['Mensaje']=M1Mensaje
    M2=M1[M1['Sentimiento_x']!=M1['Sentimiento_y']]
    id=[]
    MSG=[]
    Sent1=[]
    Sent2=[]
#    SE CREA EL DATAFRAME CON LAS FRASES QUE TIENEN LAS PALABRAS MODIFICADAS EN EL DICCIONARIO1
    pals_mod=['hermosa','hermosamente','hermosura','divercion','diverción','diversion','diversión','divertida','divertidas','divertido','divertidos','divertimos','divertir','favorita','favoritas','favorito','favoritos','exito','éxito','exitos','exitosa','exitosas','exitoso','exitosos','feliz']
    for k in M1.index:
        cnter=0
        for i in pals_mod:
            if cnter == 0:
                if ' '+str(i)+' ' in M1['Mensaje'][k]:
                    id+=[M1['event_id_no'][k]]
                    MSG+=[M1['Mensaje'][k]]
                    Sent1+=[M1['Sentimiento_x'][k]]
                    Sent2+=[M1['Sentimiento_y'][k]]
                    cnter=cnter+1
                else:
                    pass
    dict_pals_mod={
                    'id':id,
                    'MSG':MSG,
                    'Sent1':Sent1,
                    'Sent2':Sent2
                   }
    df_pals_mod=pd.DataFrame(dict_pals_mod)#.drop_duplicates()
    end=time.strftime("%H:%M:%S")
    print(' reproceso_delimitacion()','Inicio:  ',start,'Fin:  ',end)
    seq=['reproceso_delimitacion()','Inicio:',start,'Fin:',end]
    text_to_log=ejc.concat_espacesep(seq)
    ejc.escribe_log(text_to_log)
    return(DF_Ref,DF_Reproc,M1,M2,df_pals_mod)
def Construit_M1(DF_Ref,DF_Reproc):
    ext1=DF_Ref[['event_id_no','Mensaje','Sentimiento']]
    ext2=DF_Reproc[['event_id_no','Sentimiento']]
    M1=pd.merge(ext1,ext2,on='event_id_no',how='inner')
    M1Mensaje=[]
    M1Mensaje_sucio=[]
    for l in M1.index:
        basura,auxiliar=limp.replacing_substrings(M1['Mensaje'][l])
        seq=['Posteo',str(M1['event_id_no'][l]),'Limpieza',str(basura)]
        text_to_log=ejc.concat_espacesep(seq)
#        print(text_to_log)
        try:
            ejc.escribe_log(text_to_log)
        except Exception as msg:
            ejc.escribe_log(ejc.concat_espacesep(str([M1['event_id_no'][l],msg])))
            print(ejc.concat_espacesep([M1['event_id_no'][l],msg]))
        M1Mensaje+=[auxiliar.strip(' ').strip('\n').strip('\t')]
        M1Mensaje_sucio+=[M1['Mensaje'][l]]
    M1['Mensaje_original']=M1Mensaje_sucio
    M1['Mensaje']=M1Mensaje
    return(M1)
Exemplo n.º 3
0
def agregar_colm_resultado(MPrecalculo):
    start=time.strftime("%H:%M:%S")
    result_colm=[]
    for i in MPrecalculo.index:
        result_colm+=[calulo_x_pals(MPrecalculo['sent'][i],MPrecalculo['posIni'][i],MPrecalculo['rango_symbols_ini'][i],MPrecalculo['rango_symbols_fin'][i],MPrecalculo['valor_intens'][i],MPrecalculo['posFin_intens'][i])]
    MPrecalculo['result_colm']=result_colm
    end=time.strftime("%H:%M:%S")
    print(' agregar_colm_resultado()','Inicio:  ',start,'Fin:  ',end)
    seq=['agregar_colm_resultado()','Inicio:',start,'Fin:',end]
    text_to_log=ejc.concat_espacesep(seq)
    ejc.escribe_log(text_to_log)
    return(MPrecalculo)
def WExcel_Wpd(DFrame_list,Names_DFrame_list,Path,FName):
    start=time.strftime("%H:%M:%S")
    band=0
    writer=pd.ExcelWriter(Path+os.sep+FName+'.xlsx',engine='xlsxwriter')
    for i in DFrame_list:
        i.to_excel(writer,sheet_name=Names_DFrame_list[band],index=False)
        band=band+1
    writer.save()
    end=time.strftime("%H:%M:%S")
    print('WExcel_Wpd()','Inicio:  ',start,'Fin:  ',end)
    seq=['WExcel_Wpd()','Inicio:',start,'Fin:',end]
    text_to_log=ejc.concat_espacesep(seq)
    ejc.escribe_log(text_to_log)
def DataFrame_pals_sentimiento(df_pals_mod,General):
    start=time.strftime("%H:%M:%S")
    DaFr=pd.DataFrame()
    for pr in df_pals_mod.index:
        if pr == 0:
            DaFr=recorre_general(General,df_pals_mod['MSG'][pr],df_pals_mod['id'][pr])
        else:
            DaFr=DaFr.append(recorre_general(General,df_pals_mod['MSG'][pr],df_pals_mod['id'][pr]),ignore_index=True)
    end=time.strftime("%H:%M:%S")
    print(' DataFrame_pals_sentimiento()','Inicio:  ',start,'Fin:  ',end)
    seq=['DataFrame_pals_sentimiento()','Inicio:',start,'Fin:',end]
    text_to_log=ejc.concat_espacesep(seq)
    ejc.escribe_log(text_to_log)
    return(DaFr)
def Build_DaFr_symbols(df_pals_mod):
    start=time.strftime("%H:%M:%S")
    adm=pd.DataFrame()
    point=pd.DataFrame()
    for i in df_pals_mod.index:
        if i == 0:
            adm=multiplicador_adm(df_pals_mod['MSG'][i],df_pals_mod['id'][i])
            point=dat_finding(df_pals_mod['MSG'][i],df_pals_mod['id'][i])
        else:
            adm=adm.append(multiplicador_adm(df_pals_mod['MSG'][i],df_pals_mod['id'][i]),ignore_index=True) 
            point=point.append(dat_finding(df_pals_mod['MSG'][i],df_pals_mod['id'][i]),ignore_index=True)
    merg=pd.merge(point,adm,on='event_id',how='outer')
    end=time.strftime("%H:%M:%S")
    print('Build_DaFr_symbols()','Inicio:  ',start,'Fin:  ',end)
    seq=['Build_DaFr_symbols()','Inicio:',start,'Fin:',end]
    text_to_log=ejc.concat_espacesep(seq)
    ejc.escribe_log(text_to_log)
    return(merg)
def importa_General():
    start=time.strftime("%H:%M:%S")
    path='''C:\\Users\\AAREYESC\\Documents\\GitHub\\analisis-sentimiento\\user\\salience\\sentiment'''
    nfile='general.hsd'
    General=pd.read_csv(path+os.sep+nfile,sep='\t',encoding='latin_1',header=None,names=['palabra','sentimiento'])
    palabra=['exitosas','exitoso','exitosos']
    sentimiento=[0.7,0.7,0.7]
    df_aux={
    'palabra':palabra,
    'sentimiento':sentimiento
    }
    df=pd.DataFrame(df_aux)
    General=General.append(df,ignore_index=True)
    end=time.strftime("%H:%M:%S")
    print(' importa_General()','Inicio:  ',start,'Fin:  ',end)
    seq=['importa_General()','Inicio:',start,'Fin:',end]
    text_to_log=ejc.concat_espacesep(seq)
    ejc.escribe_log(text_to_log)
    return(General)
Exemplo n.º 8
0
def finding_ranges_symbols(DaFr_symbols):
    start=time.strftime("%H:%M:%S")
    ids=[]
    rango_symbols_ini=[]
    rango_symbols_fin=[]
    for i in DaFr_symbols.index:
        a,b,c=ranges_symbols(DaFr_symbols['event_id'][i],DaFr_symbols['Posiciones_adm'][i],DaFr_symbols['Posiciones_point'][i],DaFr_symbols['Cantidad_adm'][i],DaFr_symbols['Cantidad_points'][i])
        ids+=[a]
        rango_symbols_ini+=[b]
        rango_symbols_fin+=[c]
    df_aux={
            'ids':ids,
            'rango_symbols_ini':rango_symbols_ini,
            'rango_symbols_fin':rango_symbols_fin
            }
    df_aux=pd.DataFrame(df_aux)
    DaFr_symbols=pd.merge(DaFr_symbols,df_aux,left_on='event_id',right_on='ids',how='left')
    end=time.strftime("%H:%M:%S")
    print(' finding_ranges_symbols()','Inicio:  ',start,'Fin:  ',end)
    seq=['finding_ranges_symbols()','Inicio:',start,'Fin:',end]
    text_to_log=ejc.concat_espacesep(seq)
    ejc.escribe_log(text_to_log)
    return(DaFr_symbols[['event_id','Signo_x','Cantidad_points','Posiciones_point','Signo_y','Cantidad_adm','Posiciones_adm','rango_symbols_ini','rango_symbols_fin']])