Python load_treated_csv_to_numpy 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: dm.tp1.tcu_io

메소드/함수: load_treated_csv_to_numpy

hotexamples.com에서의 예제들: 2

Python load_treated_csv_to_numpy - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 dm.tp1.tcu_io.load_treated_csv_to_numpy에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: test_io.py 프로젝트: flaviovdf/data-mining

    def test_load_treated(self):
        data = tcu_io.load_treated_csv_to_numpy(TREATED_TCU_FILE)
        self.assertEquals(29202, len(data))

        names = ('Cluster', 'ChavePregao', 'UASG', 'PregoeiroOficial',
                 'AceitoPara_CNPJ', 'PeloMenorLance', 'ValorReferencia', 
                 'GanhoPregao', 'SuperFaturamento')

        for column_name in names:
            self.assertEquals(len(data[column_name]), 29202)

예제 #2

파일 보기

파일: correlate_data.py 프로젝트: flaviovdf/data-mining

def main(tcu_fpath):
    data = tcu_io.load_treated_csv_to_numpy(tcu_fpath)
    print(stats.pearsonr(data['ValorReferencia'], data['PeloMenorLance']))
    print(stats.pearsonr(data['ValorReferencia'], data['GanhoPregao']))
    print(stats.pearsonr(data['GanhoPregao'], data['PeloMenorLance']))
    
    to_corr_cat = [('SuperFaturamento', 'PregoeiroOficial'),
                   ('SuperFaturamento', 'AceitoPara_CNPJ'),
                   ('SuperFaturamento', 'Cluster')]
    
    for pair in to_corr_cat:
        row = pair[0]
        col = pair[1]
        
        vals_row = set(data[row])
        vals_col = set(data[col])
        
        n_rows = len(vals_row)
        n_cols = len(vals_col)
        
        #Creating table
        contingency_table = np.ndarray(shape=(n_rows, n_cols), dtype='i')
        for i, possible_row in enumerate(vals_row):
            for j, possible_col in enumerate(vals_col):
                #Create boolean arrays with lines that contain the values
                with_both = \
                    (data[row] == possible_row) & (data[col] == possible_col) 
                num_occur = with_both.sum()
                
                contingency_table[i, j] = num_occur
        
        print('Correlating %s', pair)
        chi2, p, dof, e =  contingency.chi2_contingency(contingency_table)
        
        print('Correlation', pair, ': chi2 = %f; p = %f; df = %f;' \
              %(chi2, p, dof))