Python import_data 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: gather_data

메소드/함수: import_data

hotexamples.com에서의 예제들: 2

Python import_data - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 gather_data.import_data에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: word2vec.py 프로젝트: youyanggu/adulteration

def get_most_similar_restricted(limit=120):
    df, df_i = import_data()
    counts = df_i['ingredient'].value_counts()
    ings = counts.index.values

    found_ings, embeddings = retrieve_embeddings(model, ings)
    #found_ings, embeddings = np.load('word2vec_embeddings.npy')
    ranks = get_nearest_neighbors(embeddings)
    print_nearest_neighbors(ings[:limit], found_ings, ranks)
    highest_ranks, avg_rankings, random_avg_rankings = calc_score(ranks, limit, 
        print_scores=False, score_path='../model/scores.csv')

    indices = found_ings[found_ings<highest_ranks.shape[0]]
    highest_ranks = highest_ranks[indices]
    avg_rankings = avg_rankings[indices]
    random_avg_rankings = random_avg_rankings[indices]
    print (highest_ranks<=3).sum(dtype=float) / np.isfinite(highest_ranks).sum()
    print highest_ranks[np.isfinite(highest_ranks)].mean()
    print avg_rankings[np.isfinite(avg_rankings)].mean()
    print random_avg_rankings[np.isfinite(random_avg_rankings)].mean()

예제 #2

파일 보기

파일: combined.py 프로젝트: youyanggu/adulteration

def main():
    mapping = pd.read_csv('../rasff/rasff_mapping.csv')
    d = {a : b for a,b in zip(mapping.category.values, mapping.shelf.values)}
    df_ = rasff.load_df()
    df_['category_'] = df_['category'].replace(d)
    df_['chemical_'] = [clean_chemical(c) for c in df_['chemical'].values]
    df, df_i = gather_data.import_data()
    counts = df_i['ingredient'].value_counts()
    ings = counts.index.values
    chemicals = [i for i in df_['chemical_'].unique() if i] # remove empty string
    found_chems, d_c = search_chemicals(counts, chemicals)
    unknown_chems = [c for c in chemicals if c not in found_chems]

    chemical_counts = df_.groupby('chemical_').size().sort_values()[::-1]
    category_counts = df_.groupby('category_').size().sort_values()[::-1]
    
    pairs = df_.groupby(['chemical_', 'product']).size().sort_values()[::-1]
    print 'Number of entries  :', len(df_)
    print 'Unique entries     :', len(pairs)
    print 'Unique adulterants :', len(df_['chemical_'].unique())
    print 'Unique products    :', len(df_['product'].unique())
    print 'Unique categories  :', len(df_['category'].unique())