Python find_correlation 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: correlation

메소드/함수: find_correlation

hotexamples.com에서의 예제들: 3

Python find_correlation - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 correlation.find_correlation에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def main():
    relieff_file = open(RELIEFF_FILENAME, "r")
    relieff_features = parse_relieff_list(relieff_file.readlines())
    relieff_features.sort(key=lambda x: x[0], reverse=True)

    results, features, feature_names = read_data(FEATURE_FILENAME)

    #features = np.hstack((features, results.reshape((len(results), 1))))

    correlations = find_correlation(features)
    #print("\n".join("{}: {}".format(x, correlations[x]) for x in correlations))
    #return

    for threshold in frange(1.0, 0.0, -0.1):
        selected = select_features(features, relieff_features, correlations,
                                   threshold)

        print("============================================================")
        print("THRESHOLD =", threshold)
        print("Count:", len(selected))
        print("\n".join(
            ["{} ({})".format(x, feature_names[x]) for x in selected]))

        print()
        print()
        print()

예제 #2

파일 보기

def main():
    name, fmt = correlation.parse_options(argv)
    results, features, feature_names = correlation.read_data(name, fmt)

    features = N.hstack((features, results.reshape((len(results), 1))))

    correlations = correlation.find_correlation(features)

    g = nx.Graph()

    #g.add_nodes_from(range(len(results) + 1))

    threshold = 0.8

    for (f1, f2) in [c for c in correlations.keys() if correlations[c][0] > threshold]:
        g.add_edge(f1, f2)

    cliques = sorted(nx.find_cliques(g), key=len, reverse=True)
    cliques = [c for c in cliques if len(c) >= 3]

    print("=====CLIQUES=====")
    for clique in cliques:
        print()
        print("Clique, length:", len(clique))
        for node in sorted(clique):
            print("{:>3} ({})".format(node, feature_names[node]))

    print()
    print()
    print("=====CLIQUE COUNT=====")
    print()
    cliquecount = {}
    for clique in cliques:
        for node in clique:
            cliquecount[node] = cliquecount.get(node, 0) + 1
    cliquesizelist = [(c, cliquecount[c]) for c in sorted(cliquecount, key=lambda x: (cliquecount.get(x), -1 * x), reverse=True)]
    for c in cliquesizelist: print("{:>3}: {:>3} ({})".format(c[1], c[0], feature_names[c[0]]))

예제 #3

파일 보기

파일: featureselection.py 프로젝트: benjamingeiger/feature-correlation

def main():
    relieff_file = open(RELIEFF_FILENAME, "r")
    relieff_features = parse_relieff_list(relieff_file.readlines())
    relieff_features.sort(key=lambda x: x[0], reverse=True)

    results, features, feature_names = read_data(FEATURE_FILENAME)

    #features = np.hstack((features, results.reshape((len(results), 1))))

    correlations = find_correlation(features)
    #print("\n".join("{}: {}".format(x, correlations[x]) for x in correlations))
    #return

    for threshold in frange(1.0, 0.0, -0.1):
        selected = select_features(features, relieff_features, correlations, threshold)

        print("============================================================")
        print("THRESHOLD =", threshold)
        print("Count:", len(selected))
        print("\n".join(["{} ({})".format(x, feature_names[x]) for x in selected]))

        print()
        print()
        print()