Esempi in Python per Graph.build_graph

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: utils.graph

Classe/tipologia: Graph

Metodo/funzione: build_graph

Esempi su hotexamples.com: 2

Graph.build_graph in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per utils.graph.Graph.build_graph, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Graph(30)

add_edge(30)

add_node(19)

dfs(8)

change_graph_representation_to(6)

match_fragment(5)

add_vertex(3)

exhaustive_plan(3)

as_rdf(2)

build_graph(2)

graph_vector_features(2)

node_get(1)

node(1)

nodes(1)

load_from_data(1)

last6(1)

last5(1)

last4(1)

last3(1)

last2(1)

last1(1)

insert_node(1)

inputs(1)

inputSize(1)

add_connection_weights_from_matrix(1)

graph_representation(1)

clear(1)

addEdges(1)

add_point(1)

all_predecessors(1)

build(1)

cachedtimeValue(1)

change_to_adjacency_matrix(1)

color_nodes(1)

getVertice(1)

copy(1)

create_graph_from_maze(1)

dag_id(1)

_draw_debug_image(1)

edge(1)

addVertice(1)

num_edges(1)

Esempio n. 1

Mostra file

File: prepare_data.py Progetto: YDaiLab/PopPhy-CNN

def prepare_data(path, config):

    thresh = config.get('Evaluation', 'FilterThresh')
    data = pd.read_csv(path + '/abundance.tsv',
                       index_col=0,
                       sep='\t',
                       header=None)
    labels = np.genfromtxt(path + '/labels.txt', dtype=np.str_, delimiter=',')
    core_filt_thresh = float(thresh)
    opp_filt_thresh = 0.0

    data = data.transpose()

    sums = data.sum(axis=1)
    data = data.divide(sums, axis=0)
    labels, label_set = pd.factorize(labels)

    pos_set = data.iloc[np.where(labels == 1)]
    neg_set = data.iloc[np.where(labels == 0)]

    core = filter_data(data, labels, core_filt_thresh, opp_filt_thresh)

    data = core

    features = list(data.columns.values)
    print("There are %d raw features..." % (len(features)))
    features_df = get_feature_df(features)

    print("Building tree structure...")
    try:
        g = pickle.load(
            open(path + "/PopPhy-tree-" + str(core_filt_thresh) + "-core.pkl",
                 'rb'))
        print("Found tree file...")
    except:
        print("Tree file not found...")
        print("Contsructing tree..")
        g = Graph()
        g.build_graph()
        g.prune_graph(features_df)
        pickle.dump(
            g,
            open(path + "/PopPhy-tree-" + str(core_filt_thresh) + "-core.pkl",
                 'wb'))

    print("Populating trees...")
    results = Parallel(n_jobs=num_cores)(
        delayed(generate_maps)(x, g, features_df) for x in data.values)
    my_maps = np.array(np.take(results, 1, 1).tolist())
    counts = np.count_nonzero(my_maps, axis=0)

    my_benchmark = np.array(np.take(results, 0, 1).tolist())
    my_benchmark_tree = np.array(np.take(results, 2, 1).tolist())

    tree_features = g.graph_vector_features()

    my_benchmark_df = pd.DataFrame(index=tree_features,
                                   data=np.transpose(my_benchmark_tree))
    my_benchmark_df = my_benchmark_df.groupby(my_benchmark_df.index).mean()

    tree_features = my_benchmark_df.index
    my_benchmark_tree = np.transpose(my_benchmark_df.values)

    num_tree_features = len(tree_features)
    print("There are %d tree features..." % (num_tree_features))
    return my_maps, my_benchmark, my_benchmark_tree, features, tree_features, labels, label_set, g, features_df

Esempio n. 2

Mostra file

def prepare_data(path, config, k, m):
    # def prepare_data ( path , config):

    thresh = config.get('Evaluation', 'FilterThresh')
    data = pd.read_csv(path + '/pois_t2d_trainabun_1+1.tsv',
                       index_col=0,
                       sep='\t',
                       header=None)
    #542行(微生物)，232列（样本），第一列为名称，后为数据，
    labels = np.genfromtxt(path + '/pois_t2d_trainlabel_1+1.txt',
                           dtype=np.str_,
                           delimiter=',')
    #一行，232列，依次记录"n"和"Cirrhosis"
    core_filt_thresh = float(thresh)
    opp_filt_thresh = 0.0

    data = data.transpose()
    #此时542列微生物特征和232行样本

    sums = data.sum(axis=1)
    #232个样本，每个样本的各类微生物之和，均为100
    data = data.divide(sums, axis=0)
    #
    labels, label_set = pd.factorize(labels)
    #label_set=['n','Cirrhosis']
    #labels:一行，前114个为0，后118个为1

    pos_set = data.iloc[np.where(labels == 1)]
    #118行，

    neg_set = data.iloc[np.where(labels == 0)]
    #114行

    core = filter_data(data, labels, core_filt_thresh, opp_filt_thresh)
    #可能是过滤数据或者是打乱数据顺序，原本232个样本，542个微生物特征，经过filter以后为232个样本，269个微生物特征
    data = core

    features = list(data.columns.values)
    print("There are %d raw features..." % (len(features)))
    features_df = get_feature_df(features)
    #每一种微生物名字剥离出来，分门别类，比如一行知道他是哪个界，哪个门，这样排序，成一个表。
    #看做微生物名字表：每一行都是一种具体微生物（即特征）所属的界、门、科、目、纲、属、种

    print("Building tree structure...")
    try:
        g = pickle.load(
            open(path + "/PopPhy-tree-" + str(core_filt_thresh) + "-core.pkl",
                 'rb'))
        print("Found tree file...")
    except:
        print("Tree file not found...")
        print("Contsructing tree..")
        g = Graph()
        g.build_graph()
        g.prune_graph(features_df)
        #build_graph为根据很多括号的通用树文件建立的树
        #而features_df为单一数据集中出现的微生物特征，根据当前数据集实际微生物特征修剪通用的进化树。
        g.removeRepeatName()
        g.routeToRoot()

        # pickle.dump(g, open(path + "/PopPhy-tree-" + str(core_filt_thresh) + "-core.pkl", 'wb'))
        # pickle.dump保存

    print("Populating trees...")
    results = Parallel(n_jobs=num_cores)(
        delayed(generate_maps)(x, g, features_df, k, m) for x in data.values)
    # results = Parallel ( n_jobs=num_cores ) (delayed ( generate_maps ) ( x , g , features_df ,) for x in data.values )
    # data.values 是232行,每一行一个样本。269列，每一列一个微生物特征的纯数据，不带名字
    #x 为data从第一行即第一个样本遍历到最后一行最后一个样本，再把第一行转置。即一个269个元素的列，代表一个样本
    my_maps = np.array(np.take(results, 1, 1).tolist())
    counts = np.count_nonzero(my_maps, axis=0)

    my_benchmark = np.array(np.take(results, 0, 1).tolist())
    my_benchmark_tree = np.array(np.take(results, 2, 1).tolist())

    tree_features = g.graph_vector_features()

    my_benchmark_df = pd.DataFrame(index=tree_features,
                                   data=np.transpose(my_benchmark_tree))
    my_benchmark_df = my_benchmark_df.groupby(my_benchmark_df.index).mean()

    tree_features = my_benchmark_df.index
    my_benchmark_tree = np.transpose(my_benchmark_df.values)

    num_tree_features = len(tree_features)
    print("There are %d tree features..." % (num_tree_features))
    return my_maps, my_benchmark, my_benchmark_tree, features, tree_features, labels, label_set, g, features_df