Python MinHash.form_jaccard_count_matrix示例

编程语言: Python

类/类型: MinHash

方法/功能: form_jaccard_count_matrix

hotexamples.com的示例: 2

Python MinHash.form_jaccard_count_matrix - 已找到2个示例。这些是从开源项目中提取的最受好评的MinHash.form_jaccard_count_matrix 来自程序包 libtwiddle现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

CountEstimator(6)

compute_multiple(2)

export_multiple_to_single_hdf5(2)

CompositionSketch(1)

align_reads(1)

build_reference(1)

build_references(1)

cluster_matrix(1)

export_multiple_hdf5(1)

form_jaccard_count_matrix(1)

示例#1

显示文件

文件： MockCommunity.py 项目： sarajmunjal/MinHashMetagenomics

import os, timeit, h5py
import MinHash as MH
import numpy as np
import logging
fid = open('/nfs1/Koslicki_Lab/koslickd/MinHash/Data/FileNames.txt', 'r')
file_names = fid.readlines()
fid.close()
file_names = [name.strip() for name in file_names]
training_n = 50000
out_file_names = [
    "/nfs1/Koslicki_Lab/koslickd/MinHash/Out/N" + str(training_n) + "k31/" +
    os.path.basename(item) + ".CE.h5" for item in file_names
]
CEs = MH.import_multiple_hdf5(out_file_names)

A = MH.form_jaccard_count_matrix(
    CEs)  #NOTE!!! I only need to form this for the indicies where Y[i] > 0

################################
# Test the lsqnonneg stuff
# NOTE: It's probably best to precompute the A matrices, then use plain MH.lsqnonneg()
# Read in all the saved hashes
import sys, os
sys.path.append(
    '/nfs1/Koslicki_Lab/koslickd/Repositories/MinHashMetagenomics/src/')
import MinHash as MH
import numpy as np
fid = open('/nfs1/Koslicki_Lab/koslickd/MinHash/Data/FileNames.txt', 'r')
file_names = fid.readlines()
fid.close()
file_names = [name.strip() for name in file_names]
training_n = 5000

示例#2

显示文件

文件： MockCommunity.py 项目： dkoslicki/MinHashMetagenomics

import sys
sys.path.append('/nfs1/Koslicki_Lab/koslickd/Repositories/MinHashMetagenomics/src/')
import os, timeit, h5py
import MinHash as MH
import numpy as np
import logging
fid = open('/nfs1/Koslicki_Lab/koslickd/MinHash/Data/FileNames.txt', 'r')
file_names = fid.readlines()
fid.close()
file_names = [name.strip() for name in file_names]
training_n = 50000
out_file_names = ["/nfs1/Koslicki_Lab/koslickd/MinHash/Out/N"+str(training_n)+"k31/" + os.path.basename(item) + ".CE.h5" for item in file_names]
CEs = MH.import_multiple_hdf5(out_file_names)

A = MH.form_jaccard_count_matrix(CEs)  #NOTE!!! I only need to form this for the indicies where Y[i] > 0


################################
# Test the lsqnonneg stuff
# NOTE: It's probably best to precompute the A matrices, then use plain MH.lsqnonneg()
# Read in all the saved hashes
import sys, os
sys.path.append('/nfs1/Koslicki_Lab/koslickd/Repositories/MinHashMetagenomics/src/')
import MinHash as MH
import numpy as np
fid = open('/nfs1/Koslicki_Lab/koslickd/MinHash/Data/FileNames.txt', 'r')
file_names = fid.readlines()
fid.close()
file_names = [name.strip() for name in file_names]
training_n = 5000