Python FileUtils.get_reqd_fileset 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: utils

클래스/타입: FileUtils

메소드/함수: get_reqd_fileset

hotexamples.com에서의 예제들: 2

Python FileUtils.get_reqd_fileset - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 utils.FileUtils.get_reqd_fileset에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

input(10)

doCopy(9)

delFile(8)

rename(6)

getfile(6)

get_file(5)

FileUtils(5)

make_dirs(4)

write_to_file(3)

get_file_name(3)

to_ENML(3)

remove_dirs(3)

list_top_folders_names(3)

list_top_files_names(3)

join(3)

int_input(3)

savaToPng(2)

read_from_file(2)

make_dir(2)

is_file(2)

get_reqd_fileset(2)

get_plan_from_file(2)

joinPath(2)

exists(2)

get_empty_file(2)

get_content_from_data(2)

screen_shot_dir(1)

removeFile(1)

exist_file_folder(1)

cache_dir(1)

download(1)

saveBinary(1)

get_files(1)

create_file(1)

read_excel_file(1)

transformations(1)

update_files_list(1)

writePlanToFile(1)

writeProblemToFile(1)

write_series2file(1)

transformation_v1_to_v2(1)

random_path(1)

read(1)

delete_file(1)

get_observed_data_filename(1)

copy(1)

configureWrite(1)

add_to_pickle(1)

getNumerosFromFile(1)

getDataset(1)

예제 #1

파일 보기

ontoLabels = pd.read_csv(final_folder + "util_files/ontology_labels.tsv",
                         sep="\t").set_index("index")
ontoLabels = ontoLabels.to_dict(orient="index")
print("Ontology Labels", len(ontoLabels))

old_dset_mappings = pd.read_csv(final_folder +
                                "util_files/old_dataset_mappings.tsv",
                                sep="\t").set_index("index")
old_dset_mappings = old_dset_mappings.to_dict(orient="index")
for k in old_dset_mappings:
    old_dset_mappings[k] = old_dset_mappings[k]['0']
old_dset_mappings[''] = ''
print("Old Dataset Mappings", len(old_dset_mappings))

class_list_folder = final_folder + "class_lists/"
class_set_files = fu.get_reqd_fileset(
    class_list_folder, lambda x: False if "classlist" in x.lower() else True)
class_sets = {}
ccount = 0
for k in class_set_files:
    a = mfio.load_matrix(class_list_folder + k)
    for m in a:
        if not m in class_sets:
            class_sets[m] = {"files": [], "instance_count": []}
        class_sets[m]["files"].append(k)
        class_sets[m]["instance_count"].append(a[m])
        ccount += 1

print("Total Class Count", ccount)
print("Unique Class Count", len(class_sets))
for k in class_sets:
    a, b = det_dset(

예제 #2

파일 보기

파일: ontovectorgenerator.py 프로젝트: protegeteam/string-clustering

    idfs = open(idf_file)
    idf_lines = idfs.readlines()
    idfs.close()
    for k in range(len(idf_lines)):
        if k == 0: continue
        idf_parts = idf_lines[k].strip().split()
        term = str(idf_parts[0])
        vocab_dict[term]["idf"] = float(idf_parts[1])
    vocab_dict["<unk>"]["idf"] = UNMAPPED_IDF_CONST


word_vecs = load_word_vectors(vector_file)
load_vocab(vocab_file)
load_idfs(idf_file)
print len(vocab_dict), word_vecs.shape

fu = FileUtils()
onto_folder = "bioontologies/"
vec_folder = "onto_vectors_skospref/"
unmapped_folder = "unmapped/"
mfio = MatrixIO()
all_onto_files = fu.get_reqd_fileset(onto_folder, lambda x: False
                                     if ".json" in x else True)
for k in all_onto_files:
    print "starting " + k
    onto_embeddings, all_unmapped = generate_onto_vectors(onto_folder + k)
    np.save(vec_folder + k, onto_embeddings)
    mfio.save_matrix(all_unmapped, unmapped_folder + k + ".dict")
# In[211]:
#onto_file = "meddra.ttl.json"