Ejemplos de ReadFile.creat_corpus_city_dictionary en Python

Lenguaje de programación: Python

Clase / Tipo: ReadFile

Método / Función: creat_corpus_city_dictionary

Ejemplos en hotexamples.com: 1

Python ReadFile.creat_corpus_city_dictionary - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de ReadFile.creat_corpus_city_dictionary de paquete python36patterns extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

ReadFile(16)

get_inventory_types(9)

QAData(5)

ReadExpectFile(4)

file_reading_gen(4)

ReadConfiguration(3)

delete_note_in_numberFile(2)

read_caps(2)

AlgebraFile(2)

get_option(2)

SPARKreadFile(2)

ReadAgents(2)

Read_JPG(2)

ReadRealFlie(2)

creat_world_city_dictionary(1)

doSomething(1)

ATractableSubsetsFile(1)

filesize(1)

get_init_inv_vals(1)

check_pass(1)

get_mins(1)

readFileForKMean(1)

read_decrement(1)

read_times(1)

creat_corpus_city_dictionary(1)

Tecplot(1)

check_login(1)

__reset(1)

Vtk(1)

UserRatingMatrix(1)

ReadLocations(1)

ReadInteractions(1)

ReadFromFile(1)

ReadFilesList(1)

ReadEvents(1)

Read(1)

InputOutput(1)

InputControl(1)

GetListUSerTest(1)

GetData(1)

CSVtoDictConverter(1)

writeToKMeaFile(1)

Ejemplo n.º 1

Mostrar archivo

def start_read(corpus_path, posting_path, term_dictionary, stemmer):
    Parse.set_stop_words_file(corpus_path + "/stop_words.txt")
    Parse.copy_stop_words_file(corpus_path + "/stop_words.txt", posting_path + "/stop_words.txt")
    directory_corpus = os.fsdecode(corpus_path)
    sub_dir_list = os.listdir(directory_corpus)
    size = int((len(sub_dir_list)-1) / 10)  # read the corpus in 11 parts
    if size == 0:
        size = 10
    idx = 1
    counter = 1
    ReadFile.__reset()
    ReadFile.creat_world_city_dictionary()
    for dir in sub_dir_list:
        if not dir == "stop_words.txt":
            ReadFile.creat_corpus_city_dictionary(corpus_path, dir)
    corpus_city_dictionary = {}
    city_dic = ReadFile.corpus_city_dictionary
    city_list = sorted(city_dic)
    for key in city_list:
        corpus_city_dictionary[key] = [city_dic[key], {}]
    ReadFile.__reset()
    sub_dir_list = os.listdir(directory_corpus)
    for dir in sub_dir_list:
        if not dir == "stop_words.txt":
            if counter % size == 0:
                docDict = ReadFile.docDictionary
                Parse.parse_docs({}, term_dictionary, corpus_city_dictionary, ReadFile.textDic, docDict, idx, stemmer, posting_path)
                time = datetime.datetime.now()
                ReadFile.__reset()
                idx += 1
            ReadFile.split_doc(corpus_path, dir)
            counter += 1
    if not counter % size == 0:
        Parse.parse_docs({}, term_dictionary, corpus_city_dictionary, ReadFile.textDic, ReadFile.docDictionary, idx, stemmer, posting_path)
        ReadFile.__reset()
    if stemmer:
        file = open(posting_path + "/city_dictionary_stemmer" + ".pkl", "wb+")
    else:
        file = open(posting_path + "/city_dictionary" + ".pkl", "wb+")
    pickle.dump(corpus_city_dictionary, file, pickle.HIGHEST_PROTOCOL)
    file.close()
    return idx