Ejemplos de Corpus.fit en Python

Lenguaje de programación: Python

Namespace/Package Name: corpus

Clase / Tipo: Corpus

Método / Función: fit

Ejemplos en hotexamples.com: 3

Python Corpus.fit - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de corpus.Corpus.fit extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Corpus(30)

emails(15)

__init__(13)

save_to_file(4)

add_extra_info(4)

buildCorpusOnDB(3)

concetenate_corpus(3)

connect_to(3)

add_instance(3)

accuracy_corpus(3)

pop_instance(3)

emails_as_string(2)

convert_dictionary_to_words2vec(2)

construir_corpus(2)

construct_SentencesAndSPerItem(2)

construct_QAnswersAndQPerItem(2)

fit_features(2)

epoch_flag(2)

generate_batch_from_file(2)

export(2)

calculate_primary_targets(2)

Calculate_PairWiseFeature(2)

getTweets(2)

add_file(2)

add(2)

get_sentences(2)

add_document(2)

fit(2)

fill(1)

negativeWordDict(1)

representations(1)

read(1)

fit_dictionary(1)

query_by_id(1)

fit_matrix(1)

freeze(1)

positiveWordDict(1)

parse_xml(1)

getNumericDictionary(1)

from_config(1)

from_dict(1)

loadVocabulary(1)

generate_corpus_from_graph_using_random_walk(1)

instances(1)

getNumOfSampleDocs(1)

getRanges(1)

full_targets(1)

gaussian_model(1)

getAttributeVal(1)

gen_batch(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: example.py Proyecto: minhpqn/glove-python

                        help='Get closes words to this word.')
    args = parser.parse_args()


    if args.create:
        # Build the corpus dictionary and the cooccurrence matrix.
        print 'Pre-processing corpus'

        if args.wiki:
            print 'Using wikipedia corpus'
            get_data = read_wikipedia_corpus
        else:
            get_data = read_corpus

        corpus_model = Corpus()
        corpus_model.fit(get_data(args.create), window=10)
        corpus_model.save('corpus.model')
        
        print 'Dict size: %s' % len(corpus_model.dictionary)
        print 'Collocations: %s' % corpus_model.matrix.nnz

    if args.train:
        # Train the GloVe model and save it to disk.

        if not args.create:
            # Try to load a corpus from disk.
            print 'Reading corpus statistics'
            corpus_model = Corpus.load('corpus.model')

            print 'Dict size: %s' % len(corpus_model.dictionary)
            print 'Collocations: %s' % corpus_model.matrix.nnz

Ejemplo n.º 2

Mostrar archivo

                        default='',
                        help='Get closes words to this word.')
    args = parser.parse_args()

    if args.create:
        # Build the corpus dictionary and the cooccurrence matrix.
        print 'Pre-processing corpus'

        if args.wiki:
            print 'Using wikipedia corpus'
            get_data = read_wikipedia_corpus
        else:
            get_data = read_corpus

        corpus_model = Corpus()
        corpus_model.fit(get_data(args.create), window=10)
        corpus_model.save('corpus.model')

        print 'Dict size: %s' % len(corpus_model.dictionary)
        print 'Collocations: %s' % corpus_model.matrix.nnz

    if args.train:
        # Train the GloVe model and save it to disk.

        if not args.create:
            # Try to load a corpus from disk.
            print 'Reading corpus statistics'
            corpus_model = Corpus.load('corpus.model')

            print 'Dict size: %s' % len(corpus_model.dictionary)
            print 'Collocations: %s' % corpus_model.matrix.nnz

Ejemplo n.º 3

Mostrar archivo

Archivo: tf_main.py Proyecto: tracy-talent/research

    with open('../../output/vocabs_100.txt', 'r') as vbf:
        for line in vbf.readlines():
            vocab.append(line.strip())

    # 建立词典，统计共现矩阵
    dictionary = {}
    for i, word in enumerate(vocab):
        dictionary[word] = i
    corpus = []
    with open('../../input/wiki.500.txt', 'r') as cf:
        for line in cf.readlines():
            corpus.append([])
            for word in line.split():
                corpus[-1].append(word)
    corpus_obj = Corpus(dictionary=dictionary)
    corpus_obj.fit(corpus, window=10, ignore_missing=True)  # 得到稀疏的上三角矩阵
    corpus_obj.save('../../output/corpus_obj')
    # corpus_obj = Corpus.load('../../output/corpus_obj') # self.dictionary, self. matrix
    corpus_obj.matrix = corpus_obj.matrix.toarray()
    for i in range(corpus_obj.matrix.shape[0]):
        for j in range(i + 1, corpus_obj.matrix.shape[0]):
            if (corpus_obj.matrix[i][j] > 0.):
                corpus_obj.matrix[j][i] = corpus_obj.matrix[i][j]

    glove = GloVe(n=100,
                  xmax=100,
                  alpha=0.75,
                  max_iter=20000,
                  learning_rate=0.05,
                  tol=1e-4,
                  display_progress=100,