Esempi in Python per Preprocessing.corpus_preproc

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: preprocessing

Classe/tipologia: Preprocessing

Metodo/funzione: corpus_preproc

Esempi su hotexamples.com: 1

Preprocessing.corpus_preproc in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per preprocessing.Preprocessing.corpus_preproc, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Preprocessing(30)

dopreprocess(3)

cleanHeaders(3)

GetInputShape(3)

do(3)

dummy(2)

convert_lable_int(2)

SplitDataset(2)

convert_lable_string(2)

ReshapeInputData3D(2)

adjustBrightness(2)

denoiseImage(2)

preprocess_tweets(2)

GetTargetData(2)

decode_label(2)

encoding(2)

addhead(2)

der_features(1)

digital_img_processing(1)

decrease_time_channels(1)

datasplit(1)

data(1)

draw_image(1)

FeatureEncoding(1)

dummylist(1)

encode(1)

encoding_reduction(1)

cut_out_backgound(1)

get_location(1)

output_category_num_scale(1)

output_city_rank(1)

output_coor_scale(1)

output_dumps_scale(1)

output_missing_scale(1)

preprocess_tweet(1)

query(1)

read_with_numpy(1)

ss_treat(1)

dG0_prime(1)

create_dictionary(1)

customized_word_tokenizer(1)

binarization(1)

GetImageDataFormat(1)

GetInputData(1)

GetMaxLength(1)

GetTargetShape(1)

MissingData(1)

RemoveRedundantZero(1)

ReshapeInputData1D(1)

Split(1)

Esempio n. 1

Mostra file

File: lda_model.py Progetto: leonhart8/lda

        proba(term | topic) = beta[topic][term]

        We shall for each topic find the top 20 words that contribute 
        to a document being classified as said topic
        """
        top_20_per_topic = np.argsort(self.beta * (-1), axis=1)
        for i in range(self.nb_topics):
            for j in range(self.nb_terms):
                if top_20_per_topic[i][j] < 20:
                    print(self.index[j], end=" ")
            print()


if __name__ == "__main__":
    """
    Example of application using newsgroups
    """
    from sklearn.datasets import fetch_20newsgroups

    train = fetch_20newsgroups(subset='train',
                               remove=('headers', 'footers', 'quotes'))

    pp = Preprocessing()

    index, bow = pp.build_bow(pp.corpus_preproc(train["data"]))

    lda = LDA(5, bow, index, alpha=0.1, set_alpha=True)

    lda.estimation(max_iter_em=100, max_iter_var=10)

    lda.display_word_topic_association()