Python word2vec_modelの例

プログラミング言語: Python

名前空間/パッケージ名: feature_extraction

メソッド/関数: word2vec_model

hotexamples.comのコード掲載数: 4

Python word2vec_model - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfeature_extraction.word2vec_modelの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: train.py プロジェクト: chrisdamba/trolling_detection

def train_word2vec(categories, comments, n_dim):
    from feature_extraction import tokenize_document
    from feature_extraction import word2vec_model
    from sklearn.linear_model import SGDClassifier
    documents = [tokenize_document(document) for document in comments]
    model = word2vec_model(documents, n_dim)
    train_vecs = w2vectorize(documents, model, n_dim)
    classifier = SGDClassifier(loss='log', penalty='l1')
    classifier.fit(train_vecs, categories)

    return model, classifier

コード例 #2

ファイルを表示

def train_word2vec(categories, comments, n_dim):
    from feature_extraction import tokenize_document
    from feature_extraction import word2vec_model
    from sklearn.linear_model import SGDClassifier
    documents = [tokenize_document(document) for document in comments]
    model = word2vec_model(documents, n_dim)
    train_vecs = w2vectorize(documents, model, n_dim)
    classifier = SGDClassifier(loss='log', penalty='l1')
    classifier.fit(train_vecs, categories)

    return model, classifier

コード例 #3

ファイルを表示

        print "\n"
        print collocations
        print "\n"

        similar_words(comments, "fakeinsult")

        model = language_model(comments)

        print "\nSamples: "
        import pprint
        printer = pprint.PrettyPrinter(indent=4)
        printer.pprint(model["sound"].samples())

        print "\n"

        model = word2vec_model(comments)
        print model.similarity('retarded', 'loser')

    if config_parser.getboolean(EXECUTION_SECTION, 'WordVec'):
        from train import train_word2vec
        from train import w2vectorize
        from feature_extraction import tokenize_document
        model, classifier = train_word2vec(categories, comments, 500)
        test_documents = [
            tokenize_document(document, stopwords='english')
            for document in test_comments
        ]
        test_vecs = w2vectorize(test_documents, model, 500)
        predictions = classifier.predict(test_vecs)
        print "\nWord2Vec Model Result\n"
        prediction_info(predictions, test_categories)

コード例 #4

ファイルを表示

ファイル: main.py プロジェクト: chrisdamba/trolling_detection

        print "\n"


        similar_words(comments, "fakeinsult")


        model = language_model(comments)

        print "\nSamples: "
        import pprint
        printer = pprint.PrettyPrinter(indent=4)
        printer.pprint(model["sound"].samples())

        print "\n"

        model = word2vec_model(comments)
        print model.similarity('retarded', 'loser')



    if config_parser.getboolean(EXECUTION_SECTION, 'WordVec'):
        from train import train_word2vec
        from train import w2vectorize
        from feature_extraction import tokenize_document
        model, classifier = train_word2vec(categories, comments, 500)
        test_documents = [tokenize_document(document, stopwords='english') for document in test_comments]
        test_vecs = w2vectorize(test_documents, model, 500)
        predictions = classifier.predict(test_vecs)
        print "\nWord2Vec Model Result\n"
        prediction_info(predictions, test_categories)