Python process_fileの例

プログラミング言語: Python

名前空間/パッケージ名: factiva_model

メソッド/関数: process_file

hotexamples.comのコード掲載数: 4

Python process_file - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfactiva_model.process_fileの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: file_LDA_JAMA.py プロジェクト: yezhang1989/A-Data-Driven-Approach-to-Characterizing-the-Perceived-Newsworthiness-of-Health-ScienceArticles

def get_X_y():
    X,y,interest = process_file("jama/jama_article_info.csv","jama/jama_pmids.txt_matched_articles_filtered.csv")
    vectorizer = CountVectorizer(stop_words="english",
                                    min_df=2,
                                    token_pattern=r"(?u)95% confidence interval|95% CI|95% ci|[a-zA-Z0-9_*\-][a-zA-Z0-9_/*\-]+",
                                    binary=False, max_features=50000)
    X = vectorizer.fit_transform(X)
    return X,np.array(y),vectorizer

コード例 #2

ファイルを表示

ファイル: file_LDA_JAMA.py プロジェクト: yezhang-xiaofan/mediaCoverage

def get_X_y():
    X, y, interest = process_file(
        "jama/jama_article_info.csv",
        "jama/jama_pmids.txt_matched_articles_filtered.csv")
    vectorizer = CountVectorizer(
        stop_words="english",
        min_df=2,
        token_pattern=
        r"(?u)95% confidence interval|95% CI|95% ci|[a-zA-Z0-9_*\-][a-zA-Z0-9_/*\-]+",
        binary=False,
        max_features=50000)
    X = vectorizer.fit_transform(X)
    return X, np.array(y), vectorizer

コード例 #3

ファイルを表示

ファイル: BS_NC_Reuters.py プロジェクト: yezhang-xiaofan/mediaCoverage

def get_X_y():
    X, y, interest = process_file(
        "reuters/all_reuters_article_info.csv",
        "reuters/all_reuters_matched_articles_filtered.csv")
    vectorizer = CountVectorizer(
        ngram_range=(1, 2),
        stop_words="english",
        min_df=1,
        token_pattern=
        r"(?u)95% confidence interval|95% CI|95% ci|[a-zA-Z0-9_*\-][a-zA-Z0-9_/*\-]+",
        binary=False,
        max_features=50000)
    X = vectorizer.fit_transform(X)
    return X, np.array(y), vectorizer

コード例 #4

ファイルを表示

ファイル: BS_NC_Reuters.py プロジェクト: yezhang1989/A-Data-Driven-Approach-to-Characterizing-the-Perceived-Newsworthiness-of-Health-ScienceArticles

def get_X_y():
    X, y, interest = process_file(
        "reuters/all_reuters_article_info.csv", "reuters/all_reuters_matched_articles_filtered.csv"
    )
    vectorizer = CountVectorizer(
        ngram_range=(1, 2),
        stop_words="english",
        min_df=1,
        token_pattern=r"(?u)95% confidence interval|95% CI|95% ci|[a-zA-Z0-9_*\-][a-zA-Z0-9_/*\-]+",
        binary=False,
        max_features=50000,
    )
    X = vectorizer.fit_transform(X)
    return X, np.array(y), vectorizer