Python NLPModel.vectorizer_transform 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: model

클래스/타입: NLPModel

메소드/함수: vectorizer_transform

hotexamples.com에서의 예제들: 4

Python NLPModel.vectorizer_transform - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 model.NLPModel.vectorizer_transform에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

NLPModel(13)

train(9)

pickle_clf(8)

pickle_vectorizer(8)

vectorizer_fit(6)

vectorizer_transform(4)

predict(3)

load_model(2)

plot_roc(2)

clf(2)

vectorizer(2)

load_vectorizer(1)

predict_proba(1)

report_accuracy(1)

save_model(1)

load_clf(1)

transform_vectorizer(1)

fit_vectorizer(1)

vectorizer_fit_transform(1)

예제 #1

파일 보기

파일: build_model.py 프로젝트: keshavatgithub/ML-AI

def build_model():
    model = NLPModel()

    #unzip the dataFiles in the folder where this file is saved before executing the below statements
    df_extract_combined = pd.read_csv('extract_combined.csv')
    df_labels = pd.read_csv('labels.csv')

    df_final = pd.merge(df_extract_combined, df_labels, on='document_name')
    df_text_data = df_final[['text', 'is_fitara']]

    for i in range(len(df_text_data)):
        df_text_data['text'][i] = re.sub('[^a-zA-Z]', ' ',
                                         df_text_data['text'][i])

    df_text_data['text'] = df_text_data['text'].apply(applyLemmatizer)

    #df_text_data['text'] = df_text_data['text'].apply(stopwords)

    le = LabelEncoder()
    df_text_data['is_fitara'] = le.fit_transform(df_text_data['is_fitara'])

    model.vectorizer_fit(df_text_data.loc[:, 'text'])
    #print('Vectorizer fit complete')

    X = model.vectorizer_transform(df_text_data.loc[:, 'text'])
    #print('Vectorizer transform complete')
    y = df_text_data.loc[:, 'is_fitara']

    X_train, X_test, y_train, y_test = train_test_split(X, y)

    model.train(X_train, y_train)
    #print('Model training complete')

    model.pickle_clf()
    model.pickle_vectorizer()

예제 #2

파일 보기

파일: build_model.py 프로젝트: eddiecityu/Sentiment-Classifier-as-REST-API

def build_model():
    model = NLPModel()

    # filename = os.path.join(
    #     os.path.dirname(__file__), 'chalicelib', 'all/train.tsv')
    with open('../sentiment_data/train.tsv') as f:
        data = pd.read_csv(f, sep='\t')

    pos_neg = data[(data['Sentiment'] == 0) | (data['Sentiment'] == 4)]

    pos_neg['Binary'] = pos_neg.apply(lambda x: 0
                                      if x['Sentiment'] == 0 else 1,
                                      axis=1)

    model.vectorizer_fit(pos_neg.loc[:, 'Phrase'])
    print('Vectorizer fit complete')

    X = model.vectorizer_transform(pos_neg.loc[:, 'Phrase'])
    print('Vectorizer transform complete')
    y = pos_neg.loc[:, 'Binary']

    X_train, X_test, y_train, y_test = train_test_split(X, y)

    model.train(X_train, y_train)
    print('Model training complete')

    model.pickle_clf()
    model.pickle_vectorizer()

    model.plot_roc(X_test, y_test)

예제 #3

파일 보기

파일: build_model.py 프로젝트: aayushi2919/flaskml_webapp

def build_model():
    model = NLPModel()

    data = pd.read_csv('extract_combined.csv')
    data2 = pd.read_csv('labels.csv', error_bad_lines=False)
    merged = pd.merge(data, data2)
    yn = {'Yes': 1, 'No': 0}

    merged.is_fitara = [yn[i] for i in merged.is_fitara]

    model.vectorizer_fit(data.loc[:, 'text'])
    print('Vectorizer fit complete')

    X = model.vectorizer_transform(data.loc[:, 'text'])
    print('Vectorizer transform complete')
    y = merged.loc[:, 'is_fitara']

    X_train, X_test, y_train, y_test = train_test_split(X, y)

    model.train(X_train, y_train)
    print('Model training complete')

    model.pickle_clf()
    model.pickle_vectorizer()

예제 #4

파일 보기

파일: build_model.py 프로젝트: deepansh27/ML-API

def build_model():
    model = NLPModel()
    with open('./data/train.tsv') as f:
        data = pd.read_csv(f, sep='\t')

    print(data.columns)
    pos_neg = data[(data['Sentiment'] == 0) | (data['Sentiment'] == 4)]

    pos_neg['Binary'] = np.where(pos_neg['Sentiment'] == 0, 0, 1)

    model.vectorizer_fit(pos_neg.loc[:, 'Phrase'])
    print('Vectorizer fit complete')

    X = model.vectorizer_transform(pos_neg.loc[:, 'Phrase'])
    print('Vectorizer transform complete')
    y = pos_neg.loc[:, 'Binary']

    X_train, X_test, y_train, y_test = train_test_split(X, y)

    model.train(X_train, y_train)
    print('Model training complete')

    model.pickle_clf()
    model.pickle_vectorizer()