def check_genre(text): LABELS = ["OKです。", "スパムです!"] data = tfidf.calc_text(text) model._make_predict_function() pre = model.predict(np.array([data]))[0] n = pre.argmax() print(LABELS[n], "(", pre[n], ")") return LABELS[n], float(pre[n]), int(n)
def check_genre(text): # ラベルの定義 LABELS = ["kaden-channel", "IT", "peachy", "topic-news"] # TF-IDFのベクトルに変換 data = tfidf.calc_text(text) # MLPで予測 pre = model.predict(np.array([data]))[0] n = pre.argmax() print(LABELS[n], "(", pre[n], ")") return LABELS[n], float(pre[n]), int(n)
def check_genre(text): # 레이블 정의하기 LABELS = ["정치", "경제", "생활 ", "IT/과학"] # TF-IDF 벡터로 변환하기 -- (*5) data = tfidf.calc_text(text) # MLP로 예측하기 --- (*6) pre = model.predict(np.array([data]))[0] n = pre.argmax() print(LABELS[n], "(", pre[n], ")") return LABELS[n], float(pre[n]), int(n)
def check_genre(text): # ラベルの定義 LABELS = ["スポーツ", "IT", "映画", "ライフ"] # TF-IDFのベクトルに変換 -- (*5) data = tfidf.calc_text(text) # MLPで予測 --- (*6) pre = model.predict(np.array([data]))[0] n = pre.argmax() print(LABELS[n], "(", pre[n], ")") return LABELS[n], float(pre[n]), int(n)
def predict_genre(text): #クラス分類するラベルの指定 LABELS = ["スポーツ", "IT", "映画", "国際"] #テキストのTF-IDF値を求める data = tfidf.calc_text(text) #テキストのIF-IDF値を入力し、推論を行う pre = model.predict(np.array([data]))[0] #確率が最大となるインデックス値を返す n = pre.argmax() #推論結果のクラスを表示 print('【文書】', text, ' 【予測カテゴリ】', LABELS[n], ' 【予測確率】', pre[n]) #推論結果のクラス、確率値、推論クラスのインデックスを返す return LABELS[n], float(pre[n]), int(n)
#RFで学習 model.fit(x_train, y_train) #テストデータに対して推論を行う y_pred = model.predict(x_test) #推論結果と正解ラベルの精度を求める acc = metrics.accuracy_score(y_test, y_pred) #推論結果に対して'適合率(precision)'、'再現率(recall)'、 #'F値(f1-score=適合率と再現率の調和平均)'を求める #('support' is the number of occurrences of each class in y_true) rep = metrics.classification_report(y_test, y_pred) #精度の表示 print("精度=", acc) #classification_reportの結果を表示 print(rep) #入力したテキストに対して推論を結果をテスト LABELS = ["スポーツ", "IT", "映画", "国際"] test = "今日は野球の試合がありますね。" #辞書データの読み込み tfidf.load_dic("data/pkl/dic.pkl") #テキストをIF-IDFでベクトル化 preprocessed_input = tfidf.calc_text(test) #テキストのカテゴリを推論 y_pred = model.predict(np.array([preprocessed_input]))[0] #最尤推定値のインデックスを取得 mle_index = y_pred.argmax() #推論結果のカテゴリを表示 print("推論結果:", LABELS[mle_index])