def test_sentiment_4(self): text = "Ăn bình thường, cho nhiều hỗn hợp quá nên ăn mau ngán. Theo mình là khá ngọt nữa. 1 đĩa chỉ có 25k " \ "nên ko đòi hỏi gì nhiều. Mình thấy mấy phần fast food ăn ok hơn nhiều nha. 2 người tầm 80k là đủ no " \ "rồi. " actual = sentiment(text) expected = ('FOOD#PRICE#NEUTRAL', 'FOOD#QUALITY#POSITIVE') self.assertEquals(actual, expected)
def test_sentiment_1(self): text = "Cháo trai chuẩn Huế,có cả thịt trai bùi bùi ăn ngon mê ly >,<" actual = sentiment(text) expected = [('FOOD#QUALITY#POSITIVE',)] self.assertEquals(actual, expected)
def test_sentiment_3(self): text = "ấn tg đầu tiên, quá đắt,50k cho 1 xuất cơm ntn. Là m lâu k ăn cơm, k biết giá hay cơm đắt thật k biết " \ "nữa. Cơm chả có j đặc biệt :)k bh ăn nữa " actual = sentiment(text) expected = ('FOOD#PRICE#NEGATIVE', 'FOOD#QUALITY#POSITIVE') self.assertEquals(actual, expected)
def test_sentiment_2(self): text = "Bánh ăn thơm và vừa miệng. Gìon rụm, ngọt nhưng không quá gắt. Đáng để thử " actual = sentiment(text) expected = ('FOOD#QUALITY#POSITIVE',) self.assertEquals(actual, expected)
from os.path import join, dirname from languageflow.board import Board from languageflow.log import MultilabelLogger from exported.linearsvc import sentiment from load_data import load_dataset data = join(dirname(dirname(dirname(__file__))), "data", "vlsp2018", "corpus", "hotel", "dev.xlsx") X_dev, y_dev = load_dataset(data) y_dev = [tuple(item) for item in y_dev] y_pred = sentiment(X_dev) log_folder = join(dirname(__file__), "analyze") board = Board(log_folder=log_folder) MultilabelLogger.log(X_dev, y_dev, y_pred, log_folder=log_folder) # board.serve(port=62010)
from os.path import join, dirname import re from exported.linearsvc import sentiment from exported.linearsvc_full import sentiment as sentiment_full import pandas as pd import json data = join(dirname(dirname(dirname(__file__))), "data", "vlsp2018", "corpus", "restaurant", "test.xlsx") X_test = list(pd.read_excel(data)["text"]) y = sentiment(X_test) y_full = sentiment_full(X_test) def save_result(X_test, y, file): content = {"text": X_test, "labels": y} with open(file, "w") as f: json.dump(content, f) save_result(X_test, y, "results/linearsvc.json") save_result(X_test, y_full, "results/linearsvc_full.json") def generate_labels(y): labels = [] for item in y: matched = re.match( "^(?P<attribute>.*)#(?P<sentiment>\s*POSITIVE|NEGATIVE|NEUTRAL)$",