예제 #1
0
 def test_sentiment_4(self):
     text = "Ăn bình thường, cho nhiều hỗn hợp quá nên ăn mau ngán. Theo mình là khá ngọt nữa. 1 đĩa chỉ có 25k " \
            "nên ko đòi hỏi gì nhiều. Mình thấy mấy phần fast food ăn ok hơn nhiều nha. 2 người tầm 80k là đủ no " \
            "rồi. "
     actual = sentiment(text)
     expected = ('FOOD#PRICE#NEUTRAL', 'FOOD#QUALITY#POSITIVE')
     self.assertEquals(actual, expected)
예제 #2
0
 def test_sentiment_1(self):
     text = "Cháo trai chuẩn Huế,có cả thịt trai bùi bùi ăn ngon mê ly >,<"
     actual = sentiment(text)
     expected = [('FOOD#QUALITY#POSITIVE',)]
     self.assertEquals(actual, expected)
예제 #3
0
 def test_sentiment_3(self):
     text = "ấn tg đầu tiên, quá đắt,50k cho 1 xuất cơm ntn. Là m lâu k ăn cơm, k biết giá hay cơm đắt thật k biết " \
            "nữa. Cơm chả có j đặc biệt :)k bh ăn nữa "
     actual = sentiment(text)
     expected = ('FOOD#PRICE#NEGATIVE', 'FOOD#QUALITY#POSITIVE')
     self.assertEquals(actual, expected)
예제 #4
0
 def test_sentiment_2(self):
     text = "Bánh ăn thơm và vừa miệng. Gìon rụm, ngọt nhưng không quá gắt. Đáng để thử "
     actual = sentiment(text)
     expected = ('FOOD#QUALITY#POSITIVE',)
     self.assertEquals(actual, expected)
예제 #5
0
from os.path import join, dirname
from languageflow.board import Board
from languageflow.log import MultilabelLogger

from exported.linearsvc import sentiment
from load_data import load_dataset

data = join(dirname(dirname(dirname(__file__))), "data", "vlsp2018", "corpus",
            "hotel", "dev.xlsx")
X_dev, y_dev = load_dataset(data)
y_dev = [tuple(item) for item in y_dev]
y_pred = sentiment(X_dev)

log_folder = join(dirname(__file__), "analyze")

board = Board(log_folder=log_folder)

MultilabelLogger.log(X_dev, y_dev, y_pred, log_folder=log_folder)
# board.serve(port=62010)
예제 #6
0
from os.path import join, dirname
import re
from exported.linearsvc import sentiment
from exported.linearsvc_full import sentiment as sentiment_full
import pandas as pd
import json

data = join(dirname(dirname(dirname(__file__))), "data", "vlsp2018", "corpus",
            "restaurant", "test.xlsx")
X_test = list(pd.read_excel(data)["text"])

y = sentiment(X_test)
y_full = sentiment_full(X_test)


def save_result(X_test, y, file):
    content = {"text": X_test, "labels": y}

    with open(file, "w") as f:
        json.dump(content, f)


save_result(X_test, y, "results/linearsvc.json")
save_result(X_test, y_full, "results/linearsvc_full.json")


def generate_labels(y):
    labels = []
    for item in y:
        matched = re.match(
            "^(?P<attribute>.*)#(?P<sentiment>\s*POSITIVE|NEGATIVE|NEUTRAL)$",