import sys sys.path.append('..') from utils.preprocess import Preprocess sentence = "내일 저녁 8시에 닭튀김을 주문하고 싶어" # 전처리 객체 생성 p = Preprocess(userdic='../utils/user_dic.tsv' ) # tsv : tab seperated values, 음식 이름, 시간 정보에 대한 사전 # 형태소 분석기 실행 pos = p.pos(sentence) # 품사 태그와 같이 키워드 출력 ret = p.get_keywords(pos, without_tag=False) print(ret)
import sys sys.path.append('..') import pickle from utils.preprocess import Preprocess f = open('../train_tools/dict/chatbot_dict.bin', 'rb') word_index = pickle.load(f) f.close() sentence = "오늘 오후 5시 30분에 닭고기를 먹고 싶어 ㅎㅎㅎ" # 전처리 객체 생성 p = Preprocess(userdic='../utils/user_dic.tsv') # 형태소 분석기 실행 pos = p.pos(sentence) # 품사 태그와 같이 키워드 출력 keywords = p.get_keywords(pos, without_tag=True) for word in keywords: try: print(word, word_index[word]) except KeyError: # 해당 단어가 사전에 없는 경우 OOV 처리 print(word, word_index['OOV'])
import sys sys.path.append(".") from utils.preprocess import Preprocess sent = """ SWM 연수과정의 많은 부분이 자발적 참여로 이루어지고, 참여의 목적을 달성하고 연수과정을 즐겁게 보내려면, 시너지를 낼 수 있는 팀원, 지속적으로 흥미를 유발하고, 도전 하고 싶은 프로젝트를 선정하는 일이 정말 중요하겠죠. """ p = Preprocess() pos = p.pos(sent) ret = p.get_keywords(pos) print(ret) ret = p.get_keywords(pos, True) print(ret)