예제 #1
0
if __name__ == "__main__":
	text = '''
		A szövegbányászat a strukturálatlan vagy kis mértékben strukturált 
		szöveges állományokból történő ismeret kinyerésének tudománya; 
		olyan különböző dokumentumforrásokból származó szöveges ismeretek
		és információk gépi intelligenciával történő kigyűjtése és 
		reprezentációja, amely a feldolgozás előtt rejtve és feltáratlanul 
		maradt az elemző előtt. 
	'''

	# A szöveg szavaiból bigramokat generál
	tokens = nlp.tokenize(text)
	bigrams = nlp.ngram(tokens, 2)
	print(bigrams)

	# A szöveg szavait stemmeli és ezekből bigramokat generál
	stems = stemmer.tippmix(text)
	bigrams = nlp.ngram(stems, 2)
	print(bigrams)

	# A szöveg szavaiból bigramokat generál, miután eltávolította a stopszavakat
	text = nlp.remove_stopwords(text)
	tokens = nlp.tokenize(text)
	bigrams = nlp.ngram(tokens, 2)
	print(bigrams)

	# A stopszavak eltávolítása után megmaradt szavakat stemmeli és ezekből generál bigramokat
	stems = stemmer.tippmix(text)
	bigrams = nlp.ngram(stems, 2)
	print(bigrams)
import os.path, sys
sys.path.append(
    os.path.join(os.path.dirname(os.path.realpath(__file__)), os.pardir))
from lara import parser, entities, nlp
''' Basic Chatbot that just prints out replies '''

if __name__ == "__main__":

    user_text = 'Keress rá arra, hogy Chatbot!'

    ###

    common = entities.common()
    common_match = parser.Intents(common).match_set(user_text)

    commands = entities.commands()
    commands_match = parser.Intents(commands).match_set(user_text)

    if 'hi' in common_match:
        print('Szia!')  # nem fog kiíródni
    if 'thx' in common_match:
        print('Nagyon szívesen!')  # nem fog kiíródni

    if 'search' in commands_match:
        print('Keressek rá erre?')

        keywords = parser.Intents(commands).clean(user_text)
        keywords = nlp.remove_stopwords(keywords)
        keywords = nlp.remove_punctuation(keywords)
        print(nlp.trim(keywords))