if __name__ == "__main__": text = ''' A szövegbányászat a strukturálatlan vagy kis mértékben strukturált szöveges állományokból történő ismeret kinyerésének tudománya; olyan különböző dokumentumforrásokból származó szöveges ismeretek és információk gépi intelligenciával történő kigyűjtése és reprezentációja, amely a feldolgozás előtt rejtve és feltáratlanul maradt az elemző előtt. ''' # A szöveg szavaiból bigramokat generál tokens = nlp.tokenize(text) bigrams = nlp.ngram(tokens, 2) print(bigrams) # A szöveg szavait stemmeli és ezekből bigramokat generál stems = stemmer.tippmix(text) bigrams = nlp.ngram(stems, 2) print(bigrams) # A szöveg szavaiból bigramokat generál, miután eltávolította a stopszavakat text = nlp.remove_stopwords(text) tokens = nlp.tokenize(text) bigrams = nlp.ngram(tokens, 2) print(bigrams) # A stopszavak eltávolítása után megmaradt szavakat stemmeli és ezekből generál bigramokat stems = stemmer.tippmix(text) bigrams = nlp.ngram(stems, 2) print(bigrams)
import os.path, sys sys.path.append( os.path.join(os.path.dirname(os.path.realpath(__file__)), os.pardir)) from lara import parser, entities, nlp ''' Basic Chatbot that just prints out replies ''' if __name__ == "__main__": user_text = 'Keress rá arra, hogy Chatbot!' ### common = entities.common() common_match = parser.Intents(common).match_set(user_text) commands = entities.commands() commands_match = parser.Intents(commands).match_set(user_text) if 'hi' in common_match: print('Szia!') # nem fog kiíródni if 'thx' in common_match: print('Nagyon szívesen!') # nem fog kiíródni if 'search' in commands_match: print('Keressek rá erre?') keywords = parser.Intents(commands).clean(user_text) keywords = nlp.remove_stopwords(keywords) keywords = nlp.remove_punctuation(keywords) print(nlp.trim(keywords))