Python StanfordDetokenizer.StanfordDetokenizer 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: stanford

클래스/타입: StanfordDetokenizer

메소드/함수: StanfordDetokenizer

hotexamples.com에서의 예제들: 3

Python StanfordDetokenizer.StanfordDetokenizer - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 stanford.StanfordDetokenizer.StanfordDetokenizer에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

StanfordDetokenizer(3)

detokenize(3)

자주 사용되는 메소드들

StanfordDetokenizer (3)

detokenize (3)

예제 #1

파일 보기

def twitter(file: str, n: int, words: int, method: str):
    ''' Returns the list of generated tweets
       file -> name of file
       n -> number of n-grams
       words -> how many tweets to generate
       method -> method used to generate
    '''
    file = open(file, 'r')
    text = file.read()
    tagged = StanfordTagger(verbose=True).tag(text)
    file.close()

    detok = StanfordDetokenizer()
    model = LVGNgramGenerator(tagged, n)
    methods = {'b': model.generate_without_pos, 'n': model.generate, 't': model.generate_alternative}
    result = []
    x = 0
    while x < words:
        num_words = str(random.randint(20, 65))
        if num_words.isdigit():
            if method in methods:
                result.append(detok.detokenize(' '.join(methods[method](int(num_words)))))
        x += 1
    final = []
    for i in result:
        if i.startswith("forced"):
            pass
        else:
            final.append(i)
    return final

예제 #2

파일 보기

 def generate(self):
     """
     Generates text using provided source text data
     """
     if self.data is not None:
         with open(self.data, 'r') as data_file:
             text = data_file.read()
             tagged = StanfordTagger(verbose=True).tag(text)
         if self.save_tagged_data:
             save_file = self.data + ".tags"
             with open(self.data + ".tags", 'w') as save_file:
                 save = csv.writer(save_file)
                 save.writerows(tagged)
     elif self.tagged_data is not None:
         with open(self.tagged_data, 'r') as data_file:
             tagged = csv.reader(data_file)
             tagged = [tuple(row) for row in tagged]
     detok = StanfordDetokenizer()
     model = LVGNgramGenerator(tagged, self.n_gram)
     methods = {'b': model.generate_without_pos, 'n': model.generate, 't': model.generate_alternative}
     while True:
         num_words = input('\nEnter the length in words to generate (or "q" to exit): ')
         if num_words.isdigit():
             method = input('Enter a generation method {b: baseline, n: normal, t: tuned}: ')
             if method in methods:
                 print("\n\t" + detok.detokenize(' '.join(methods[method](int(num_words)))))
         elif num_words == 'q':
             break

예제 #3

파일 보기

def yelp_or_gutenberg(file: str, n: int, words: int, method: str):
    ''' Returns the list of generated sentences
       file -> name of file
       n -> number of n-grams
       words -> how many sentences to generate
       method -> method used to generate
    '''
    file = open(file, 'r')
    tag = csv.reader(file)
    tagged = []
    try:
        for row in tag:
            tagged.append(tuple(row))
    except:
        pass
    file.close()
    detok = StanfordDetokenizer()
    model = LVGNgramGenerator(tagged, n)
    methods = {'b': model.generate_without_pos, 'n': model.generate, 't': model.generate_alternative}
    x = 0
    result = []
    final = []    
    while x < words:
        num_words = str(random.randint(20, 65))
        if num_words.isdigit():
            if method in methods:
                result.append(detok.detokenize(' '.join(methods[method](int(num_words)))))
        x += 1
    for i in result:
        if i.startswith("forced"):
            pass
        else:
            final.append(i)
    return final