Esempio n. 1
0
 def inflate_vocab(self, top_n=None) -> None:
     """
     Получение словаря с ударениями по этому словарю.
     :param top_n: сколько первых записей взять?
     """
     vocab = Vocabulary(GENERATOR_VOCAB_PATH)
     stress_predictor = CombinedStressPredictor()
     forms = self.word_forms
     if top_n is not None:
         forms = forms[:top_n]
     for index, word_form in tqdm(enumerate(forms), desc="Accenting words"):
         text = word_form.text
         stresses = stress_predictor.predict(text)
         word = Word(-1, -1, text, Graphemes.get_syllables(text))
         word.set_stresses(stresses)
         vocab.add_word(word, index)
     vocab.save()
Esempio n. 2
0
 def inflate_vocab(self, dump_path, top_n=None) -> None:
     """
     Получение словаря с ударениями по этому словарю.
     
     :param top_n: сколько первых записей взять?
     :param dump_path: путь, куда сохранить словарь.
     """
     from rupo.main.vocabulary import Vocabulary
     from rupo.stress.predictor import CombinedStressPredictor
     vocab = Vocabulary(dump_path)
     stress_predictor = CombinedStressPredictor()
     forms = self.word_forms
     if top_n is not None:
         forms = forms[:top_n]
     for index, word_form in tqdm(enumerate(forms), desc="Accenting words"):
         text = word_form.text
         stresses = stress_predictor.predict(text)
         word = Word(-1, -1, text, Graphemes.get_syllables(text))
         word.set_stresses(stresses)
         vocab.add_word(word, index)
     vocab.save()
Esempio n. 3
0
 def inflate_vocab(self, dump_path, top_n=None) -> None:
     """
     Получение словаря с ударениями по этому словарю.
     
     :param top_n: сколько первых записей взять?
     :param dump_path: путь, куда сохранить словарь.
     """
     from rupo.main.vocabulary import StressVocabulary
     from rupo.stress.word import StressedWord, Stress
     from rupo.stress.predictor import CombinedStressPredictor
     vocab = StressVocabulary(dump_path)
     stress_predictor = CombinedStressPredictor()
     forms = self.word_forms
     if top_n is not None:
         forms = forms[:top_n]
     for index, word_form in tqdm(enumerate(forms), desc="Accenting words"):
         text = word_form.text
         stresses = [Stress(pos, Stress.Type.PRIMARY) for pos in stress_predictor.predict(text)]
         word = StressedWord(text, set(stresses))
         vocab.add_word(word, index)
     vocab.save()