def inflate_vocab(self, top_n=None) -> None: """ Получение словаря с ударениями по этому словарю. :param top_n: сколько первых записей взять? """ vocab = Vocabulary(GENERATOR_VOCAB_PATH) stress_predictor = CombinedStressPredictor() forms = self.word_forms if top_n is not None: forms = forms[:top_n] for index, word_form in tqdm(enumerate(forms), desc="Accenting words"): text = word_form.text stresses = stress_predictor.predict(text) word = Word(-1, -1, text, Graphemes.get_syllables(text)) word.set_stresses(stresses) vocab.add_word(word, index) vocab.save()
def inflate_vocab(self, dump_path, top_n=None) -> None: """ Получение словаря с ударениями по этому словарю. :param top_n: сколько первых записей взять? :param dump_path: путь, куда сохранить словарь. """ from rupo.main.vocabulary import Vocabulary from rupo.stress.predictor import CombinedStressPredictor vocab = Vocabulary(dump_path) stress_predictor = CombinedStressPredictor() forms = self.word_forms if top_n is not None: forms = forms[:top_n] for index, word_form in tqdm(enumerate(forms), desc="Accenting words"): text = word_form.text stresses = stress_predictor.predict(text) word = Word(-1, -1, text, Graphemes.get_syllables(text)) word.set_stresses(stresses) vocab.add_word(word, index) vocab.save()
def inflate_vocab(self, dump_path, top_n=None) -> None: """ Получение словаря с ударениями по этому словарю. :param top_n: сколько первых записей взять? :param dump_path: путь, куда сохранить словарь. """ from rupo.main.vocabulary import StressVocabulary from rupo.stress.word import StressedWord, Stress from rupo.stress.predictor import CombinedStressPredictor vocab = StressVocabulary(dump_path) stress_predictor = CombinedStressPredictor() forms = self.word_forms if top_n is not None: forms = forms[:top_n] for index, word_form in tqdm(enumerate(forms), desc="Accenting words"): text = word_form.text stresses = [Stress(pos, Stress.Type.PRIMARY) for pos in stress_predictor.predict(text)] word = StressedWord(text, set(stresses)) vocab.add_word(word, index) vocab.save()