# create_index(words, u'Словари/Ефремова/speakrus.ru') # words = load_dictionary_words('lopatin', 'academic') # create_index(words, u'Словари/Лопатин/academic.ru') # # words = load_dictionary_words('lopatin', 'speakrus') # create_index(words, u'Словари/Лопатин/speakrus.ru') # # words = load_dictionaries_words('lopatin') # create_index(words, u'Словари/Лопатин') # words = load_dictionary_words('rus_orthography', 'academic') # create_index(words, u'Словари/Букчина/academic.ru') words = load_dictionary_words('zaliznyak', 'speakrus') create_index(words, u'Словари/Зализняк/speakrus.ru', u'Формирование индекса слов для словаря Зализняка') words = load_dictionary_words('proling', 'speakrus') create_index(words, u'Словари/Про-Линг/speakrus.ru', u'Формирование индекса слов для словаря Про-Линг') words = load_dictionary_words('mas', 'academic') create_index(words, u'Словари/Евгеньев/academic.ru', u'Формирование индекса слов для словаря Евгеньева') words = load_dictionary_words('kuznetsov', 'academic') create_index(words, u'Словари/Кузнецов/academic.ru', u'Формирование индекса слов для словаря Кузнецова') words = load_dictionary_words('dmitriev', 'academic') create_index(words, u'Словари/Дмитриев/academic.ru',
# coding: utf-8 from dictionaries.utils.file import load_lines from dictionaries.wiktionary_package.create_index_utils import create_index from wikt.tasks.index.get_words import sl_db_filename, sl_index_filename words = load_lines(sl_db_filename) words += load_lines(sl_index_filename) create_index(words, u'Индекс/Словенский язык', u'Формирование индекса слов для словенского языка', alphabet=u'ABCČDEFGHIJKLMNOPRSŠTUVZŽQWXY', #push=True, force_wiki_title=u"Индекс:Словенский_язык")
# print content # print words.append(page.title) return words filename = 'data/words_no_length.txt' #save_lines('data/test.txt', ['123', '456', '789']) #words = words_no_length() #save_lines(filename, words, encode='utf-8') def is_error(word): return word.find(' ') == -1 and word.find('.') == -1 def is_ok(word): return not is_error(word) words = load_lines(filename) words_no_template = filter(is_error, words) # for word in words_no_template[:100]: # print word create_index(words_no_template, u'Ошибки/длина слова/отсутствует', u'Формирование списока слов с отсутсвующим шаблоном "длина слова"', use_other=False) words_okay = filter(is_error, words) # for word in words_okay[:100]: # print word create_index(words_okay, u'Ошибки/длина слова/не нужна', u'Формирование списока слов, для которых не нужен шаблон "длина слова"', use_other=False)