Beispiel #1
0
# create_index(words, u'Словари/Ефремова/speakrus.ru')

# words = load_dictionary_words('lopatin', 'academic')
# create_index(words, u'Словари/Лопатин/academic.ru')
#
# words = load_dictionary_words('lopatin', 'speakrus')
# create_index(words, u'Словари/Лопатин/speakrus.ru')
#
# words = load_dictionaries_words('lopatin')
# create_index(words, u'Словари/Лопатин')

# words = load_dictionary_words('rus_orthography', 'academic')
# create_index(words, u'Словари/Букчина/academic.ru')

words = load_dictionary_words('zaliznyak', 'speakrus')
create_index(words, u'Словари/Зализняк/speakrus.ru',
             u'Формирование индекса слов для словаря Зализняка')

words = load_dictionary_words('proling', 'speakrus')
create_index(words, u'Словари/Про-Линг/speakrus.ru',
             u'Формирование индекса слов для словаря Про-Линг')

words = load_dictionary_words('mas', 'academic')
create_index(words, u'Словари/Евгеньев/academic.ru',
             u'Формирование индекса слов для словаря Евгеньева')

words = load_dictionary_words('kuznetsov', 'academic')
create_index(words, u'Словари/Кузнецов/academic.ru',
             u'Формирование индекса слов для словаря Кузнецова')

words = load_dictionary_words('dmitriev', 'academic')
create_index(words, u'Словари/Дмитриев/academic.ru',
Beispiel #2
0
# coding: utf-8
from dictionaries.utils.file import load_lines
from dictionaries.wiktionary_package.create_index_utils import create_index
from wikt.tasks.index.get_words import sl_db_filename, sl_index_filename


words = load_lines(sl_db_filename)
words += load_lines(sl_index_filename)
create_index(words, u'Индекс/Словенский язык',
             u'Формирование индекса слов для словенского языка',
             alphabet=u'ABCČDEFGHIJKLMNOPRSŠTUVZŽQWXY', #push=True,
             force_wiki_title=u"Индекс:Словенский_язык")
Beispiel #3
0
            # print content
            # print
            words.append(page.title)
    return words

filename = 'data/words_no_length.txt'
#save_lines('data/test.txt', ['123', '456', '789'])
#words = words_no_length()
#save_lines(filename, words, encode='utf-8')

def is_error(word):
    return word.find(' ') == -1 and word.find('.') == -1

def is_ok(word):
    return not is_error(word)

words = load_lines(filename)
words_no_template = filter(is_error, words)
# for word in words_no_template[:100]:
#     print word
create_index(words_no_template, u'Ошибки/длина слова/отсутствует',
             u'Формирование списока слов с отсутсвующим шаблоном "длина слова"',
             use_other=False)

words_okay = filter(is_error, words)
# for word in words_okay[:100]:
#     print word
create_index(words_okay, u'Ошибки/длина слова/не нужна',
             u'Формирование списока слов, для которых не нужен шаблон "длина слова"',
             use_other=False)