##Оценки 0; ФИО; Обратный индекс (26.01.16); BIRM (9.02.16); ОpenСoerp (23.02.16); Perplexity(01.03.16); ClassWork(15.03.16); ClassWork(23.02.16)
1; Васильева Инна; 9;9;+;9;9;9
2; Веренцов Сергей; 0;0;0;0;9;9
3; Вико Максим; 9; 9; +; 0; 9
4; Волкович Полина; 9; 9; +; 8; 9
5; Воронина Мария; 9; 9; +; 0; 9
6; Гревцов Сергей; 0; 0; -; 8 ; 7
7; Гусев Иван; 7; ?; +; 0; 9
8; Еремина Мария; 9; 9; +; 0; 9
9; Зеленов Алексей; 9; 9; +; 0; 9
10; Землянкин Андрей; 9;9;+;8; 9
11; Козицин Александр(kelmomas); 9; 9; +; 9; 9
12; Макарова Ольга; 9;9;+;0;9;9
13; Миронов Алексанр; 6; ?; +; 0; 7
14; Оськин Алексей; 7;0;-;0; 7
15; Павлова Елена; 9; 7; + ;8 ; 9
16; Прибыткина Дарья; 9; 6; + ; 0; 9
17; Рудаков Кирилл; 9; 9; +; 9; 9
18; Семин Александр; 9; 9; +; 8; 9
##Задание 1. Обратный индекс (26.01.16)
Разработать программу для построения и применения обратного индекса (inverted index).
Индекс строиться для коллекции текстов из csv файла. В коллекции не менее 10 текстов.
На вход программа должна принимать фразу в качестве запроса. На выходе возвращать список текстов, соответствующих запросу.
##Задание 2. BIRM (9.02.16)
Разработать приложение определяющее релевантность строки запроса к одному из классов. На вход приложение принимает строку запроса. На выходе приложение возвращает величину степени релевантности на основе BIRM описанной в презентации: http://www.slideshare.net/mounialalmas/introduction-to-information-retrieval-models?qid=a074a3a6-244e-4c30-9ccd-018cb8a7e15e
Значения коэффициентов c_i и С функции g(d) сохранить в csv файле в формате: word_i; c_i
В качестве обучающей коллекции использовать твитты о банках в формате xml из banks_train.zip. К релевантному классу относятся сообщения с маркером 1 о любом банке. К нерелевантному классу относятся сообщения с маркером -1.
##Классная работа 1. ОpenСorp (23.02.16)
##Классная работа 2. Perplexity(01.03.16)
##Классная работа 3. ClassWork(15.03.16);
##Классная работа 4. ClassWork(23.02.16)