Выделение учебных групп на основе социального графа и информации из профилей пользователей социальной сети ВКонтакте.
Определение возраста и места проживания пользователей.
Для построения базы профилей необходимо использовать sql и python скрипты в следующем порядке:
- db_structure.sql - создание БД MySQL
- db_data.sql - заполнение таблиц БД, необходимых для построения базы профилей
- get_countries.py - получение списка всех стран
- get_regions.py - получение списка регионов для каждой страны
- get_cities.py - получение списка городов для каждой страны
- get_users.py - получение и обработка профилей
Для определения общего количества пользователей используется python-модуль count_users.
Модули:
- get_student_graph - получение социального графа пользователя
- get_student_group - выделение учебной группы пользователя
Пример использования модулей представлен в student_group_sample.py.
Для получения предполагаемых одногруппников необходимо использовать скрипты в следующем порядке:
- insert_school_students.sql и insert_university_students.sql - заполнение таблиц БД идентификаторами школьников и студентов соответственно
- get_school_students_groups.py и get_university_students_groups.py - выделение учебных групп для 1000 случайных школьников и студентов соответственно
Определение возраста и места проживания пользователей по полученным спискам одногруппников:
- predict_age.py - определение возраста
- predict_city.py - определение города проживания
- predict_region.py - определение региона проживания