В репозитории Machine-Learning папке Scikit-Learn лежат еще 6 папок:
-
Regression(простая регрессия), в которой находятся файлы:
- файл Iris.csv - набор данных Iris (https://en.wikipedia.org/wiki/Iris_flower_data_set);
- regression.py - Пример обучения с учителем: простая регрессия;
- визуализация набора данных.png - график визуализации данных с помощью библиотеки Seaborn;
- простая линейная регрессия.png - результаты обучения с учителем модели методом простой регрессии, точки - исходные данные, прямая - обученная модель;
-
Classification of dataset(классификация набора данных) содержит:
- файл Iris.csv - набор данных Iris (https://en.wikipedia.org/wiki/Iris_flower_data_set);
- classification of dataset.py - Пример обучения с учителем: классификация набора данных.
-
Downsizing dataset(понижение разсерности набора данных) включающая следующие файлы:
- файл Iris.csv - набор данных Iris (https://en.wikipedia.org/wiki/Iris_flower_data_set);
- визуализация набора данных.png - график визуализации данных с помощью библиотеки Seaborn;
- downsizing dataset.py - пример обучения без учителя: понижение размерности набора данных, с использованием метода k-средних;
- проекция данных на двумерное пространство.png - график проекции набора данных.
-
Clustering(кластеризация) содержащая:
- файл Iris.csv - набор данных Iris (https://en.wikipedia.org/wiki/Iris_flower_data_set);
- визуализация набора данных.png - график визуализации данных с помощью библиотеки Seaborn;
- clustering.py - обучение без учителя: кластеризация набора данных, с использованием алгоритма кластеризации под названием смесь Гауссовых распределений;
- кластеризация методом k-средних.png - результат кластреизации методом k-средних.
-
Анализ рукописных цифр содержит:
- анализ рукописных цифр.py - код программы оптического распознавания рукописных цифр двумя алгоритмами обучения: понижение размерности(алгоритм обучения на безе многообразий Isomap) и классификация(Гауссова наивная байесовская модель);
- данные рукописных цифр.png - набор переформатированных цифр встроенных в библиотеку Scikit-Learn;
- Isomap - вложение набора данных цифр.png - график пониженных измерений(двумерных);
- матрица различий.png - матрица различий, демонстрирующая частоты ошибочных классификаций;
- Данные, показывающие правильные(зеленым) и ошибочные(красным).png.
-
Проверка модели:
- файл Iris.csv - набор данных Iris (https://en.wikipedia.org/wiki/Iris_flower_data_set);
- отложенный набор данных(holdout sets).py - проверка качества выбранной модели способом holdout sets;
- перекрестная проверка(cross-validation).py - проверка качества выбранной модели способом cross-validation;
- подпапка кривые проверки:
- Кривые проверки.py - программый код
- Аппроксимация набора данных.PNG
- Перекрестно проверенная оптимальная модель.PNG
- подпапка кривые обучения: