В учебнике по базовому распознаванию символов показано, как извлекать отдельные символы / цифры из изображений с помощью библиотеки scikit-image, которая представляет собой обработку изображений в Python, и прогнозировать изображение с помощью scikit- Learn , машинное обучение на Python, для классификации и прогнозирования изолированных изображений символов / цифр.
Цели
- Написание базовой программы распознавания символов с использованием языка программирования Python.
- Извлекайте отдельные символы / цифры из изображений.
- Создайте пиксельный метод как вектор признаков и сохраните в текстовый файл.
- Создайте первую модель и прогноз, используя классификатор ближайшего центроида.
- Использование других методов машинного обучения, таких как k-ближайший сосед (kNN), дерево решений, метод ансамбля, многослойный персептрон (MLP) и вспомогательная векторная машина (SVM) для создания модели и прогнозирования изолированных изображений символов / цифр.
- Настройка параметров с использованием методов поиска по сетке.
Шаг за шагом
- Обрезать символы / цифры
- Создать вектор признаков и простую классификацию
- Создать модель классификатора kNN
- Создать дерево решений и модели ансамблевого классификатора
- Создать модель классификатора MLP и настроить параметры с помощью методов поиска по сетке
- Создать модель классификатора SVM и настроить параметры с помощью методов поиска по сетке
- Пример набора данных MNIST
Необходимые библиотеки Python
- scikit-изображение
- scikit-learn
- наука
- numPy
- matplotlib
установить библиотеку через pip
pip
- это система управления пакетами, используемая для установки и управления программными пакетами, написанными на Python.
$ sudo pip install scikit-image
$ sudo pip install -U scikit-learn
$ sudo pip install matplotlib
$ sudo pip install numpy
$ sudo pip install scipy
$ sudo pip install matplotlib