Мне нужно распознавать цифры на изображении из видеопотока и есть еще несколько вещей, которые должны облегчить распознавание:
1) это фиксированный шрифт 6x8, все символы одинаковой ширины
2) я знаю точное положение цифр цифры, они всегда прямоугольные, не повернуты/перекошены/масштабированы, но возможны некоторые искажения из-за сбоя радиопередачи.
3) Это только цифры и .
4) фон цифр получерный (50 % непрозрачность)
Я пробовал tesseract v2 и v3, но обертки .NET не идеальны, и ошибка распознавания была очень большой, даже если я тренировался с пользовательским шрифтом, насколько я понимаю, это из-за небольшого разрешения.
Я сам сделал очень простой алгоритм, превратив изображение в черно-белое и подсчитав совпадающие пиксели между исходным изображением шрифта и изображением из потока, он работает лучше, чем tesseract, но я думаю, что более сложный алгоритм будет работать лучше.
Я пытался обучить AForge с помощью ActivationNetwork с BackPropagationLearning, и он не сошелся (эта статья первая часть, если мне не нужно масштабирование и несколько шрифтов http://www.codeproject.com/Articles)./11285/Neural-Network-OCR, насколько я понимаю, код в статье предназначен для более старой версии AForge), плохо то, что этот проект больше не поддерживается, форум закрыт и гугл группы я так понимаю тоже.
Я знаю, что есть порт OpenCV для .NET, насколько я вижу, у него разные сетевые подходы, чем у AForge, поэтому вопрос в том, какой подход подойдет лучше всего.
Итак, есть ли какая-либо платформа .NET, которая поможет мне в этом, и если она поддерживает более одной реализации нейронной сети, какая реализация подойдет лучше всего?