Я прочитал несколько вопросов о stackoverflow о внимании к OCR, и большинство из них касается деталей реализации определенного шага. Что я хотел знать, так это конвейер для тонкой настройки этой модели на нашем собственном наборе данных.
Насколько я знаю, шаги должны быть такими:
0) Должны ли мы сначала загрузить набор данных FSNS ?? Я попытался обойти этот шаг и попробовать выполнить вывод только на одном изображении, но он всегда выдает ошибку: «ImportError: нет модуля с именем« fsns ». Поэтому мне интересно, исчезнет ли эта ошибка после того, как я настрою свой собственный набор данных.
1) Хранить наши данные в том же формате, что и FSNS. (Ссылки по этой теме: Как создать набор данных в том же формате, что и набор данных FSNS?, как создать сокращенный набор данных для Google Tensorflow Attention OCR? )
2) Загрузите предварительно обученную контрольную точку (http://download.tensorflow.org/models/attention_ocr_2017_08_09.tar.gz)
3) Каким-то образом измените «model.py» в соответствии с вашими целями.
4) Каким-то образом измените «train.py», чтобы обучить свой собственный модуль с использованием обслуживания тензорного потока.
Я все еще нахожусь на ранней стадии (создание собственного набора данных) в этом проекте и не понимаю, как это сделать и что будет на следующем этапе.