Я пытаюсь создать собственный загрузчик набора данных, который загружает ICDAR-Dataset. Моим первым шагом было встроить набор данных в мой загрузчик, как было предложено также здесь в этом посте, но проблема в том, что вам нужно вручную реализовать все приятные функции, которые предлагает класс tenfsoflow-2 «Набор данных».
Моя вторая попытка состояла в том, чтобы создать подкласс Dataset-Class, что-то вроде:
class MyDataset(tf.data.Dataset):
def __init__(self):
super(MyDataset, self).init()
def preprocess_images(self):
pass
Но проблема в том, что я не нашел никакой документации, что на самом деле делает класс набора данных внутри, единственная реализация, которую я нашел, была этот.
Итак, вопрос в том, знает ли кто-нибудь, как создать собственный «набор данных» в tf2, создав подкласс tf.data.Dataset.
Кстати, я также пробовал tensorflow_datasets, но на самом деле это не сработало, потому что он загружает набор данных и разделяет их вручную, что уже разделено на поезд и тест, а также ICDAr не может быть загружен без регистрации.
Содержимое набора данных ICDAR следующее:
Изображение
Список всех текстов на каждом изображении
Список Боудинг-боксов для каждого текста на каждом изображении
Изображение: @https://rrc.cvc.uab.es/?ch=4 владеет авторскими правами на это изображение.
Слова и ограничивающие рамки для изображения выше:
377,117,463,117,465,130,378,130,Genaxis Theatre
493,115,519,115,519,131,493,131,[06]
374,155,409,155,409,170,374,170,###
492,151,551,151,551,170,492,170,62-03
376,198,422,198,422,212,376,212,Carpark
494,190,539,189,539,205,494,206,###
374,1,494,0,492,85,372,86,###
Спасибо кто знает как