Tensorflow 2 создает собственный набор данных

Я пытаюсь создать собственный загрузчик набора данных, который загружает ICDAR-Dataset. Моим первым шагом было встроить набор данных в мой загрузчик, как было предложено также здесь в этом посте, но проблема в том, что вам нужно вручную реализовать все приятные функции, которые предлагает класс tenfsoflow-2 «Набор данных».

Моя вторая попытка состояла в том, чтобы создать подкласс Dataset-Class, что-то вроде:

class MyDataset(tf.data.Dataset):
  def __init__(self):
    super(MyDataset, self).init()

  def preprocess_images(self):
    pass

Но проблема в том, что я не нашел никакой документации, что на самом деле делает класс набора данных внутри, единственная реализация, которую я нашел, была этот.

Итак, вопрос в том, знает ли кто-нибудь, как создать собственный «набор данных» в tf2, создав подкласс tf.data.Dataset.

Кстати, я также пробовал tensorflow_datasets, но на самом деле это не сработало, потому что он загружает набор данных и разделяет их вручную, что уже разделено на поезд и тест, а также ICDAr не может быть загружен без регистрации.

Содержимое набора данных ICDAR следующее:

Изображение

Список всех текстов на каждом изображении

Список Боудинг-боксов для каждого текста на каждом изображении

Изображение: @https://rrc.cvc.uab.es/?ch=4 владеет авторскими правами на это изображение. введите здесь описание изображения

Слова и ограничивающие рамки для изображения выше:

377,117,463,117,465,130,378,130,Genaxis Theatre
493,115,519,115,519,131,493,131,[06]
374,155,409,155,409,170,374,170,###
492,151,551,151,551,170,492,170,62-03
376,198,422,198,422,212,376,212,Carpark
494,190,539,189,539,205,494,206,###
374,1,494,0,492,85,372,86,###

Спасибо кто знает как


person arash javanmard    schedule 12.08.2019    source источник
comment
Немного сложно помочь, когда мы не знаем содержимого набора данных. Можете ли вы привести небольшой пример с точки зрения того, что является входом и что вы ожидаете на выходе?   -  person gorjan    schedule 12.08.2019
comment
@gorjan, пожалуйста, проверьте обновленный вопрос   -  person arash javanmard    schedule 12.08.2019