COBOL - это язык программирования, а не формат файла. Если вам нужно экспортировать файлы, созданные программами COBOL, вы можете использовать ту же технику, как если бы эти файлы были созданы на C, C ++, Java, Perl, PL / I, Rexx и т. Д.
В общем, у вас будет три разных источника данных: плоские файлы, файлы VSAM и СУБД, такая как DB2 или IMS.
В DMBS есть утилиты экспорта для копирования данных в плоские файлы. Имейте в виду, что данные в DB2, скорее всего, будут нормализованы, и поэтому вам, вероятно, понадобится содержимое связанных таблиц, чтобы разобраться в данных.
Файлы VSAM можно экспортировать в плоские файлы через IDCAMS утилита.
Я настоятельно рекомендую вам преобразовать файлы в текстовый формат, прежде чем переносить их в другой ящик с другой кодовой страницей. Попытка иметь дело со смешанным текстом (кодовая страница которого должна быть переведена) и двоичным (кодовая страница которого не должна быть переведена, но которая, вероятно, должна быть преобразована с прямого порядка байтов в прямой порядок байтов) сложнее, чем выполнить преобразование заранее.
Преобразование, вероятно, можно выполнить с помощью утилиты SORT на мэйнфрейме. Утилиты SORT мэйнфрейма, как правило, имеют обширные функции обработки данных. Есть и другие механизмы, которые вы можете использовать (другие утилиты, собственный код, написанный на языке по вашему выбору, приобретенные пакеты), но именно это мы обычно делаем в этих обстоятельствах.
После преобразования плоских файлов таким образом, что все данные являются текстовыми, вы можете передавать их в свои ящики Hadoop через FTP, SFTP или FTPS.
Это не исчерпывающий обзор темы, но это поможет вам начать.
person
cschneid
schedule
28.02.2013