Интересно, что мы оцениваем инструменты ETL для предварительной обработки данных выписок (например, счетов за коммунальные услуги, выписки из банка) для печати.
Некоторые данные поступают в один плоский файл с разными типами записей.
например тип записи с «01» в качестве первого поля будет адресными данными. В нем будут поля имени и адреса. Тип записи с «02» будет сводными данными, с балансами и итогами. Запись типа «03» будет отдельной строкой в выписке.
Каждый оператор будет иметь одну запись 01 и 02 и несколько записей 03. Я мог бы предварительно проанализировать файл и разделить его на 3 файла для загрузки в таблицу, но это далеко не идеально.
Мы берем файл и выполняем с ним несколько манипуляций (например, добавляем еще пару полей в адресную запись и, возможно, делаем некоторое суммирование / проверку), а затем отправляем файл почти в том же формате (но с дополнительными полями добавлено) в нашу программу компоновки для печати.
Как бы вы это сделали в SSIS?