У меня есть конвейер StreamSets, где я читаю из удаленной базы данных SQL Server, используя компонент JDBC в качестве источника, и помещаю данные в Hive и озеро данных Kudu.
Я столкнулся с некоторыми проблемами с типом двоичных столбцов, поскольку в Impala нет поддержки двоичного типа, который я использую для доступа как к Hive, так и к Kudu.
Я решил преобразовать столбцы типа Binary (которые передаются в конвейере как тип Byte_Array) в String и вставить их вот так.
Я попытался использовать элемент преобразователя типов полей для преобразования всех типов Byte_Array в String, но это не сработало. Поэтому я использовал компонент Jython для преобразования всех типов arr.arr в String. Он работает нормально, пока я не получил значение Null в этом поле, поэтому тип Jython был None.type, и я не смог обнаружить тип Byte_Array и не смог преобразовать его в String. Поэтому я не мог вставить его в Куду.
Любая помощь, как получить типы полей записи StreamSets внутри Jython Evaluator? Или какие-либо предлагаемые решения проблемы, с которой я столкнулся?