Я хотел бы знать, есть ли какие-либо советы и рекомендации по поиску ошибок в заданиях аналитики озера данных. Сообщение об ошибке в большинстве случаев кажется не очень подробным.
При попытке извлечь из файла CSV я часто получаю такую ошибку
Сбой вершины вызвал быстрое прерывание задания. Ошибка вершины: SV1_Extract[0] с ошибкой >: ошибка кода пользователя вершины.
Ошибка вершины с отказоустойчивой ошибкой
Кажется, что эта ошибка возникает при попытке преобразовать столбцы в указанные типы.
Метод, который я нашел, состоит в том, чтобы извлечь все столбцы в строку, а затем выполнить SELECT, который попытается преобразовать столбцы в ожидаемый тип. Выполнение этих столбцов по столбцам может помочь найти конкретный столбец по ошибке.
@data =
EXTRACT ClientID string,
SendID string,
FromName string,
FROM "wasb://..."
USING Extractors.Csv();
//convert some columns to INT, condition to skip header
@clean =
SELECT Int32.Parse(ClientID) AS ClientID,
Int32.Parse(SendID) AS SendID,
FromName,
FROM @data
WHERE !ClientID.StartsWith("ClientID");
Можно ли также использовать что-то вроде TryParse для возврата нулевых значений или значений по умолчанию в случае ошибки синтаксического анализа вместо сбоя всего задания?
Спасибо