Мы работаем над переносом данных с MySQL на Cassandra. Мы выгрузили данные MySQL в формат CSV и преобразовали их в Cassandra CSV и использовали кодировку UTF-8. Когда мы импортируем Cassandra CSV, он отлично работает для одного кластера. Но для того же CSV-файла выдается следующее исключение в другом кластере для той же версии Cassandra (2.2.4)
message="org.apache.cassandra.serializers.MarshalException: Invalid UTF-8 bytes 56bc71d9"> Aborting import at record #5. Previously inserted records are still present, and some records after that may be present as well.
Он постоянно показывает исключения для разных записей. Номера записей и значения байтов не согласованы.
Мы использовали команду ниже для импорта файла CSV
copy <TABLE> FROM <FILE> with DELIMITER = '\t' AND NULL = 'NULL' AND QUOTE = '\"' AND ESCAPE = '\\';
Мы проверили некоторые решения, но большинство из них предлагают команду «ПРИНЯТЬ». Поскольку мы используем Cassandra 2.2.4, у нас нет Cassandra-Cli для проверки команды.
Есть ли какие-либо предложения проверить проблему или какие-либо возможные случаи, когда эта проблема может возникнуть.