Исключение org.apache.cassandra.serializers.MarshalException в cassandra 2.2.4

Мы работаем над переносом данных с MySQL на Cassandra. Мы выгрузили данные MySQL в формат CSV и преобразовали их в Cassandra CSV и использовали кодировку UTF-8. Когда мы импортируем Cassandra CSV, он отлично работает для одного кластера. Но для того же CSV-файла выдается следующее исключение в другом кластере для той же версии Cassandra (2.2.4)

message="org.apache.cassandra.serializers.MarshalException: Invalid UTF-8 bytes 56bc71d9">
Aborting import at record #5. Previously inserted records are still present, and some records after that may be present as well.

Он постоянно показывает исключения для разных записей. Номера записей и значения байтов не согласованы.

Мы использовали команду ниже для импорта файла CSV

copy <TABLE> FROM <FILE> with DELIMITER = '\t' AND NULL = 'NULL' AND QUOTE = '\"' AND ESCAPE = '\\';

Мы проверили некоторые решения, но большинство из них предлагают команду «ПРИНЯТЬ». Поскольку мы используем Cassandra 2.2.4, у нас нет Cassandra-Cli для проверки команды.

Есть ли какие-либо предложения проверить проблему или какие-либо возможные случаи, когда эта проблема может возникнуть.


person Chaity    schedule 15.02.2016    source источник
comment
Есть ли внешний плагин для cassandra?   -  person Ashraful Islam    schedule 17.02.2016
comment
Спасибо за ваш комментарий. Да, для поиска мы использовали cassandra-lucene-index 2.2.4.1 (совместимый с Cassandra 2.2.4).   -  person Chaity    schedule 17.02.2016


Ответы (1)


В cassandra lucene index 2.2.4.1 есть проблема с этим, которую я отправил.
Они уже решили ее.
Просто обновите свой код lucene index
Класс com.stratio.cassandra.lucene.service.RegularCellsMapper< br> В методе Columns columns(ColumnFamily columnFamily)
добавьте приведенный ниже код после for (Cell cell : columnFamily) {

if (!cell.isLive()) {
    continue;
}
person Ashraful Islam    schedule 17.02.2016