Nutch, ошибка NoSuchElementException после удаления таблицы из Hbase

Я использую nutch для сканирования некоторых сайтов. Однажды я решил очистить все результаты сканирования и просто удалить таблицу «веб-страница» из хранилища Hbase, используя оболочку hbase.

После этого исключения

java.util.NoSuchElementException
at java.util.TreeMap.key(TreeMap.java:1221)
at java.util.TreeMap.firstKey(TreeMap.java:285)
at org.apache.gora.memory.store.MemStore.execute(MemStore.java:125)
at org.apache.gora.query.impl.QueryBase.execute(QueryBase.java:73)
at org.apache.gora.mapreduce.GoraRecordReader.executeQuery(GoraRecordReader.java:68)
at org.apache.gora.mapreduce.GoraRecordReader.nextKeyValue(GoraRecordReader.java:110)
at org.apache.hadoop.mapred.MapTask$NewTrackingRecordReader.nextKeyValue(MapTask.java:531)
at org.apache.hadoop.mapreduce.MapContext.nextKeyValue(MapContext.java:67)
at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:144)
at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:764)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:364)
at org.apache.hadoop.mapred.LocalJobRunner$Job$MapTaskRunnable.run(LocalJobRunner.java:223)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:471)
at java.util.concurrent.FutureTask.run(FutureTask.java:262)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
at java.lang.Thread.run(Thread.java:745)

Задача «внедрить» работает без ошибок, но все остальное просто выдает ошибку (генерация, выборка и т. д.).


person Seldon    schedule 31.01.2015    source источник


Ответы (1)


Проблема была в моих конфигурационных файлах, я просто смешал содержимое nutch-site.xml и hbase-site.xml.

Но это очень странно, такая большая ошибка и ничего в логе.

person Seldon    schedule 01.02.2015