Я совершенно новичок в улье, импала, HBASE. Я делаю приложение для полнотекстового поиска. У меня был болезненный шаг сортировки релевантности с использованием порядка в SQL на платформе оракула. Интересно, если я изменю это в экосистеме хаупа, это поможет или нет. Жаль, что кто-то может помочь с этим. Заранее спасибо.
Сравнение Hive, Impala, HBASE и SQL для заказа по
Ответы (1)
Если вы хотите использовать полнотекстовый поиск в Hadoop, рассмотрите возможность использования Apache Solr. (Поиск Cloudera, если вы используете Cloudera )
person
Santiago Cepas
schedule
11.09.2014
Спасибо, Сантьяго. Вы выполнили полнотекстовый поиск по Solr. Если да, то насколько велика база данных и какова эффективность в Solor?
- person user3768354; 12.09.2014
Я использовал solr с Cloudera и работает очень хорошо. Мы говорим о наборе данных на 100 Гб. Основная проблема в том, что вам нужно переиндексировать при изменении схемы.
- person Santiago Cepas; 07.01.2016