На этой неделе у меня возникла проблема с индексом Solr: http://lucene.472066.n3.nabble.com/corrupted-index-in-slave-td4054769.html,
Сегодня эта ошибка начала происходить постоянно почти для каждого запроса, и я создал проблему JIRA, потому что думал, что это ошибка https://issues.apache.org/jira/browse/SOLR-4707
Как вы можете прочитать, в конце концов это произошло из-за сбоя в репликации Solr master-slave, и теперь я не знаю, стоит ли нам думать о переходе на SolrCloud, поскольку репликации Solr master-slave, похоже, не подходят для нашей требования:
- размер индекса: ~20 миллионов документов, ~9 ГБ
- ~1200 обновлений/мин
- ~10000 запросов/мин (распределено по 2 ведомым устройствам) MoreLikeThis, RealTimeGet, TermVectorComponent, SearchHandler
Буду признателен, если кто-нибудь поможет мне ответить на следующие вопросы:
- Было бы целесообразно перейти на SolrCloud? Повлияет ли это на производительность репликации?
- В таком случае, что будет иметь лучшую производительность? поддерживать копию индекса на каждом сервере или использовать серверы сегментов?
- Сколько сегментов и реплик вы бы посоветовали для обеспечения высокой доступности?
С уважением,
Виктор