Как работает нормализация и внутренняя оптимизация бустинга? И как это влияет на актуальность?

Я новичок в эластичном поиске. У меня возникли проблемы с пониманием калибровки и масштабирования значений повышения для полей в документе. Например, как мы должны определить значения повышения для поля, чтобы оно работало должным образом. Я также просмотрел некоторые онлайн-блоги и документацию es, там написано, что es выполняет нормализацию и внутреннюю оптимизацию повышающих значений? Как это работает?

Например: если у нас есть теги, заголовок, имя и текстовые поля в нашем документе, как мы должны определить значения повышения для них?


person user1620492    schedule 13.09.2017    source источник


Ответы (1)


Elasticsearch использует логическую модель для сопоставления документов, а затем модель оценки для определения релевантности (то есть ранжирования). Модель оценки использует оценку TF/IDF в сочетании с некоторыми дополнительными функциями. Эти оценки TF/IDF рассчитываются для каждого совпадающего поля в запросе, а затем объединяются для получения общей оценки для документа. Чтобы разобраться в этом процессе, я предлагаю запустить explain по вашему запросу, чтобы увидеть, как оценка каждого поля влияет на общую релевантность вашего документа.

Как эксперт по вашим данным, вы можете лучше всего определить, какие поля должны в наибольшей степени влиять на релевантность вашего документа. Поиск правильного значения повышения для поля заключается в настройке рычагов до тех пор, пока вы не найдете формулу, которая наилучшим образом соответствует желаемому результату (также, если у вас есть пользователи, здесь может помочь A/B-тестирование).

person zachdb86    schedule 13.09.2017