Как работает нормализация и внутренняя оптимизация бустинга? И как это влияет на актуальность?

Я новичок в эластичном поиске. У меня возникли проблемы с пониманием калибровки и масштабирования значений повышения для полей в документе. Например, как мы должны определить значения повышения для поля, чтобы оно работало должным образом. Я также просмотрел некоторые онлайн-блоги и документацию es, там написано, что es выполняет нормализацию и внутреннюю оптимизацию повышающих значений? Как это работает?

Например: если у нас есть теги, заголовок, имя и текстовые поля в нашем документе, как мы должны определить значения повышения для них?

user1620492 13.09.2017 источник

Ответы (1)

arrow_upward
0
arrow_downward

Elasticsearch использует логическую модель для сопоставления документов, а затем модель оценки для определения релевантности (то есть ранжирования). Модель оценки использует оценку TF/IDF в сочетании с некоторыми дополнительными функциями. Эти оценки TF/IDF рассчитываются для каждого совпадающего поля в запросе, а затем объединяются для получения общей оценки для документа. Чтобы разобраться в этом процессе, я предлагаю запустить explain по вашему запросу, чтобы увидеть, как оценка каждого поля влияет на общую релевантность вашего документа.

Как эксперт по вашим данным, вы можете лучше всего определить, какие поля должны в наибольшей степени влиять на релевантность вашего документа. Поиск правильного значения повышения для поля заключается в настройке рычагов до тех пор, пока вы не найдете формулу, которая наилучшим образом соответствует желаемому результату (также, если у вас есть пользователи, здесь может помочь A/B-тестирование).

zachdb86 13.09.2017

Как работает нормализация и внутренняя оптимизация бустинга? И как это влияет на актуальность?

Ответы (1)

Похожие вопросы