Я прохожу курс информационного поиска, где мы начали с «логического поиска».
Я столкнулся со следующим вопросом (взято из Стэнфордской книги по информационному поиску):
Для конъюнктивного запроса гарантируется ли оптимальная обработка списков сообщений в порядке их размера? Объясните почему/почему нет.
Дается следующее объяснение:
Порядок не гарантируется оптимальным. Рассмотрим три термина с размерами списка постов s1=100, s2=105 и s3=110. Предположим, что пересечение s1 и s2 имеет длину 100, а пересечение s1 и s3 — длину 0. Упорядочивание s1, s2, s3 требует 100+105+100+110=315 шагов по спискам проводок. Порядок s1, s3, s2 требует 100+110+0+0=210 шагов по спискам проводок.
Может ли кто-нибудь объяснить вышеизложенное?
Например: В "100+105+100+110"; что означает 100? Это размер s1 или пересечение между s1 и s2? (105 и 110 довольно очевидны).