Marklogic: Индекс диапазона элементов VS Словарь слов элемента

У меня есть элемент, содержащий текстовое значение, и мне нужно иметь возможность искать текстовое содержимое в нем из приложения с графическим интерфейсом. Я читал документацию по ML 5.0 и увидел, что могу использовать для этого элемента лексику Element Range Index или Element Word. Я хотел бы теперь, какой из них мне следует использовать, учитывая тот факт, что мне нужно

  1. Поиск по 10 миллионам документов, содержащих этот элемент
  2. Быстрый поиск
  3. используйте 1_
  4. Используйте параметры поиска там, где я ищу с starts-with и содержит параметры.

Ценю любую помощь.

Гарри


person Harry    schedule 02.04.2013    source источник
comment
Можете ли вы опубликовать варианты / запросы, которые вы используете? Большая часть оптимизации - это запрос, а не только индекс.   -  person wst    schedule 02.04.2013


Ответы (2)


Никаких дополнительных указателей диапазонов или лексиконов не требуется. При поиске текста элемента с cts:element-word-query используется универсальный индекс. Самый эффективный способ - это «быстрый поиск слов по элементам», который по умолчанию включается при создании новой базы данных.

Дальнейшее чтение:

http://docs.marklogic.com/guide/search-dev

http://docs.marklogic.com/guide/admin/text_index

person mblakele    schedule 02.04.2013
comment
Я только что заметил, что вы упомянули, что начинается с и содержит соответствие, поэтому вам также понадобится поддержка подстановочных знаков. Взгляните на docs.marklogic.com/guide/search-dev/wildcard За рекомендациями по поддержке тех. В некоторых ситуациях может помочь словарный запас элементарных слов. - person mblakele; 02.04.2013

Одно заметное различие между element range index и element word lexicon состоит в том, что range index будет хранить строковое значение элемента ("search terms"), а word lexicon будет хранить отдельные токены слов ("search", "terms"). Каждый из них упрощает различные типы запросов.

Если вы опубликуете более подробный пример того, как вы хотите искать элемент, будет легче дать рекомендации по стратегии запроса / словаря.

person wst    schedule 02.04.2013