При создании поисковой системы для моего сайта следует ли мне использовать Yahoo BOSS?

Я хотел бы создать поисковую систему для своего веб-сайта для обмена фотографиями. Поисковой системе просто нужно будет вернуть результаты на основе слов-тегов. Фотографии будут отсортированы по популярности, новизне или по сочетанию этих двух факторов.

Мне было любопытно, могу ли я просто использовать API Yahoo BOSS для этого вместо того, чтобы настраивать свою собственную поисковую систему (используя lucene, solr и т. д.).

Я немного просмотрел документацию, но не смог понять, позволит ли API BOSS мне импортировать весь мой индекс результатов (вместо того, чтобы просто искать то, что уже есть в индексе yahoo), а затем иметь возможность обновлять элементы в поисковом индексе с «тегами», поскольку пользователи отмечают фотографии на сайте.

Есть ли у других разработчиков опыт создания чего-то подобного с Yahoo BOSS?


person makeee    schedule 27.12.2009    source источник


Ответы (1)


Насколько я знаю, BOSS позволит вам искать все, что паук yahoo подбирает на вашем сайте, когда он ползает. Если весь ваш контент доступен для просмотра, т. е. доступен для обнаружения, этого может быть достаточно для ваших целей. У этого есть большое преимущество, требующее очень мало работы.

Я не думаю, что вы можете загружать или импортировать контент или индексы в BOSS/yahoo, поэтому, если ваш контент не может быть найден с помощью сканирования, BOSS не может быть решением.

Если BOSS не урежет, вам нужно внедрить собственную поисковую платформу. У вас есть два основных варианта:

1) Используйте индекс, например Lucene. Однако, если у вас не МНОГО контента, варианта 2 вполне может быть достаточно.

2) Индексируйте соответствующие столбцы в своей базе данных. Если вы используете MySQL, взгляните на Полнотекстовый поиск

Вариант 2 требует гораздо меньше работы, чем вариант 1. Оба имеют преимущество перед BOSS в том, что вы можете ограничить свой поиск указанными/желаемыми полями. Реализация собственного поиска также означает, что ваши результаты всегда будут актуальными.

надеюсь, это поможет

person Richard H    schedule 27.12.2009
comment
Есть 300 000 элементов для поиска. Я предполагаю, что полнотекстовый поиск поля тегов (с тегами, разделенными запятыми) будет довольно медленным. Правильный? - person makeee; 28.12.2009
comment
Я не думаю, что 300 КБ - это много, если вы ищете только одно поле/столбец тегов. По сути, индексируя столбец, MySQL делает почти то же, что и Lucene, только внутренне. Однако это должно быть довольно просто проверить, поэтому, возможно, стоит сделать это, прежде чем ломать большие пушки. - person Richard H; 28.12.2009