Я внимательно изучил ответы Пратика Чоудхури и Робби Веркаммен. Они предоставляют ссылку на веб-документы, содержащие список возможных текстовых фильтров, которые можно использовать в форме поиска Google. Несмотря на то, что это интересно, они не дают ответа на вопрос. Поэтому я много изучал проблему и нашел следующее решение.
Предположим, вам нужно сделать HTTP-вызов una tantum (например, с помощью PHP-класса, запускаемого через CRON один раз в месяц) в Google Search, чтобы получить результаты поиска для определенного строкового запроса, например. все страницы с некоторыми словами (например, «привет» и «мир») на вашем веб-сайте (например, mywebsite.com), вы можете выполнить HTTP-вызов get по следующему адресу:
http://www.google.com/search?q=hello+world+site:mywebsite.com
Параметр q
может содержать весь поисковый запрос, однако Google определил список параметров для фиктивного доказательства.
Обратите внимание, что вместо этого оператор AND
может быть представлен параметром as_q
.
Чтобы получить результаты страницы с единицей между «привет» и «мир» (т.е. и ИЛИ), необходимо изменить параметр запроса «q» следующим образом:
q=hello+OR+world
в то время как более компактное представление использует параметр as_oq
:
as_oq=hello+world
Если искать точную фразу «hello world», параметр q
будет таким:
q="hello+world"
в то время как, опять же, другое компактное представление использует параметр as_epq
:
as_epq=hello+world
Если искать все результаты, не содержащие слов «привет» и «мир», параметр q
будет таким:
q=-hello+-world
в то время как, опять же, другое компактное представление использует параметр as_eq
:
as_eq=hello+world
Конечно, as_q
, as_oq
, as_epq
, as_eq
и т. д. можно, как обычно, объединить в уникальный поисковый запрос (например, с помощью символа &
). Таким образом, например, я могу искать оба слова «привет» и «слово» плюс одно между «программированием» и «кодом», как показано здесь:
q=hello+world&as_oq=programming+code
Можно выполнить поиск определенного домена (опять же, mydomain.com) следующим образом:
as_sitesearch=mydomain.com
Однако если вы хотите исключить определенный домен (например, из-за того, что он является источником спама), вы должны вернуться к стандартной записи. Например.:
q=hello+-site:mydomain.com
вернуть все страницы со словом "привет", которые не находятся на сайте mydomain.com.
Чтобы получить файл определенного типа, например. pdf, вы можете использовать as_filetype
:
as_filetype=pdf
Можно использовать более сложный параметр поиска, как указано в документах службы поддержки Google. . Например, чтобы получить результаты с синонимом слова, просто используйте оператор ~
перед словом, например.
q=~hello
Более того, если вы хотите использовать подстановочные знаки, например. чтобы получить все точные фразы, которые начинаются с «привет» и заканчиваются на «мир», вы должны использовать оператор *
:
q="hello+*+world"
который, вероятно, вернет что-то вроде: «привет миру» и «привет, милый мир».
Можно также искать определенные слова в заголовке страницы или в URL-адресе страницы, используя следующие ключевые слова (см. google" rel="nofollow noreferrer">здесь для более подробной информации):
- титул
- allintitle
- нарушать
- аллинурл
Например, следующее возвращает все страницы s.a. оба слова «привет» и «мир» находятся в URL-адресе:
q=allinurl:hello+world
Для языка страницы графического интерфейса Google (не одного из результатов) необходимо вставить в строку запроса языковую строку (например, en
для английского, fr
для французского, it
для итальянского и т. д.) в параметр hl
. Другими словами, если выполнить поиск в английской версии Google, строка запроса станет следующей:
http://www.google.com/search?hl=en&q=hello+world+site:mywebsite.com
Чтобы выбрать определенный язык, например. Итальянец, используйте параметр запроса lr
:
lr=lang_it
Также можно выбрать страницы, опубликованные в определенном географическом регионе, с помощью параметра cr
. Например, чтобы найти все страницы, опубликованные в Италии:
cr=countryIT
person
JeanValjean
schedule
07.04.2013