Как разрешить Google сканировать PDF-файлы, но не индексировать их?

если я правильно понимаю, вы можете указать Google сканировать или не сканировать файлы PDF только через robots.txt. я хочу, чтобы Google сканировал файлы, но не отображал их на страницах результатов поиска.

Это возможно?


person mostwanted    schedule 12.05.2012    source источник
comment
Итак, что Google будет делать с информацией? Гугл: ах! вот ПДФ файл. Мило.. но... что мне с этим делать? Я предоставляю результаты поиска... и вы просите меня НЕ указывать этот файл ни в каких результатах поиска... э-э...   -  person Pure.Krome    schedule 12.05.2012
comment
@Pure.Krome: если это платный ресурс для загрузки, это допустимый ход. В противном случае Google может кэшировать его.   -  person memo    schedule 12.05.2012
comment
Это означает, что Google должен проиндексировать PDF-файл (то есть вернуть его в список результатов), но не делать содержимое доступным из кеша Google?   -  person Daan    schedule 12.05.2012


Ответы (2)


Вы можете добавить директивы robots в любой файл через http-заголовок x-robots-tag. Установив значение noindex, Follow звучит так, как вы хотите.

person Tony McCreath    schedule 12.05.2012

Я не уверен, но разве это: <meta name="robots" content="noindex"> не хорошее решение вашей проблемы?

person memo    schedule 12.05.2012
comment
уверен, я имел в виду ссылку на файл pdf в html. - person memo; 12.05.2012