Я всегда запрещал Google индексировать мой сайт с помощью файла robots.txt. Недавно я прочитал статью сотрудника Google, в которой он заявил, что вы должны делать это с помощью метатегов. Означает ли это, что Robots.txt не будет работать? Поскольку я работаю с CMS, мои возможности очень ограничены, и гораздо проще использовать файл robots.txt. Мой вопрос в том, что самое худшее может произойти, если я продолжу использовать файл robots.txt вместо метатегов.
Noindex в файле robots.txt
Ответы (2)
Вот разница простыми словами:
Файл robots.txt управляет сканированием. Он инструктирует роботов (также известных как пауки), которые ищут страницы для сканирования, чтобы «держаться подальше» от определенных мест. Вы помещаете этот файл в корневой каталог вашего сайта.
Тег noindex управляет индексацией. Он сообщает паукам, что страница не должна быть проиндексирована. Вы помещаете этот тег в код соответствующей веб-страницы.
Используйте файл robots.txt, если вам нужен контроль на уровне каталога или на вашем сайте. Однако имейте в виду, что роботы не обязаны следовать этим директивам. Большинство из них, например Googlebot, но безопаснее держать любую особо конфиденциальную информацию вне общедоступных областей сайта.
Как и в случае с файлами robots.txt, теги noindex исключат страницу из результатов поиска. Страница по-прежнему будет сканироваться, но не будет проиндексирована. Используйте эти теги, если вы хотите управлять на уровне отдельной страницы.
В стороне от разницы между сканированием и индексированием: сканирование (через пауков) — это то, как паук поисковой системы отслеживает ваш сайт; результаты сканирования попадают в индекс поисковой системы. Хранение этой информации в индексе ускоряет получение релевантных результатов поиска — вместо сканирования каждой страницы, связанной с поиском, для оптимизации скорости выполняется поиск в индексе (базе данных меньшего размера).
Если бы индекса не было, поисковая система просматривала бы каждый бит данных или информации, связанной с поисковым запросом, и у всех нас было бы время приготовить и съесть пару бутербродов, ожидая отображения результатов поиска. Индекс использует пауков, чтобы поддерживать свою базу данных в актуальном состоянии.
Вот пример тега:
<meta name="robots" content="noindex,follow"/>
Теперь, когда вы прочитали и поняли приведенную выше информацию, я думаю, вы сможете ответить на свой вопрос самостоятельно;)
Действительно, была возможность GoogleBot, которая позволяла использовать:
- без индекса
- Не следует
- Задержка сканирования
Но видно в GoogleBlog-News они больше не будут поддерживать эти (используемые 0,001%) команды с сентября 2019 года. Таким образом, вы должны использовать только метатеги на своей странице, чтобы быть в безопасности в будущем.