Количество страниц, которые хочет просканировать поисковик Google. Этот параметр основывается на популярности страниц ресурса и актуальности контента в индексе поисковика. Небольшая ошибка при настройке пути по сайту (хлебных крошек) может вылиться в серьезную проблему, если как увеличить краулинговый бюджет её вовремя не исправить. Нюанс заключается в последнем разделе из цепочки, который не должен быть кликабельным. Если оставить последний элемент пути с ссылкой на текущий раздел, то у сайта появляется циклическая ссылка, сильно расходующая лимиты робота на переобход.
Можно ли повлиять на поисковые системы, чтобы увеличить это число? Ниже мы рассмотрим основные средства оптимизации лимита обхода страниц сайта поисковыми роботами. Краулинговый бюджет (Crawl Budget) — это количество страниц сайта, которое сканирует краулер поисковых систем. После сканирования страницы, релевантные, по мнению бота, запросам пользователей, индексируются.
Как посчитать краулинговый бюджет: 3 простых шага
Речь идёт о страницах сортировки, фильтрации, внутреннем поиске и т.п. Часто во время аудита можно видеть, что в индекс попадают страницы сравнения товаров и пользовательские сессии вообще – вплоть до содержимого «Корзины». Речь идет о том, что каждый фильтр – отдельная посадочная страница, которую можно успешно продвигать в поисковой выдаче. Но не все варианты фильтров могут иметь хорошую частотность, но при индексации тратят краулинговый бюджет. Чтобы избежать этой проблемы, настройте CMS, установив готовые плагины, которые принудительно удаляют дубли. Обязательно проработайте файл robots.txt, закрыв в нем от индексации все дежурные страницы (например, директории админки, страницы входа, формы, корзины и т.д.).
Далеко не каждая CMS позволяет создавать карту сайта в соответствии с вашими планами, и туда может попасть много мусора. Хуже того, некоторые CMS вообще не умеют такие карты сайта создавать. В таких случаях используются сторонние плагины или даже ручная загрузка карты сайта, сформированной каким-то ПО или внешним сервисом. Процесс краулинга лучше описан для роботов Google благодаря тому же Гэри Иллису (Gary Illyes).
Что такое краулинговый бюджет
Это нормально, когда ваш ресурс небольшой или вы регулярно проводите оптимизацию другими методами. Бюджет краулинга – это предел каждого сайта по количеству сканирования. Максимальное число страниц, которые могут быть проиндексированы роботом в определенный промежуток времени.
На основании это квоты будут проверяться страницы во время очередного посещения краулера. Органическая выдача формируется на основании ранжирования тех страниц, которые попали в поиск по https://deveducation.com/ определённым ключевым вхождениям. Чтобы новая страница попала в индекс, её должен проверить и оценить внутренний алгоритм, а он выносит решения на основании информации, собранной ботами.
комментария к статье “17 советов как увеличить краулинговый бюджет”
И если несколько страниц, которые были откорректированы, можно добавить на переобход вручную. То при внесении изменений на всём сайте приходится ждать полного переобхода по несколько месяцев. Поэтому остро становится вопрос об увеличении краулингового бюджета.
Для поискового робота сайт может находиться сразу на нескольких адресах. Если перенаправление не настроено, то главное зеркало определяется поисковиками автоматически. В таком случае, управление краулинговым бюджетом может усложниться. Немного сложнее обстоят дела с 404 кодом – страница не найдена. Если возвращается 404, то это сигнал боту о том, что возможно страница появится позже, поэтому он периодически будет ее посещать. Если на сайте присутствует много удаленных страниц, но возвращающих 404 код, то лимиты будут тратиться в больших количествах.
Лучше всего снять с неё активную ссылку, чтобы она работала только как навигация, показывая посетителю, где именно он находится в данный момент. Но можно вовсе её убрать, юзабилити от этого не пострадает. Здесь можно учесть разницу в ранжировании сайта в Яндекс и Google. Яндекс больше ценит объёмные сайты, даже в ущерб качеству контента. Используйте принципы плоской структуры сайта, чтобы важные страницы были как можно ближе к главной. Горизонтальная, «плоская» структура намного предпочтительнее вертикальной.
- Краулинговый бюджет сочетает в себе скорость сканирования и краулинговый спрос, т.е.
- Сервис видит, какие страницы уже просканированы — это и будет искомый показатель.
- Сохранить моё имя, email и адрес сайта в этом браузере для последующих моих комментариев.
- Соответственно, нет необходимости загружать повторно контент, который уже есть в кэше и индексе.
- Если показатель краулингового бюджета оказался меньше 3, то у вас хороший уровень краулингового бюджета.
Если сайт небольшой – то с логами можно работать даже в Notepad++. А вот попытка открыть лог большого интернет-магазина «положит» ваш ПК на лопатки. В этом случае лучше использовать соответствующее ПО, позволяющее сортировать и фильтровать данные. Изучение серверных логов даст вам максимум информации по маршрутам ботов и расписанию их обходов. Однако получить доступ к логам можно не всегда, это определяется типом хостинга. Если это проблема – лучше сменить хостера (привет, платформы сайтов-конструкторов!).