Сайтмап: что это такое и зачем он нужен

Признаны SEO-компанией №1 в Беларуси
по результатам рейтинга Байнета 2025

+375 (29) 667-88-83
+375 (29) 667-88-83
+375 (17) 276-07-85
+375 (17) 276-07-85

C 10:00 до 19:00 в будние дни

Сайтмап

Что такое sitemap

Sitemap (от англ. sitemap — «карта сайта») — это файл со списком URL сайта, который сообщает поисковым системам Google, Яндекс, Bing структуру ресурса и помогает им находить и индексировать все страницы.

Что такое sitemap в техническом SEO — главный инструмент управления индексацией: через карту сайта вебмастер явно указывает поисковикам, какие страницы существуют, когда они последний раз обновлялись, насколько важны относительно других. Стандартный формат — XML (sitemap.xml), описанный в открытом стандарте sitemaps.org.

Протокол разработан Google в июне 2005 года, поддержан Яндексом и Microsoft в ноябре 2006 года как открытый отраслевой стандарт. Файл размещается в корне сайта по адресу example.by/sitemap.xml и регистрируется в robots.txt через директиву Sitemap, а также напрямую в Google Search Console и Яндекс.Вебмастере.

Кроме классического sitemap.xml существуют специализированные форматы: News Sitemap для новостных публикаций, Image Sitemap для изображений, Video Sitemap для видео. На крупных сайтах применяется Sitemap Index — файл-индекс, ссылающийся на несколько отдельных карт сайта (один XML-sitemap может содержать не более 50 000 URL и весить не более 50 МБ несжатым).

Что такое sitemap

Sitemap — машиночитаемый файл-указатель, который сообщает поисковому роботу: «вот список всех страниц сайта, которые ты должен знать». Без sitemap робот находит страницы через переходы по ссылкам, начиная с главной. На больших и сложных сайтах часть страниц может оказаться плохо связана между собой — карта сайта решает эту проблему, явно перечисляя все URL.

Минимальный sitemap.xml выглядит так:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://cropas.by/</loc>
    <lastmod>2026-05-26</lastmod>
  </url>
  <url>
    <loc>https://cropas.by/seo-slovar/</loc>
    <lastmod>2026-05-26</lastmod>
  </url>
</urlset>

Главные функции карты сайта:

  • Обнаружение страниц. Поисковик узнаёт о существовании всех URL, даже если на них нет внутренних ссылок.
  • Информация об обновлениях. Через тег lastmod робот понимает, какие страницы изменились с последнего сканирования.
  • Приоритизация. Поисковик может использовать sitemap для определения порядка сканирования при ограниченном crawl budget.
  • Контроль индексации. Через явное указание страниц в sitemap вебмастер сообщает: «эти страницы важны, их нужно индексировать».

История стандарта sitemap.xml

Протокол Sitemap появился в июне 2005 года как инициатива Google. Цель — дать вебмастерам инструмент сообщать поисковику о страницах сайта, а не ждать, пока робот найдёт их сам через ссылки. До этого момента такого открытого стандарта не существовало.

  • Июнь 2005. Google публикует первую версию протокола Sitemap 0.84.
  • Ноябрь 2006. Google, Yahoo и Microsoft (тогда MSN) объявляют о совместной поддержке протокола Sitemap 0.90. Открыт сайт sitemaps.org как нейтральная площадка для развития стандарта.
  • Апрель 2007. Яндекс присоединяется к поддержке протокола.
  • 2008. Появление расширений — Image Sitemap, Video Sitemap, News Sitemap для специализированного контента.
  • 2009. Поддержка hreflang в sitemap для мультиязычных сайтов.
  • 2017. Google объявляет, что не учитывает теги changefreq и priority — оставлены только loc и lastmod как значимые поля.
  • 2024. Протокол стабилен, изменения за последние годы минимальны. Действующая версия — 0.9 на sitemaps.org.

За 20 лет существования протокол стал отраслевым стандартом — поддерживается всеми крупными поисковиками мира, реализован во всех серьёзных CMS, без него не обходится ни один технический SEO-аудит.

Синтаксис sitemap.xml

Sitemap — это XML-документ с фиксированной структурой. Корневой элемент urlset с пространством имён sitemaps.org. Внутри — теги url, каждый описывает одну страницу сайта.

Полный набор тегов для одного URL:

<url>
  <loc>https://cropas.by/seo-slovar/sitemap/</loc>
  <lastmod>2026-05-26T10:30:00+03:00</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

Описание тегов:

  • loc — обязательный. Полный URL страницы с протоколом и доменом. До 2048 символов.
  • lastmod — опциональный. Дата последнего изменения в формате ISO 8601 (W3C Datetime). Может быть как полная дата со временем, так и только дата (2026-05-26).
  • changefreq — опциональный. Частота изменений: always, hourly, daily, weekly, monthly, yearly, never. Google и Bing не учитывают этот тег с 2017 года. Яндекс может использовать как косвенный сигнал.
  • priority — опциональный. Относительный приоритет страницы от 0.0 до 1.0. По умолчанию 0.5. Google не учитывает с 2017 года. Яндекс не использует.

На практике в современных sitemap.xml обычно используются только два тега — loc и lastmod. Остальные оставляются «для совместимости», но реального влияния не имеют.

Лимиты протокола sitemap:

  • Один файл sitemap.xml — не более 50 000 URL
  • Размер файла — не более 50 МБ в несжатом виде
  • Файл может быть сжат gzip — тогда размер по факту считается до сжатия
  • Кодировка — UTF-8
  • URL должны быть в одной кодировке и формате (например, все с www или все без)

Типы sitemap

ТипНазначениеРасширение протокола
Стандартный XML SitemapОбщий список страниц сайтаsitemaps.org/schemas/sitemap/0.9
Image SitemapСписок изображений на сайте с подписями и лицензиямиgoogle.com/schemas/sitemap-image/1.1
Video SitemapСписок видео с тайм-кодами, превью, длительностьюgoogle.com/schemas/sitemap-video/1.1
News SitemapСвежие новости (до 2 дней) для попадания в Google Newsgoogle.com/schemas/sitemap-news/0.9
Mobile Sitemap (устарел)Раньше — мобильные версии страницНе используется с 2018 года после Mobile-First Index
Hreflang SitemapЯзыковые версии страниц через xhtml:linkВ составе стандартного sitemap.xml
TXT SitemapПростой список URL без метаданныхPlain text файл с URL по строке
RSS / Atom как SitemapАльтернативный способ передачи списка свежих URLПоддерживается, но XML предпочтительнее

Sitemap Index для крупных сайтов

Если на сайте больше 50 000 страниц или файл sitemap.xml превышает 50 МБ, используется Sitemap Index — файл-индекс, ссылающийся на несколько отдельных карт сайта.

Пример sitemap_index.xml:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://cropas.by/sitemap-pages.xml</loc>
    <lastmod>2026-05-26</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://cropas.by/sitemap-blog.xml</loc>
    <lastmod>2026-05-26</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://cropas.by/sitemap-slovar.xml</loc>
    <lastmod>2026-05-26</lastmod>
  </sitemap>
</sitemapindex>

Принципы разбивки на отдельные карты:

  • По типу контента. Отдельные sitemap для категорий, товаров, статей, новостей.
  • По дате обновления. Свежий контент в одной карте, архивный — в другой.
  • По языку. Для мультиязычных сайтов — отдельные карты на каждый язык.
  • По разделам. Для крупных порталов — отдельные карты на каждый большой раздел.

Лимиты для Sitemap Index:

  • Один index-файл — не более 50 000 ссылок на отдельные sitemap
  • Можно создавать несколько Sitemap Index — но это редкость, обычно достаточно одного
  • Каждая отдельная карта тоже не более 50 000 URL и 50 МБ
  • Теоретический максимум — 50 000 × 50 000 = 2.5 миллиарда URL на одном сайте

Регистрация sitemap в поисковиках

Чтобы поисковики использовали sitemap, его нужно зарегистрировать тремя способами:

  1. Через robots.txt. Добавить директиву Sitemap в файл robots.txt: Sitemap: https://example.by/sitemap.xml. Это позволяет всем поисковикам автоматически обнаружить карту сайта. Можно указать несколько Sitemap-директив для разных карт.
  2. Через Google Search Console. Раздел Sitemaps → Add a new sitemap → ввести URL карты. После регистрации Google показывает статус обработки, количество найденных URL, индексированных страниц, ошибок.
  3. Через Яндекс.Вебмастер. Раздел Индексирование → Файлы Sitemap → Добавить файл. Яндекс показывает аналогичную статистику обработки.

Раньше существовал ещё один способ — пинг через google.com/ping?sitemap=. С июня 2023 года Google отменил эту схему, рекомендуя только Search Console. Яндекс продолжает поддерживать через yandex.com/ping?sitemap=, но это уже устаревший подход.

Sitemap в популярных CMS

  • WordPress. Встроенная генерация с 2020 года по адресу /wp-sitemap.xml. Расширенный функционал через плагины Yoast SEO (генерирует /sitemap_index.xml) и Rank Math.
  • 1С-Битрикс. Встроенный модуль Поисковая оптимизация с автоматической генерацией sitemap.xml. Настройка через Сервисы → Карта сайта.
  • OpenCart. Встроенный SEO sitemap по адресу /index.php?route=feed/google_sitemap, генерируется автоматически.
  • Joomla. Через расширения JSitemap, XMap, OSMap — встроенной генерации нет.
  • Drupal. Модуль XML Sitemap — стандарт для всех версий Drupal.
  • Shopify. Автоматическая генерация по адресу /sitemap.xml без возможности изменения.
  • Tilda. Автоматическая генерация в настройках сайта.
  • MODX. Через дополнение pdoSitemap или GoogleSiteMap.
  • Самописные сайты. Скрипты на PHP/Python для автоматической генерации по базе данных, ручное создание для маленьких сайтов.

Главное правило для всех CMS — sitemap должен обновляться автоматически при добавлении новых страниц. Ручная генерация неактуальна для современных сайтов с регулярными публикациями. Корректная индексация зависит от того, насколько актуально sitemap отражает реальное состояние сайта — устаревший файл создаёт ложные сигналы для поисковика, и краулер тратит ресурсы на проверку несуществующих URL. Хороший краулер видит обновления почти сразу, плохо обновляемая индексация — главная причина медленного попадания новых страниц в выдачу.

Типичные ошибки

ОшибкаПоследствие
В sitemap указаны страницы, заблокированные в robots.txtКонфликт сигналов — поисковик может проигнорировать обе инструкции
URL в sitemap отдают 404 или 301 редиректСнижение доверия к карте сайта, пустая трата crawl budget
В sitemap страницы с noindexПротиворечивый сигнал поисковику
Sitemap не обновляется при добавлении страницНовые страницы долго не попадают в индекс
Размер файла превышает 50 МБSitemap игнорируется поисковиками
URL в sitemap с другим протоколом или поддоменомОшибка валидации — sitemap не принимается
Дубли URL внутри одного sitemapНе критично, но засоряет файл
Использование устаревших тегов changefreq и priorityНе вредно, но и не помогает — Google их игнорирует
Sitemap размещён не в корне сайтаПоисковики не могут его найти автоматически — нужна явная регистрация
Неверная кодировка файлаОшибки парсинга, sitemap не обрабатывается

Часто задаваемые вопросы

Обязателен ли sitemap.xml для всех сайтов?

Технически — нет. Поисковики могут найти страницы и через переходы по внутренним ссылкам. На малых сайтах с десятками страниц и нормальной перелинковкой можно обойтись без sitemap. Но на средних и крупных сайтах sitemap практически обязателен: ускоряет индексацию новых страниц, помогает донести до поисковика структуру, особенно для контента, плохо связанного внутренними ссылками. Стандартная рекомендация — создавать sitemap на любом коммерческом сайте.

Учитывает ли Google теги changefreq и priority?

Нет, с 2017 года Google не использует эти теги в обработке sitemap. Гэри Илш из Google официально подтверждал это несколько раз. Поисковик определяет частоту обновления страниц самостоятельно через анализ изменений при сканировании. Тег lastmod Google использует — это полезный сигнал о свежести контента. Яндекс может косвенно учитывать changefreq, но конкретного веса не присваивает.

Можно ли иметь несколько sitemap на одном сайте?

Да, и это стандартная практика для больших сайтов. Можно: создать несколько отдельных карт по типам контента (sitemap-pages.xml, sitemap-blog.xml, sitemap-products.xml); объединить их через Sitemap Index (sitemap_index.xml); зарегистрировать в robots.txt несколькими директивами Sitemap. Лимиты: каждая отдельная карта — до 50 000 URL и 50 МБ. Общее количество карт может быть любым в пределах одного Sitemap Index.

Что делать, если sitemap содержит много страниц?

При количестве свыше 50 000 URL необходимо разбивать на несколько файлов и использовать Sitemap Index. Стандартная схема: для интернет-магазина с миллионом товаров — 20 отдельных sitemap по 50 000 URL каждый, связанных через один sitemap_index.xml в корне сайта. Большинство CMS и плагинов делают это автоматически при превышении лимита.

Как часто нужно обновлять sitemap?

Sitemap должен генерироваться автоматически при каждом изменении содержимого сайта. На современных CMS это происходит само: добавил товар → URL появился в sitemap; опубликовал статью → она автоматически в sitemap. Ручная регенерация раз в день/неделю — устаревший подход. Главное — чтобы при сканировании поисковиком sitemap содержал актуальные данные о всех страницах.

Где правильно размещать sitemap.xml?

Строго в корне сайта по адресу example.by/sitemap.xml. Это автоматически распознаётся поисковиками. Альтернативные имена (sitemap-index.xml, sitemap1.xml, urls.xml) тоже работают, но требуют явной регистрации через robots.txt или Search Console. Sitemap в подпапке (example.by/seo/sitemap.xml) технически допустим, но поисковик не найдёт его без явного указания.

Как проверить корректность sitemap?

Через инструменты: Google Search Console → Sitemaps показывает статус обработки, количество URL, ошибки; Яндекс.Вебмастер → Файлы Sitemap — аналогично для Яндекса; XML Sitemap Validator (xml-sitemaps.com/validate-xml-sitemap.html) — онлайн-валидатор; Screaming Frog SEO Spider может загрузить sitemap и сравнить с реальной структурой сайта. После любых крупных изменений на сайте обязательная проверка корректности sitemap — стандартная задача технического SEO-аудита.

© ЧУП «Кропас», 2026. Все права защищены.