
Sitemap (от англ. sitemap — «карта сайта») — это файл со списком URL сайта, который сообщает поисковым системам Google, Яндекс, Bing структуру ресурса и помогает им находить и индексировать все страницы.
Что такое sitemap в техническом SEO — главный инструмент управления индексацией: через карту сайта вебмастер явно указывает поисковикам, какие страницы существуют, когда они последний раз обновлялись, насколько важны относительно других. Стандартный формат — XML (sitemap.xml), описанный в открытом стандарте sitemaps.org.
Протокол разработан Google в июне 2005 года, поддержан Яндексом и Microsoft в ноябре 2006 года как открытый отраслевой стандарт. Файл размещается в корне сайта по адресу example.by/sitemap.xml и регистрируется в robots.txt через директиву Sitemap, а также напрямую в Google Search Console и Яндекс.Вебмастере.
Кроме классического sitemap.xml существуют специализированные форматы: News Sitemap для новостных публикаций, Image Sitemap для изображений, Video Sitemap для видео. На крупных сайтах применяется Sitemap Index — файл-индекс, ссылающийся на несколько отдельных карт сайта (один XML-sitemap может содержать не более 50 000 URL и весить не более 50 МБ несжатым).
Что такое sitemap
Sitemap — машиночитаемый файл-указатель, который сообщает поисковому роботу: «вот список всех страниц сайта, которые ты должен знать». Без sitemap робот находит страницы через переходы по ссылкам, начиная с главной. На больших и сложных сайтах часть страниц может оказаться плохо связана между собой — карта сайта решает эту проблему, явно перечисляя все URL.
Минимальный sitemap.xml выглядит так:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://cropas.by/</loc>
<lastmod>2026-05-26</lastmod>
</url>
<url>
<loc>https://cropas.by/seo-slovar/</loc>
<lastmod>2026-05-26</lastmod>
</url>
</urlset>Главные функции карты сайта:
- Обнаружение страниц. Поисковик узнаёт о существовании всех URL, даже если на них нет внутренних ссылок.
- Информация об обновлениях. Через тег lastmod робот понимает, какие страницы изменились с последнего сканирования.
- Приоритизация. Поисковик может использовать sitemap для определения порядка сканирования при ограниченном crawl budget.
- Контроль индексации. Через явное указание страниц в sitemap вебмастер сообщает: «эти страницы важны, их нужно индексировать».
История стандарта sitemap.xml
Протокол Sitemap появился в июне 2005 года как инициатива Google. Цель — дать вебмастерам инструмент сообщать поисковику о страницах сайта, а не ждать, пока робот найдёт их сам через ссылки. До этого момента такого открытого стандарта не существовало.
- Июнь 2005. Google публикует первую версию протокола Sitemap 0.84.
- Ноябрь 2006. Google, Yahoo и Microsoft (тогда MSN) объявляют о совместной поддержке протокола Sitemap 0.90. Открыт сайт sitemaps.org как нейтральная площадка для развития стандарта.
- Апрель 2007. Яндекс присоединяется к поддержке протокола.
- 2008. Появление расширений — Image Sitemap, Video Sitemap, News Sitemap для специализированного контента.
- 2009. Поддержка hreflang в sitemap для мультиязычных сайтов.
- 2017. Google объявляет, что не учитывает теги changefreq и priority — оставлены только loc и lastmod как значимые поля.
- 2024. Протокол стабилен, изменения за последние годы минимальны. Действующая версия — 0.9 на sitemaps.org.
За 20 лет существования протокол стал отраслевым стандартом — поддерживается всеми крупными поисковиками мира, реализован во всех серьёзных CMS, без него не обходится ни один технический SEO-аудит.
Синтаксис sitemap.xml
Sitemap — это XML-документ с фиксированной структурой. Корневой элемент urlset с пространством имён sitemaps.org. Внутри — теги url, каждый описывает одну страницу сайта.
Полный набор тегов для одного URL:
<url>
<loc>https://cropas.by/seo-slovar/sitemap/</loc>
<lastmod>2026-05-26T10:30:00+03:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>Описание тегов:
- loc — обязательный. Полный URL страницы с протоколом и доменом. До 2048 символов.
- lastmod — опциональный. Дата последнего изменения в формате ISO 8601 (W3C Datetime). Может быть как полная дата со временем, так и только дата (2026-05-26).
- changefreq — опциональный. Частота изменений: always, hourly, daily, weekly, monthly, yearly, never. Google и Bing не учитывают этот тег с 2017 года. Яндекс может использовать как косвенный сигнал.
- priority — опциональный. Относительный приоритет страницы от 0.0 до 1.0. По умолчанию 0.5. Google не учитывает с 2017 года. Яндекс не использует.
На практике в современных sitemap.xml обычно используются только два тега — loc и lastmod. Остальные оставляются «для совместимости», но реального влияния не имеют.
Лимиты протокола sitemap:
- Один файл sitemap.xml — не более 50 000 URL
- Размер файла — не более 50 МБ в несжатом виде
- Файл может быть сжат gzip — тогда размер по факту считается до сжатия
- Кодировка — UTF-8
- URL должны быть в одной кодировке и формате (например, все с www или все без)
Типы sitemap
| Тип | Назначение | Расширение протокола |
|---|---|---|
| Стандартный XML Sitemap | Общий список страниц сайта | sitemaps.org/schemas/sitemap/0.9 |
| Image Sitemap | Список изображений на сайте с подписями и лицензиями | google.com/schemas/sitemap-image/1.1 |
| Video Sitemap | Список видео с тайм-кодами, превью, длительностью | google.com/schemas/sitemap-video/1.1 |
| News Sitemap | Свежие новости (до 2 дней) для попадания в Google News | google.com/schemas/sitemap-news/0.9 |
| Mobile Sitemap (устарел) | Раньше — мобильные версии страниц | Не используется с 2018 года после Mobile-First Index |
| Hreflang Sitemap | Языковые версии страниц через xhtml:link | В составе стандартного sitemap.xml |
| TXT Sitemap | Простой список URL без метаданных | Plain text файл с URL по строке |
| RSS / Atom как Sitemap | Альтернативный способ передачи списка свежих URL | Поддерживается, но XML предпочтительнее |
Sitemap Index для крупных сайтов
Если на сайте больше 50 000 страниц или файл sitemap.xml превышает 50 МБ, используется Sitemap Index — файл-индекс, ссылающийся на несколько отдельных карт сайта.
Пример sitemap_index.xml:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://cropas.by/sitemap-pages.xml</loc>
<lastmod>2026-05-26</lastmod>
</sitemap>
<sitemap>
<loc>https://cropas.by/sitemap-blog.xml</loc>
<lastmod>2026-05-26</lastmod>
</sitemap>
<sitemap>
<loc>https://cropas.by/sitemap-slovar.xml</loc>
<lastmod>2026-05-26</lastmod>
</sitemap>
</sitemapindex>Принципы разбивки на отдельные карты:
- По типу контента. Отдельные sitemap для категорий, товаров, статей, новостей.
- По дате обновления. Свежий контент в одной карте, архивный — в другой.
- По языку. Для мультиязычных сайтов — отдельные карты на каждый язык.
- По разделам. Для крупных порталов — отдельные карты на каждый большой раздел.
Лимиты для Sitemap Index:
- Один index-файл — не более 50 000 ссылок на отдельные sitemap
- Можно создавать несколько Sitemap Index — но это редкость, обычно достаточно одного
- Каждая отдельная карта тоже не более 50 000 URL и 50 МБ
- Теоретический максимум — 50 000 × 50 000 = 2.5 миллиарда URL на одном сайте
Регистрация sitemap в поисковиках
Чтобы поисковики использовали sitemap, его нужно зарегистрировать тремя способами:
- Через robots.txt. Добавить директиву Sitemap в файл robots.txt:
Sitemap: https://example.by/sitemap.xml. Это позволяет всем поисковикам автоматически обнаружить карту сайта. Можно указать несколько Sitemap-директив для разных карт. - Через Google Search Console. Раздел Sitemaps → Add a new sitemap → ввести URL карты. После регистрации Google показывает статус обработки, количество найденных URL, индексированных страниц, ошибок.
- Через Яндекс.Вебмастер. Раздел Индексирование → Файлы Sitemap → Добавить файл. Яндекс показывает аналогичную статистику обработки.
Раньше существовал ещё один способ — пинг через google.com/ping?sitemap=. С июня 2023 года Google отменил эту схему, рекомендуя только Search Console. Яндекс продолжает поддерживать через yandex.com/ping?sitemap=, но это уже устаревший подход.
Sitemap в популярных CMS
- WordPress. Встроенная генерация с 2020 года по адресу /wp-sitemap.xml. Расширенный функционал через плагины Yoast SEO (генерирует /sitemap_index.xml) и Rank Math.
- 1С-Битрикс. Встроенный модуль Поисковая оптимизация с автоматической генерацией sitemap.xml. Настройка через Сервисы → Карта сайта.
- OpenCart. Встроенный SEO sitemap по адресу /index.php?route=feed/google_sitemap, генерируется автоматически.
- Joomla. Через расширения JSitemap, XMap, OSMap — встроенной генерации нет.
- Drupal. Модуль XML Sitemap — стандарт для всех версий Drupal.
- Shopify. Автоматическая генерация по адресу /sitemap.xml без возможности изменения.
- Tilda. Автоматическая генерация в настройках сайта.
- MODX. Через дополнение pdoSitemap или GoogleSiteMap.
- Самописные сайты. Скрипты на PHP/Python для автоматической генерации по базе данных, ручное создание для маленьких сайтов.
Главное правило для всех CMS — sitemap должен обновляться автоматически при добавлении новых страниц. Ручная генерация неактуальна для современных сайтов с регулярными публикациями. Корректная индексация зависит от того, насколько актуально sitemap отражает реальное состояние сайта — устаревший файл создаёт ложные сигналы для поисковика, и краулер тратит ресурсы на проверку несуществующих URL. Хороший краулер видит обновления почти сразу, плохо обновляемая индексация — главная причина медленного попадания новых страниц в выдачу.
Типичные ошибки
| Ошибка | Последствие |
|---|---|
| В sitemap указаны страницы, заблокированные в robots.txt | Конфликт сигналов — поисковик может проигнорировать обе инструкции |
| URL в sitemap отдают 404 или 301 редирект | Снижение доверия к карте сайта, пустая трата crawl budget |
| В sitemap страницы с noindex | Противоречивый сигнал поисковику |
| Sitemap не обновляется при добавлении страниц | Новые страницы долго не попадают в индекс |
| Размер файла превышает 50 МБ | Sitemap игнорируется поисковиками |
| URL в sitemap с другим протоколом или поддоменом | Ошибка валидации — sitemap не принимается |
| Дубли URL внутри одного sitemap | Не критично, но засоряет файл |
| Использование устаревших тегов changefreq и priority | Не вредно, но и не помогает — Google их игнорирует |
| Sitemap размещён не в корне сайта | Поисковики не могут его найти автоматически — нужна явная регистрация |
| Неверная кодировка файла | Ошибки парсинга, sitemap не обрабатывается |
Часто задаваемые вопросы
Обязателен ли sitemap.xml для всех сайтов?
Технически — нет. Поисковики могут найти страницы и через переходы по внутренним ссылкам. На малых сайтах с десятками страниц и нормальной перелинковкой можно обойтись без sitemap. Но на средних и крупных сайтах sitemap практически обязателен: ускоряет индексацию новых страниц, помогает донести до поисковика структуру, особенно для контента, плохо связанного внутренними ссылками. Стандартная рекомендация — создавать sitemap на любом коммерческом сайте.
Учитывает ли Google теги changefreq и priority?
Нет, с 2017 года Google не использует эти теги в обработке sitemap. Гэри Илш из Google официально подтверждал это несколько раз. Поисковик определяет частоту обновления страниц самостоятельно через анализ изменений при сканировании. Тег lastmod Google использует — это полезный сигнал о свежести контента. Яндекс может косвенно учитывать changefreq, но конкретного веса не присваивает.
Можно ли иметь несколько sitemap на одном сайте?
Да, и это стандартная практика для больших сайтов. Можно: создать несколько отдельных карт по типам контента (sitemap-pages.xml, sitemap-blog.xml, sitemap-products.xml); объединить их через Sitemap Index (sitemap_index.xml); зарегистрировать в robots.txt несколькими директивами Sitemap. Лимиты: каждая отдельная карта — до 50 000 URL и 50 МБ. Общее количество карт может быть любым в пределах одного Sitemap Index.
Что делать, если sitemap содержит много страниц?
При количестве свыше 50 000 URL необходимо разбивать на несколько файлов и использовать Sitemap Index. Стандартная схема: для интернет-магазина с миллионом товаров — 20 отдельных sitemap по 50 000 URL каждый, связанных через один sitemap_index.xml в корне сайта. Большинство CMS и плагинов делают это автоматически при превышении лимита.
Как часто нужно обновлять sitemap?
Sitemap должен генерироваться автоматически при каждом изменении содержимого сайта. На современных CMS это происходит само: добавил товар → URL появился в sitemap; опубликовал статью → она автоматически в sitemap. Ручная регенерация раз в день/неделю — устаревший подход. Главное — чтобы при сканировании поисковиком sitemap содержал актуальные данные о всех страницах.
Где правильно размещать sitemap.xml?
Строго в корне сайта по адресу example.by/sitemap.xml. Это автоматически распознаётся поисковиками. Альтернативные имена (sitemap-index.xml, sitemap1.xml, urls.xml) тоже работают, но требуют явной регистрации через robots.txt или Search Console. Sitemap в подпапке (example.by/seo/sitemap.xml) технически допустим, но поисковик не найдёт его без явного указания.
Как проверить корректность sitemap?
Через инструменты: Google Search Console → Sitemaps показывает статус обработки, количество URL, ошибки; Яндекс.Вебмастер → Файлы Sitemap — аналогично для Яндекса; XML Sitemap Validator (xml-sitemaps.com/validate-xml-sitemap.html) — онлайн-валидатор; Screaming Frog SEO Spider может загрузить sitemap и сравнить с реальной структурой сайта. После любых крупных изменений на сайте обязательная проверка корректности sitemap — стандартная задача технического SEO-аудита.



