Sitemap.xml — специальный файл с полным перечнем всех страниц на сайте, которые должны быть проиндексированы поисковыми системами.
Несмотря на то, что поисковые системы могут отсканировать страницы сайта самостоятельно, именно файл sitemap.xml помогает роботам выполнить следующие задачи правильно:
Проще говоря, файл sitemap.xml представляет собой путеводитель по страницам сайта, который, во-первых, упрощает работу поисковым роботам, а, во-вторых, помогает повысить доверие поисковых систем к веб-ресурсу.
Файл sitemap.xml имеет определенную структуру:
<urlset> (заголовок).
<url> (информация о странице).
<loc> (адрес страницы)
<lastmod> (дата последнего обновления).
<changefreq> (частота обновления)
<priority> (приоритет).
Помимо того, что у файла есть своя структура, существует также несколько правил, которых стоит придерживаться при создании sitemap.xml.
Так, sitemap.xml должен отдавать код ответа сервера 200. Количество адресов не должно превышать 50 000, а размер файла не должен быть более 10 МБ. В случае, если в sitemap.xml предполагается большой объем данных, лучше разбить их на несколько отдельных файлов, а адреса их прописать в файле индекса Sitemap.
Помимо этого, в файле не должно быть ссылок на страницы с кодом 404 (несуществующие URL), а также так называемые “мусорные страницы”, которые не приносят пользу для SEO.