Отсутствуют файлы sitemap как исправить

Вы создали карту сайта, загрузили ее в Google Search Console, но файл не получил статус «Успешно» или «Ок»? А, может, отчет о файлах Sitemap выглядит хорошо, но поисковикиигнорирует ваш файл Sitemap и...

Вы создали карту сайта, загрузили ее в Google Search Console, но файл не получил статус «Успешно» или «Ок»? А, может, отчет о файлах Sitemap выглядит хорошо, но поисковикиигнорирует ваш файл Sitemap и не собирается индексировать многие страницы из карты сайта. Возникает вопрос, можно ли что-нибудь сделать для улучшения статистики индексирования. Отвечаем — можно, и даже расскажем, как это сделать.

Если у вас еще нет карты сайта и вы хотите узнать, зачем она нужна, ознакомьтесь с нашим вводным интенсивом по созданию файла Sitemap. Здесь мы расскажем о преимуществах использования карты сайта и действенных рекомендациях по работе с ней. Если вы пока не знаете, для чего используют теги <loc> и <lastmod>, что такое карта сайта для видео или файл индекса Sitemap, вводное руководство вам точно пригодится.

В первой части этой статьи перечислены все ошибки, с которыми вы можете столкнуться в отчетах о файлах Sitemap в Google Search Console. Если же вы ищете способ устранить конкретные проблемы, воспользуйтесь содержанием, чтобы перейти к интересующим вас ошибкам.

Во второй части — рекомендации, которые помогут вам извлечь максимальную выгоду из карты сайта. Вы узнаете, как найти мусорные страницы в файле Sitemap, где искать страницы, которые вы могли пропустить и не добавить в карту сайта, и как заставить поисковик проиндексировать как можно больше страниц из файла Sitemap. Поэтому очень советую всем внимательно ознакомиться со второй главой этой статьи.

Исправление ошибок в отчете Sitemap

После загрузки карты сайта в Google в столбце «Статус» можно увидеть, удалось ли поисковику обработать файл. Если ваш файл соответствует всем правилам, появится статус «Успешно». В этой главе мы рассмотрим другие статусы, а именно «Не получено» и «Обнаружены проблемы».

Проблемы со сканированием вашего файла Sitemap

Начнем с самого худшего сценария, когда поисковик не может обработать файл Sitemap. Сначала разберемся с Google — что делать, если статус вашей карты сайта «Не получено». 

Статус карты сайта «Не получено»

В этом случае вам придется использовать «Инструмент проверки URL», чтобы выяснить, что может быть причиной проблемы. В инструменте нажмите кнопку «Проверить страницу на сайте» и посмотрите статус получения страницы. Если написано «Успешно», значит ошибка на стороне Google.

Статус получения страницы в GSC

Если Google не удалось получить вашу карту сайта, убедитесь, что ничто не блокирует доступ к файлу Sitemap — будь то директивы robots.txt или плагины CMS (да, иногда виноваты они!). Также проверьте, правильно ли введен URL-адрес карты сайта — обратите внимание на протокол и префикс www.

Ошибка «Не получено» может возникнуть как при загрузке отдельной карты сайта, так и в случае загрузки в Google Search Console файла индекса Sitemap. Проблему нужно решить так же, как и с одной картой сайта.

Ошибки в файле индекса Sitemap

Теперь перейдем к случаям, когда поисковики просканировали добавленный вами файл и обнаружили ошибки. И начнем мы с ошибок файла индекса Sitemap.

Файл индекса Sitemap содержит ссылки на несколько карт сайта — поисковой системе необходимо обработать их все, чтобы наконец получить доступ к URL-адресам вашего сайта. В Google Search Console вы получите ошибку «Неполные URL в файле индекса Sitemap», если поисковик не сможет обработать URL-адреса, перечисленные в файле индекса Sitemap. Обычно это означает, что Google не удалось найти одну или несколько ваших карт сайта, потому что вы использовали относительные URL-адреса. Все URL-ы, которые указывают на отдельные карты сайта в файле индекса Sitemap, должны быть абсолютными, иначе Google не сможет их найти.

Кроме того, в вашем файле индекса Sitemap не должны быть указаны другие файлы индекса Sitemap, а только карты сайта. Если вы сделаете так, то получите сообщение «Вложенные файлы индекса Sitemap» в Google Search Console.

И последняя ошибка. В Google она звучит так «Слишком много файлов Sitemap в файле индекса». Это происходит с огромными сайтами, которые содержат более 50 000 карт сайта в одном файле.

Недопустимый размер файла Sitemap и ошибки сжатия

Ограничения по размеру применяются как к файлам индекса Sitemap, так и к отдельным картам сайта. Размер файла Sitemap в несжатом виде не должен превышать 50 МБ, а в карте сайта не должно быть более 50 000 URL-адресов. Если вы не соблюдаете эти правила, то получите ошибку «Превышен максимальный размер файла Sitemap» в Google. Узнать больше о том, как разделить карту сайта на несколько файлов, можно из нашего полного руководства по созданию файла Sitemap. 

Карта сайта должна не только не превышать допустимые размеры, но и не быть пустой. Если вы загрузите пустой Sitemap, то получите соответствующую ошибку в консоли.

Я говорила, что допустимый размер карты сайта в несжатом виде должен быть меньше 50 МБ, но часто файлы Sitemap сжимают для экономии пропускной способности канала. Обычно для этой цели используют инструмент gzip, который добавляет расширение gz к файлу. Сообщение об ошибке сжатия или разархивирования в отчете означает, что что-то пошло не так во время процесса сжатия, и вам нужно сделать это еще раз.

Проблемы со сканированием URL-адресов в карте сайта

По ряду причин поисковики могут не просканировать некоторые URL-адреса, которые указаны в карте сайта. Давайте разберемся со всеми подобными ошибками.

«Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt» — ошибка довольно простая, поскольку поисковики укажут вам на заблокированные URL-адреса. Все зависит от того, хотите ли вы, чтобы эти URL-ы были проиндексированы. Если да, то вам придется снять блокировку, в другом случае необходимо удалить адреса из карты сайта.

Еще одна довольно очевидная проблема, которая не позволяет Google сканировать страницу, — это код ответа, отличный от 200 ОК. В отчете поисковиков это называется ошибкой HTTP, и точный код указывается для каждой отдельной страницы. Кроме консолей вебмастеров, проверить коды ответа URL-адресов из вашей карты сайта можно с помощью инструмента «Аудит сайта» от SE Ranking.

Всю необходимую информацию ищите в разделе «Код ответа сервера».

Раздел «Код ответа сервера» в SE Ranking

Google также выделяет другие не такие очевидные и простые ошибки. Кратко пройдемся по каждой из них.

Ошибка «URL недоступны» означает, что поисковик обнаружил вашу карту сайта в указанном месте, но не смог получить все URL-адреса из списка. В этом случае вам снова нужно использовать «Инструмент проверки URL» и проверять доступность для сканирования каждого проблемного URL-а.

Ошибка «Переход по URL не выполнен» возникает либо из-за того, что вы использовали относительные URL-адреса в карте сайта вместо абсолютных, либо из-за проблем с редиректами. Цепочки и циклы редиректов, временные редиректы, которые используют вместо постоянного перенаправления, а также HTML- и JS-редиректы могут привести к этим ошибкам.

Google Search Console не указывает, что именно может быть причиной проблемы. Поэтому вам нужно использовать другие инструменты, чтобы понять, какие ошибки необходимо исправить. Например, в инструменте «Аудит сайта» SE Ranking есть специальный раздел «Редиректы», где можно проверить, есть ли на вашем сайте какие-либо проблемы с перенаправлениями.

Если инструмент обнаружит какие-либо ошибки, вы получите всю необходимую информацию по каждой из них — щелкнув на количество страниц, можно узнать, на какой странице есть проблема и как она связана с другими страницами сайта.

Раздел «Редиректы» в SE Ranking

Ошибка «Нельзя использовать URL» означает, что ваша карта сайта содержит URL-адреса, которые находятся на более высоком уровне или в другом домене по сравнению с файлом Sitemap. Например, если ваша карта сайта находится по адресу: vashsajt.com/category1/sitemap.xml и вы добавили в нее страницу, адрес которой: vashsajt.com/stranitsa1, поисковики не смогут получить к ней доступ.

Что касается разных доменов, помните, что для Google версии сайта на HTTP и HTTPS, а также с www и без www считаются разными. Поэтому, если ваша карта сайта находится по адресу http://www.vashsajt.com/sitemap.xml, URL вида https://vashsajt.com/stranitsa1 будет считаться некорректным. 

Если вы недавно перешли на HTTPS, обязательно создайте новую карту сайта с HTTPS URL-адресами. Инструмент «Аудит сайта» SE Ranking напомнит вам об этом.

Раздел «Безопасность сайта» в SE Ranking

Google считает, что вы указали неправильные URL

Также стоит обратить внимание на еще одну ошибку, которую выделяет Google. Если вы добавите URL без префикса www в свою карту сайта, адрес которой содержит www, вы получите ошибку «Несоответствующий путь». То же самое касается файла Sitemap с www и URL-адресом без соответствующего префикса. Даже если ваш сайт доступен как с префиксом www, так и без него, не нужно путать эти вещи в карте сайта. Если ваш файл Sitemap находится по адресу: https://example.com/sitemap.xml, ни один из URL-ов, которые она содержит, не должен включать www. Если ваша карта сайта находится по адресу: https://www.example.com/sitemap.xml, все перечисленные в ней URL-ы должны включать www.

Синтаксические ошибки в карте сайта

В большинстве случаев вам не нужно беспокоиться о синтаксических ошибках в карте сайта — создав файл Sitemap с помощью одного из специальных сервисов, вы можете быть уверены, что с тегами и атрибутами не будет проблем. Однако, если вы самостоятельно сделали карту сайта, то можете столкнуться с одной из ниже описанных ошибок. 

  • «Недопустимое значение тега». Значение тега — это то, что вы указываете между начальным и конечным тегами — URL-адрес между тегами <loc>, или дата, которую вы определяете с помощью тега <lastmod>. Ошибка возникает, когда вы указываете недопустимое значение в карте сайта, например, устанавливаете приоритет вне диапазона от 0,0 до 1,0.
  • «Неверное значение атрибута». Значение атрибута указывается после знака равенства (=) в кавычках. В следующей строке кода перечислены различные языковые версии страницы в файле Sitemap.
<url><loc>https://example.com</loc><xhtml:link rel=”alternate” hreflang=”gb” href=”https://example.com”/><xhtml:link rel=”alternate” hreflang=”fr” href=”https://example.com/fr”/></url>

Здесь “alternate”, “gb” и “fr” являются значениями атрибутов, но “gb” используется неправильно. Вы не можете указать в hreflangs только код страны — он должен сочетаться с кодом языка, например, “en-gb”.

  • «Неправильно введена дата». Все довольно просто — вы использовали неправильный формат даты для тега <lastmod>. Единственный допустимый формат:
2005-02-21 
2005-02-21T18:00:15+00:00
  • «Недопустимый URL». Как вы могли догадаться, эта ошибка означает, что нужно искать опечатки в добавленных URL-адресах. Напомню, что все URL-ы в вашей карте сайта должны быть абсолютными.
  • Ошибки «Отсутствует атрибут XML» и «Отсутствует тег XML» тоже довольно очевидны. Отсутствие обязательных тегов и атрибутов (urlset, url, loc, xmlns) недопустимо — их нужно добавить, чтобы ваша карта сайта работала должным образом.
  • «Недопустимый XML: слишком много тегов». Эта ошибка может возникнуть, если вы используете один из тегов несколько раз. Например, вы указали два разных адреса или две даты изменения для одного URL. В этом случае вам необходимо удалить повторяющийся тег.
<url>
<loc>http://www.example.com/</loc>
<lastmod>2021-01-01</lastmod>
<lastmod>2021-02-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
  • «Неправильно указано пространство имен». Пространство имен, указанное в вашем теге <urlset>, должно быть одним из принятых протоколов. В настоящее время используется следующий протокол:

Обычные файлы Sitemap — xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9”

Файлы Sitemap для новостей — xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9″

Файлы Sitemap для видео — xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″

Файлы Sitemap для изображений — xmlns:image:=”http://www.google.com/schemas/sitemap-image/1.1″

Напомню, что специальные карты сайта для новостей, картинок и видео поддерживает только Google.

Если вы использовали неправильный протокол для своей карты сайта, вы получите ошибку «Неподдерживаемый формат файла» в Google Search Console. Она также может появиться из-за других всевозможных синтаксических ошибок, таких как использование неправильных кавычек (принимаются только прямые одинарные или двойные), отсутствие тега кодировки или некорректный префикс UTF-8.

Ошибка «Неподдерживаемый формат файла» в GSC

Также Google выделяет несколько ошибок, связанных с файлом Sitemap для видео: «Слишком большой/маленький значок видео», «Адреса видео и страницы воспроизведения совпадают», «URL видео указывает на страницу воспроизведения». Вы можете найти более подробную информацию об этих ошибках здесь.

Чтобы избежать синтаксических ошибок, перед отправкой файла Sitemap используйте один из сервисов проверки карты сайта, подобных этому. Инструменты будут выделять проблемы, которые необходимо исправить.

После устранения всех ошибок в файле Sitemap нужно повторно загрузить обновленную карту сайта в Google Search Console.

Такие действия заставят Google повторно просканировать ваш сайт и, наконец, проиндексировать страницы, которые они не смогли просканировать из-за ошибок.

Загруженные vs проиндексированные URL-адреса

Ваша карта сайта и файл индекса Sitemap могут получить статус «Успешно» или «Ок», но на этом ваша работа не заканчивается.

Давайте сначала разберем, что делать дальше в Google Search Console. Щелкните на значок диаграммы рядом с количеством выявленных URL-адресов, чтобы перейти к отчету об индексировании. Как только вы начнете анализировать его, вы скорее всего заметите, что не все отправленные страницы были проиндексированы.

Отчет об индексировании в GSC

Это нормально, когда страницы исключаются из индексации — Google не может оценить и проиндексировать все страницы вашего сайта, о которых он знает. Более того, почти на каждом сайте есть страницы, которые вебмастера не хотят индексировать: страницы защищенные паролем, служебные страницы и дубли. Что не нормально, так это наличие ошибок и предупреждений в вашем отчете об индексировании. Также недопустимо, чтобы количество исключенных страниц во много раз превышало количество страниц без ошибок.

Так почему же поисковики не могут проиндексировать страницы, которые были добавлены в карту сайта? В большинстве случаев это происходит, когда вы добавляете туда страницы, которых в карте сайта быть не должно. Возможно, поисковики просто не могут проиндексировать страницу из-за директивы noindex. Кроме того, поисковики могут запутаться, действительно ли вы хотите, чтобы страница была проиндексирована — например, когда вы добавляете неканонические страницы в карту сайта. 

Все подобные ошибки можно найти в разных вкладках «Отчета об индексировании» в Google Search Console. Но их удобнее проверять с помощью инструмента «Аудит сайта» SE Ranking — если на вашем сайте есть подобные проблемы, вы легко найдете их все в разделе «Сканирование» в «Отчете об ошибках».

Вкладка «Сканирование» в SE Ranking

Удалите из карты сайта неиндексируемые и неканонические страницы. А если страницы были по ошибке помечены как неиндексируемые и неканонические, решите эту проблему.

Оптимизируйте карту сайта с подсказками от Google

Убедившись, что с вашей картой сайта все в порядке, изучите «Отчет об индексировании», чтобы найти случаи, когда ваше мнение о странице расходится с Google.

  • На вкладке «Без ошибок, есть предупреждения» обратите внимание на страницы, которые были проиндексированы, несмотря на директиву noindex. Скорее всего, Google был прав, и вам нужно удалить тег noindex из этих страниц или из вашего X-Robots-Tag.
  • На вкладке «Страница без ошибок» посмотрите внимательно на проиндексированные, но не отправленные в файл Sitemap страницы — вы можете добавить их в карту сайта, так как Google считает их качественными. В то же время, если Google проиндексировал ваше «Пользовательское соглашение», которое вы не включили в карту сайта, можно ничего не делать. Также следите за дублями страниц, которые были проиндексированы, но отсутствовали в вашей карте сайта — такие случаи часто возникают из-за проблем с пагинацией и обработкой параметров URL-адресов.
  • Наконец, перейдите на вкладку «Исключено». Большинство страниц здесь исключены из индексации в соответствии с вашими собственными директивами, например старые страницы 404, страницы, заблокированные robots.txt, неиндексируемые и неканонические страницы. Обратите внимание на канонические страницы, которые Google решил не индексировать, — поисковая система считает, что на вашем сайте есть альтернативы получше. Тщательно изучите каждый случай и решите, действительно ли страница более ценна, чем ее дубли — исправьте свои теги canonical, если Google был прав. Если вы по-прежнему считаете, что страницу нужно проиндексировать, вам придется поработать над ее содержанием, профилем бэклинков и внутренней линковкой, чтобы убедить Google в обратном.

На вкладке «Исключено» можно увидеть еще две интересные категории страниц: «Просканированы, но пока не проиндексированы», и «Обнаружены, не проиндексированы». Оба типа обычно определяют некачественные страницы с малым содержанием, которые Google не хочет показывать пользователям. В первом случае страница была по крайней мере просканирована, а затем признана некачественной. А во втором случае поисковик даже не потратил краулинговый бюджет на страницу. Тщательно проанализируйте все такие страницы и посмотрите, что вы можете сделать, чтобы повысить их ценность: поработайте над контентом, взаимодействием с пользователем, внутренней линковкой и т. д.

Заключение

Благодаря разнообразию инструментов для создания карты сайта сделать файл Sitemap очень легко. Однако, если вы просто воспользуетесь одним из случайных инструментов и проигнорируете рекомендации по созданию карты сайта, то наверняка получите отчет о файле Sitemap с большим количеством ошибок, или отправите через карту сайта множество некачественных страниц на рассмотрение поисковикам.

Я надеюсь, что это руководство помогло вам исправить каждую ошибку в отчете о файле Sitemap. А воспользовавшись советами из второй части этого руководства, вы сможете оставить в карте сайта только качественные страницы и убрать все те, которые поисковики все равно не захотят индексировать. Если у вас остались вопросы, не стесняйтесь оставлять их в комментариях ниже.

Даша — контент-маркетолог и редактор в SE Ranking. Пишет статьи о SEO и диджитал-маркетинге. Любит разбираться в сложных вещах и описывать их просто и доступно. В свободное от блога время Даша путешествует, изучает искусство фотографии и посещает картинные галереи.

В последнее время участились случаи когда Google отказывается принимать сайтмап длительное время.

В данном случае попробую расписать основные причины. Их можно разделить на 2 категории: ошибки на сайте и глюки новой гугл-консоли.

Чаще всего сопровождаются сообщениями:

Не получено – не удалось получить файл Sitemap

Первые действия

  • Убедитесь что сайтмап открывается в браузере и время открытия менее 10сек.
  • Необходимо подождать определенное время. Если краулинговый бюджет сайта израсходован, сразу индексация сайтмапа не пройдет, ожидайте от 1 до 10 дней.
  • Воспользуйтесь инструментом «Проверка URL» для анализа индексации сайтмапа и запроса на приоритетное сканирование (скрин ниже).
  • Отслеживайте по логам, обращался ли GoogleBot к сайтмапу.

Проверка сайтмапа

К сожалению гугл убрал инструмент проверки сайтмапа в новой Search Console. На данный момент такую возможность дает только Яндекс.

В Google можно проверить статус URL и ускорить индексацию единственным способом:

Ошибки на сайте

Ошибки загрузки

  • Сайтмап недоступен или генерируется с ошибками — Проверьте в браузере и используя сервис от Яндекс
  • Проблема с зеркалами сайта WWW/HTTPS — Сам сайтмап и содержимое должны принадлежать главному зеркалу
  • Сайтмап запрещен к индексации в robots.txt — Разрешите используя оператор «Allow:» в конце списка
  • Сайтмап отдается слишком долго (больше 15с)

Ошибки содержимого

  • Адресация в сайтмапе и на сайте отличается либо большое кол-во адресов с редиректами
  • В адресах используются спецсимволы — используйте только латинские буквы (a-z), цифры и тире (-)
  • Несоответствие стандарту XHTML, как правило не заменено & на &аmр;
  • Имеются пробелы в начале, либо кодировка отличная от UTF-8 (без BOM)

Глюки новой Google Search Console

Иногда возникают проблемы при следующих ситуациях

  • Кириллический домен (именно доменная зона) или новая доменная зона (.top, .moscow, …) (под вопросом) как выяснилось не работает только .рф, а например .бел и .укр работают
  • Использование знаков подчеркивания «_» в адресе сайтмапа — есть сообщения что замена на тире решила проблему
  • Заголовок «content-type: application/xml» — есть сообщение что замена на «text/xml«, «text/xml; charset=UTF-8«, «application/rss+xml; charset=UTF-8«, либо полностью убранный заголовок решили проблему
  • Используется gzip-сжатие — уберите сжатие для xml, это никак не повлияет на оценки Google Page Speed, т.к. на страницах сайта xml в 99.99% не грузится
  • Сложная структура адреса сайтмапа — я провел эксперименты и выявил влияние, результаты ниже

Прочие сайтмапы

Если ранее были отправлены иные сайтмапы, они могут задерживать обработку, отъедая краулинговый бюджет сайта. Недостаточно просто удалить сайтмап из консоли.

Цитата google:

Если вы удалите файл Sitemap, он будет удален из соответствующего отчета, но останется в Google, как и все URL, которые были в нем указаны.
Чтобы удалить файл Sitemap, выполните следующие действия:

  • Выберите Sitemap который нужно удалить, нажав на него.
  • Нажмите на значок «три точки».
  • Выберите Удалить файл Sitemap.
  • Чтобы роботы Google больше не обращались к файлу, удалите его с сайта или запретите доступ к нему с помощью файла robots.txt.
  • support.google.com/webmasters/answer/7451001

    Личный опыт

    • В 90% случаев если с самим сайтмапом всё в порядке, нужно просто подождать
    • В случаях когда ожидание не помогает, нужно делать адрес максимально простым. Для 0pencart FX Sitemap есть специальный патч в разделе поддержки

    Эксперименты

    Разные адреса и отметки принял (✅) или не принял (✖) Google

    ddd/s/rr_r
    ddd/s/rr
    ddd/s__1
    ?s=ddd
    ?route=ggg/e/uub
    fx_sitemap/index.php
    ru/index.php?route=extension/feed/google_sitemap
    ru/index.php?route=extension/feed/fx_sitemap
    ru/index.php?route=extension/feed/fxsitemap
    ru/index.php?route=extension/feed
    ru/index.php?route=feed/fx_sitemap

    #1

    Отправлено 11 Ноябрь 2014 — 21:27

    Почему после регистрации в поисковых системах яндека, гугле  в разделе вебмастер пишет что :
    «Файлы Sitemap для этого сайта отсутствуют. «?

    у меня получается нет файла sitemap ? Может его надо создать ? Он нужен я так понял !
    ответьте знающие люди плиз. мой сайт

    и ещё в гугле пишет что :
    «

    На вашем сайте не обнаружены структурированные данные.
    Структурированные данные помогает Google распознавать содержание вашего сайта и использовать его для показа расширенного описания веб-страниц в результатах поиска.

    Структурированные данные предоставляются путем добавления разметки HTML на страницы сайта.
    Подробнее о расширенные описания веб-страниц…
    Посетите schema.org и ознакомьтесь с коллекцией общепринятых схем разметки структурированных данных.»

    • Наверх


    #2

    Dars

    Отправлено 12 Ноябрь 2014 — 12:39

    Просмотр сообщенияboroda (11 Ноябрь 2014 — 21:27) писал:

    Почему после регистрации в поисковых системах яндека, гугле  в разделе вебмастер пишет что :
    «Файлы Sitemap для этого сайта отсутствуют. «?

    у меня получается нет файла sitemap ? Может его надо создать ? Он нужен я так понял !
    ответьте знающие люди плиз. мой сайт

    и ещё в гугле пишет что :
    «

    На вашем сайте не обнаружены структурированные данные.
    Структурированные данные помогает Google распознавать содержание вашего сайта и использовать его для показа расширенного описания веб-страниц в результатах поиска.

    Структурированные данные предоставляются путем добавления разметки HTML на страницы сайта.
    Подробнее о расширенные описания веб-страниц…
    Посетите schema.org и ознакомьтесь с коллекцией общепринятых схем разметки структурированных данных.«

    Файл sitemap генерируется автоматически и доступен по ссылке http://site.ru/sitemap
    Структурированные данные можно добавить в соответствии с документацией schema.org. Если не справитесь самостоятельно, опишите, пожалуйста, какие именно поля вы хотели бы распознавать.

    • Наверх


    #3

    sergrider

    sergrider

    • ГородРостов на Дону

    Отправлено 01 Май 2015 — 16:21

    Здравствуйте.
    Это означает, что файл Sitemap автоматически дополняется при добавлении нового товара?
    И пользоватся сторонними сервисами для создания нет необходимости?

    • Наверх


    #4

    Dars

    Отправлено 01 Май 2015 — 16:57

    Просмотр сообщенияsergrider (01 Май 2015 — 16:21) писал:

    Здравствуйте.
    Это означает, что файл Sitemap автоматически дополняется при добавлении нового товара?
    И пользоватся сторонними сервисами для создания нет необходимости?

    Совершенно верно.

    • Наверх


    #5

    sergrider

    sergrider

    • ГородРостов на Дону

    Отправлено 01 Май 2015 — 17:14

    А что это за ошибки. Проверка в яндекс.

    Результаты проверки (6 ошибок)

    Произошла внутренняя ошибка. Попробуйте повторить попытку позже.

    Превышено время ожидания ответа.


    Неправильный адрес страницы

    Строка 1:

    This XML file does not appear to have any style information associated with it. The document tree is shown below.


    Неправильный адрес страницы

    Строка 2:

    <urlset xmlns=»http://www.sitemaps….s/sitemap/0.9″>


    Неправильный адрес страницы

    Строка 3:

    <url>


    Неправильный адрес страницы

    Строка 4:

    <loc>http://chinaelektro…./feedback</loc>


    Неправильный адрес страницы

    Строка 5:

    </url>


    Неправильный формат текста

    • Наверх


    #6

    sergrider

    sergrider

    • ГородРостов на Дону

    Отправлено 10 Май 2015 — 15:41

    Почему никто не отвечает?

    И почему карта сайта такая урезанная?

    А не такая?

    <url>

      <loc>http://ktonanovenkogo.ru/</loc>

      <lastmod>2011-05-12T19:22:36+00:00</lastmod>

      <changefreq>daily</changefreq>

      <priority>1.0</priority>

    </url>

    • Наверх


    #7

    status321

    Отправлено 29 Август 2021 — 10:35

    Доброе утро.Если новый товар автоматически добавляется в файл sitemap почему его там нет? Фото прикрепил,проверил не все товары

    Прикрепленные изображения

    • Безымянный.png

    • Наверх


    #8

    ooomuverjcs

    ooomuverjcs

      Новичок

    • Пользователи
    • Pip

    • 1 сообщений

    Отправлено 30 Август 2021 — 14:08

    This post found very informative thanks for sharing it with us.

    • Наверх


    #9

    MikDark

    MikDark

      Активный участник

    • Модераторы
    • 6 464 сообщений

    Отправлено 30 Август 2021 — 14:33

    Просмотр сообщенияstatus321 (29 Август 2021 — 10:35) писал:

    Доброе утро.Если новый товар автоматически добавляется в файл sitemap почему его там нет? Фото прикрепил,проверил не все товары

    Здравствуйте. Вам нужно открыть Ваш sitemap по ссылке, проверить, есть ли там эта ссылка. Если нет, то пришлите, ее, пожалуйста, нам в текстовом виде

    • Наверх


    #10

    status321

    Отправлено 30 Август 2021 — 16:50

    Добрый день.Яндекс нашел.

    • Наверх


    Google Search Console пишет у sitemap.xml статус «Не получено».

    Времени прошло уже 3-4 недели.

    Сайтмепы создавал по-разному: и самостоятельно, и через разные сервисы.

    Яндекс.Вебмастер видит и понимает, ошибок нет.

    У меня первый раз такое :(

    Кто-нибудь сталкивался с подобным? Если идеи почему такое может быть?

    Скриншот: https://c2n.me/4967ymN

    d59b3dcf5198ed01adf6e05d389cbc50.png

    ну вообще сайтмап указывается в robots.txt
    еще ошибка может быть в доступе к этим файлам. Если у вас их несколько то лучше указать sitemap-index. Почитайте про это сперва.
    Гугл и яндекс, целует в попу каждого веб мастера, указывая на все ошибки, а не знать в этом причину как минимум зазорно.

    спасибо, но не всё так просто (подробности в отдельном сообщении (после редактирования слетело оформление и текст выглядит сплошной портянкой :( ))

    > ну вообще сайтмап указывается в robots.txt
    указывать сайтмеп в роботс.тхт не обязательно!
    (указан!)

    > еще ошибка может быть в доступе к этим файлам.
    ошибок нет
    яндекс загружает
    в браузере они тоже открываются

    > Если у вас их несколько то лучше указать sitemap-index. Почитайте про это сперва.
    несколько сделал на всякий случай разными способами (собственноручно (php) и онлайн-инструментами), во всех примерно одни и те страницы.
    а индексный сайтмеп делают, когда страниц больше 50 тысяч.

    > Гугл и яндекс, целует в попу каждого веб мастера, указывая на все ошибки, а не знать в этом причину как минимум зазорно.
    Статус «Не получено».
    Подробнее: Не удалось обработать файл Sitemap
    На этом «целование в попу» заканчивается.

    PS:
    и ещё специально для Вася Василий
    это не первый сайт, который я сделал, количество сделанных сайтов перевалило за 200 (двести), занимаюсь сайтами с 2000 года, более серьёзно с 2004-2005.

    alff

    alff

    18.09.2020 10:48

    Попробуйте сделать сайтмап с одним урлом для проверки.
    Проверьте, может закрыт доступ к файлу

    Спасибо за совет.
    Сделал, не помогло, всё тоже самое: статус «Не получен».
    В браузере сайтмеп открывается.
    Доступ никак не закрываю.
    6d3cfca78ed2b6f9d1f3d36cf3f5fbaa.png

    alff

    alff

    18.09.2020 15:09

    А Я.Вебмастер что говорит?
    Может быть проблема кириллическом домене? 

    alff

    alff

    18.09.2020 15:14

    А, прошу прощения, в теме указано, что Я.Вебмастер все видит.
    Значит, либо отдельно закрыт доступ для гугл бота, либо кириллический домен.

    Имеете ввиду доступ в robots.txt? НЕ закрыт.
    Да, кириллический домен.
    Сейчас проверил на другом, действительно не обрабатывает sitemap кириллического сайта (ради интереса даже попробовал вариант с русскими буквами в урле вместо punycode).
    Продолжаю эксперименты и думать, что делать…

    Проверил с десяток сайтов с кириллическим доменом и у всех такая проблема :(((
    Раньше такой проблемы не было.
    Непонятно, то ли это косяк Гугла (временная проблема), то ли так и задумано. (баг или фича)
    И главное, пока не придумал, что делать?..

    такой же косяк с доменом .info 

    там нет косяков там правильно прописывать надо все вот и все — просто не все понимают как и что.

    Спустя более чем год, Гугл так ничего и не сделал :(
    Запрос индексирования страниц в Google Search Console тоже не помогает.

    1 действие
    ***robots.txt***

    User-agent: *
    Host: https://вашсайт.ru
    Sitemap: https://вашсайт.ru/sitemap.xml

    путь к файлу sitemap.xml правильно написать

    2 действие
    яндекс веб мастер https://webmaster.yandex.ru/si…
    добавить файл и проверить

    3 действие
    гугл консоль
    https://search.google.com/sear…
    добавить файл и проверить

    4 действие
    гугл консоль
    проиндексировать в ручную новый или добавляемый контент
    если хотите что бы быстрее прошла индексация
    если на сайте была перелинковка то старый контент лучше прежде удалить по не действующим страницам.

    Всё это сделано.
    И сайтмеп создан, и в роботс.тхт указан, и в яндекс.вебмастер добавлен, и в гугл.сёрч_консоль добавлен, и страницы вручную через гугл сёрч консоль отправлялись на индексацию.
    Ничего не помогает :(
    PS:
    сайт запущен (и всё вышеуказанное сделано) еще 15.09.2021: в Яндексе 23 страницы, в Гугле 0.
    PPS:
    другие более старые сайты (от 10 месяцев и старше) попали в Гугл.

    и еще в вашем файле то и нет ничего вроде, лучше бы ссылку на свой сайт дали что бы посмотреть все.

    Ну кто так делает, а?..

    У меня такая же проблема на двух сайтах с кириллическими доменами. В файле robots.txt написал все ссылки в кодировке IDN и гугл обработал сайтмап, но страницы по-прежнему не индексирует. И не индексирует при отправке запроса на индексацию.

    Причем, если бот сам найдет страницу на сайте, то пишет, что обнаружил страницу, которой нет в sitemap (во вкладке Покрытие), хотя она там есть и если нажать на подробности, то там указано, что она есть в sitemap.

    Ничего не понимаю с этими фишками гугла!

    Подскажите, может где есть мануал по тому как добавлять в гугл кириллические домены?

    P.s. в Яндексе все работает и отображается.

    1. Почему ваша ссылка https://c2n.me редиректит на clip2net.com? 
    2. У сайта clip2net.com карта сайта есть.

    Если хотели тут получить переходы или ПФ накрутить, идея не из лучших, если получить бек — то так же не лучшая затея

    Это обычный сайт для создания скриншотов, могли бы проверить.

    Повторю то, что уже ответили Вам: это ссылка на скриншот, которую создаёт соответствующая программа для создания скриншотов.

    blog-icon

    Sitemap.xml — это карта сайта для поисковых роботов, которая находится в корне сайта и содержит рекомендации того, какие страницы необходимо обходить в первую очередь и с какой частотой. Это ускоряет и упрощает процесс индексации. Создание карты сайта sitemap.xml не является обязательным правилом. Такая карта должна быть на сайтах, которые имеют большое количество страниц, и в тех случаях, когда контент на страницах часто обновляется. В некоторых CMS есть возможность карту сайта создать автоматически, сделать это можно с помощью специального плагина. Однако это не исключает появление ошибок. 

    Ошибки в sitemap.xml существенно снижают скорость попадания сайта в индекс и затрудняют работу поисковых роботов Яндекс и Google. Поэтому их необходимо вовремя находить и устранять. Однако, если на вашем сайте большое количество страниц, найти неисправности в sitemap вручную будет непросто из-за большого объема данных. На помощь приходит сервис Labrika, в котором есть полезный инструмент для работы с sitemap.xml. Он поможет вам своевременно проверить ошибки и исправить их автоматически, в один клик.

    Находится этот инструмент в разделе «Технический аудит» левого бокового меню:

    Технический аудит

    Рассмотрим подробнее, как пользоваться этим подразделом и какие данные можно в нем увидеть:

    Технический аудит

    1. Здесь представлены данные о страницах, которые есть в sitemap.xml, но которых нет на сайте. Эти страницы перечислены ниже, в виде списка. Возможно, они были удалены с сайта и отдают ошибку 404, но в sitemap информацию о них не убрали.
    2. Далее мы можем видеть страницы, которые доступны для индексации поисковых роботов, но отсутствуют в sitemap. Чтобы роботы своевременно посещали эти страницы, их необходимо добавить в sitemap.xml.
    3. И наконец, страницы, которые есть в sitemap, но при этом закрыты от индексации. Вероятно, такие страницы были добавлены в карту сайта, но потом их закрыли от индексации в файле robots.txt.

      Продемонстрируем данные, которые выводятся во вкладках, описанных во втором и третьем пунктах, на следующих скриншотах:

      Технический аудит

      Технический аудит

    4. При нажатии на клавишу «Перепроверить sitemap.xml» Лабрика проанализирует карту сайта и выдаст информацию об ошибках, описанных в первых трех пунктах.
    5. После нажатия кнопки «Скачать исправленный sitemap.xml» Лабрика самостоятельно исправит все обнаруженные ошибки и сохранит правильную обновленную версию sitemap.xml на ваш компьютер. Вам останется только выгрузить ее на сайт взамен старого файла.
    6. Не забудьте подгрузить новый xml файл sitemap без ошибок в Яндекс Вебмастер и Google Search Console. 

    Online SEO-инструменты для продвижения сайтов

    Проверьте свой сайт и сайты конкурентов на 205 факторов поисковых систем.

    Ошибка «Нет используемых роботом файлов Sitemap» появляется в панели вебмастера, если Яндекс не видит карту сайта. Уточним, что карта веб-ресурса — это документ в формате xml или txt, в котором содержится актуальных список всех разделов и URL-адресов ресурса. При её отсутствии поисковик может не сразу увидеть обновление проекта, из-за чего новые страницы попадут в индекс с задержкой.

    Ошибка «Нет используемых роботом файлов Sitemap»

    Почему робот не видит карту сайта?

    Чаще всего информации об отсутствии используемых роботом файлов sitemap появляется, если:

    1. Документ был добавлен недавно и робот ещё не успел его проиндексировать;
    2. Вы не добавили документ в панель вебмастера;
    3. Проблема связана с настройками в robots.txt;
    4. Вы указали нестандартное название документа;
    5. На сайте отсутствует карта.

    В первом случае нет повода для беспокойства. Яндекс обрабатывает документы с задержкой и, если вы загрузили корректный файл, в течение нескольких дней ошибка пропадёт. Однако, чтобы не терять время, пока он находится в очереди на обработку мы рекомендуем вам пошагово проверить другие возможные ошибки. Как это сделать мы расскажем далее.

    Загрузка карты сайта

    Первым делом перейдите в панель вебмастера Яндекс и откройте вкладку «Индексирование» — «Файлы Sitemap». Далее добавьте ссылку на карту ресурса в специальное поле. В течение двух недель система проверит документ и, если вы всё сделали правильно, напротив ссылки появится код ответа «ОК».

    Аналогично необходимо загрузить документ в Google Search Console.

    Настройка robots.txt

    Иногда поисковая система может не видеть карту проекта из-за того, что её индексация запрещена в файле robots.txt. В таком случае перед ссылкой будет стоять директива «Disallow» и вам необходимо изменить её на «allow» .

    Если же в robots.txt вовсе нет ссылки на документ, вы можете её добавить, прописав следующий код: «User-agent: * Allow: / Sitemap: [ссылка на документ]». Однако в таком случае вы откроете её для всех пользователей и этой информацией смогут воспользоваться злоумышленники. Поэтому мы рекомендуем предварительно посоветоваться со специалистом.

    Настройка robots.txt

    Проблемы с названием

    Иногда отсутствие используемых роботом файлов с картой сайта может быть вызвано тем, что вы назвали документ нестандартным именем. Во избежание проблем лучше присваивать документу стандартное наименование «sitemap.xml» .

    Как сформировать карту сайта?

    В завершение рассмотрим ситуацию, когда на сервере вовсе отсутствует документ с картой ресурса.

    Если у вас нет возможности нанимать специалиста в области SEO, вы можете воспользоваться автоматически генератором по созданию карты интернет-проекта. Однако этот способ платный и не всегда качественный. Поэтому некоторые большинство пользователей пытаются создать карту вручную с помощью рекомендаций Яндекс и Гугл. Однако следует иметь в виду, что они содержат не всю информацию. От себя также добавим, что при формировании файла sitemap, необходимо соблюдать следующие требования:

    • Документ должен иметь формат xml или txt. Преимущество xml в том, что кроме списка адресов, в нём также можно указать дополнительные параметры страниц (частоту обновления и изменения, относительную значимость). Никто не знает улучшают ли данные сведения качество индексации, но лишним это точно не будет. Поэтому мы всё же рекомендуем использовать формат xml.
    • Вы можете также создать вторую карту в формате html для пользователей. Однако поисковые системы будут её расценивать как обычную страницу. Поэтому наличие документа в формате xml или txt обязательно.
    • Документ должен размещаться на одинаковом домене с сайтом, для которого он составлен, и указывать только на URL-адреса этого домена.
    • В файле необходимо использовать кодировку «UTF-8».
    • В документе необходимо указывать только актуальные и работающие ссылки. Например, в нём не должно быть битых ссылок и редиректов.
    • Карта ресурса должна быть всегда актуальной, поэтому она должна автоматически генерироваться.

    Как видите, без базовых знаний в области сайтостроения и поисковой оптимизации создать sitemap самостоятельно не так просто. Поэтому во избежание возможных ошибок и траты времени мы рекомендуем все-таки обратиться за помощью к профессионалам.

    Понравилась статья? Поделить с друзьями:

    Читайте также:

  • Отстают обои как исправить
  • Отстают кварцевые часы как исправить
  • Отслойка нарощенного ногтя как исправить самой
  • Отслойка гель лака у кутикулы как исправить
  • Отслоился шеллак как исправить дома

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии