Выгрузка архива всех страниц сайта
Возвращает архив c информацией о страницах, которые были добавлены в Sitemap.
Скачать архив можно в Вебмастере на странице Индексирование → Все страницы.
Чтобы скачать архив:
-
С помощью POST-запроса начните формирование архива.
В зависимости от размера архива процесс может занять от 10 секунд до 3 минут. В результате вы получитеtask_id
— уникальный идентификатор задачи по формированию архива. -
C помощью GET-запроса проверьте статус задачи.
Форматы запросов
POST https://api.webmaster.yandex.net/v4/user/{user-id}/hosts/{host-id}/indexing/archive/
|
Тип: |
|
Тип: |
GET https://api.webmaster.yandex.net/v4/user/{user-id}/hosts/{host-id}/indexing/archive/{task-id}
|
Тип: |
|
Тип: |
|
Тип: |
Форматы ответов
JSON
{ "task_id": "c7fe80c0-36e3-11e6-8b2d-df96aa592c0a" }
Параметр
Обязательный
Тип
Описание
task_id
Да
string
Идентификатор задачи формирования архива.
JSON
{ "task_id": "c7fe80c0-36e3-11e6-8b2d-df96aa592c0a", "state": "DONE", "download_url": "https://storage.mds.yandex.net/..." }
Параметр
Обязательный
Тип
Описание
task_id
Да
string
Идентификатор задачи формирования архива.
state
Да
string
Cтатус задачи. Возможные значения:
IN_PROGRESS
— архив формируется. Периодически отправляйте GET-запросы, чтобы следить за выполнением задачи.DONE
— архив сформирован. В полеdownload_url
появится ссылка для скачивания.FAILED
— задача не выполнена по какой-либо причине.
download_url
Да
string
URL-адрес для скачивания архива, если задача имеет статус
DONE
.
Коды ответа
Чтобы посмотреть структуру ответа подробнее, нажмите на причину.
Код |
Причина |
Описание |
403 |
ID пользователя, выдавшего токен, отличается от указанного в запросе. В примерах ниже JSON
XML
|
|
404 |
Не подтверждены права на управление сайтом. JSON
XML
|
Код |
Причина |
Описание |
403 |
ID пользователя, выдавшего токен, отличается от указанного в запросе. В примерах ниже JSON
XML
|
|
404 |
Не подтверждены права на управление сайтом. JSON
XML
|
|
404 |
Не найдена задача с указанным ID. JSON
XML
|
Узнайте больше
Тип: int64
. ID пользователя. Необходим для вызова любых ресурсов API Яндекс Вебмастера. Чтобы получить его, используйте метод GET /v4/user.
Тип: host id (string)
. ID сайта. Чтобы получить его, используйте метод GET /v4/user/{user‑id}/hosts.
Обязательный параметр
Смещение в списке. Минимальное значение — 0. Значение по умолчанию: 0.
Количество записей (1-100). Значение по умолчанию: 10.
Описание
Код ошибки.
Описание
Сообщение об ошибке.
Описание
Значение.
Описание
Поле.
Описание
ID запрошенного сайта.
Описание
ID сайта.
Описание
Признак подтверждения сайта.
Описание
ID файла Sitemap
.
Описание
Список поддерживаемых типов контента.
Описание
Лимит на количество добавленных сайтов.
Описание
Лимит количества фидов.
Описание
Лимит количества добавленных фидов.
Описание
ID пользователя, от имени которого разрешен доступ.
Описание
Дата и время, до которого адрес доступен для создания задачи.
Описание
Список поддерживаемых типов контента.
Описание
Список поддерживаемых типов кодировки.
Описание
Максимальная длина.
Описание
Минимальная длина.
Описание
Доступное количество запросов в сутки.
Индикатор |
Описание |
|
Изменился HTTP-кода ответа, который получил робот при обходе страницы. |
|
Изменился статус страницы в поиске (добавлена или удалена). |
|
Изменился заголовок страницы. |
|
Изменилось содержимое метатега Description. |
Индикатор |
Описание |
|
Подробнее о статусах см. в Справке. |
|
Неподдерживаемый HTTP-код, ошибка соединения и др. |
Индикатор |
Описание |
|
Роботу неизвестно о странице или она длительное время была недоступна. Отправьте страницу на переобход. |
|
При обращении к сайту роботу не удалось установить соединение с сервером. Проверьте ответ сервера, убедитесь в отсутствии блокировки робота Яндекса на стороне провайдера. Сайт начнет индексироваться автоматически, если станет доступным для робота. О User agent роботов см. в Справке. |
|
Страница осуществляет перенаправление, при котором индексируется его цель (RedirectTarget). Проверьте индексирование страницы, на которую выполняется редирект. |
|
При обращении к странице возникла ошибка «HTTP-ошибка». Проверьте ответ сервера. Если проблема актуальна, обратитесь к администратору своего сайта или сервера. Если страница уже доступна, отправьте ее на переобход. |
|
Страница проиндексирована по каноническому адресу, который был указан в атрибуте rel="canonical" в ее исходном коде. Исправьте или удалите атрибут, если он указан некорректно. Робот отследит изменения автоматически. |
|
Страница относится к неглавному адресу сайта, поэтому была исключена из поиска. |
|
При обращении к странице роботу не удалось получить ее содержимое. Проверьте ответ сервера или наличие запрещающих HTML-элементов. Если проблема актуальна, обратитесь к администратору своего сайта или сервера. Если страница уже доступна, отправьте ее на переобход. |
|
Индексирование сайта запрещено в файле |
|
Индексирование страницы запрещено в robots.txt. Робот автоматически начнет посещать страницу, когда она станет доступной для индексирования. |
|
Страница дублирует уже представленную в поиске страницу сайта. Подробнее см. в Справке. |
|
Страница отсутствует в поиске в результате работы алгоритма. Если алгоритм сочтет страницу достаточно релевантной запросам пользователей, она появится в поиске автоматически. |
|
Страница была исключена из поиска в результате обработки роботом директивы Clean-param. Чтобы страница индексировалась, измените |
|
Страница исключена из-за метатега robots со значением noindex. |
|
У робота нет актуальных данных для страницы. Проверьте ответ сервера или наличие запрещающих HTML-элементов. Если страница недоступна для робота, обратитесь к администратору своего сайта или сервера. Если страница уже доступна, отправьте ее на переобход. |