Выгрузка архива всех страниц сайта
Возвращает архив c информацией о страницах, которые были добавлены в Sitemap.
Скачать архив можно в Вебмастере на странице Индексирование → Все страницы.
Чтобы скачать архив:
-
С помощью POST-запроса начните формирование архива.
В зависимости от размера архива процесс может занять от 10 секунд до 3 минут. В результате вы получитеtask_id— уникальный идентификатор задачи по формированию архива. -
C помощью GET-запроса проверьте статус задачи.
Форматы запросов
POST https://api.webmaster.yandex.net/v4/user/{user-id}/hosts/{host-id}/indexing/archive/
|
|
Тип: |
|
|
Тип: |
GET https://api.webmaster.yandex.net/v4/user/{user-id}/hosts/{host-id}/indexing/archive/{task-id}
|
|
Тип: |
|
|
Тип: |
|
|
Тип: |
Форматы ответов
JSON
{ "task_id": "c7fe80c0-36e3-11e6-8b2d-df96aa592c0a" }
Параметр
Обязательный
Тип
Описание
task_idДа
stringИдентификатор задачи формирования архива.
JSON
{ "task_id": "c7fe80c0-36e3-11e6-8b2d-df96aa592c0a", "state": "DONE", "download_url": "https://storage.mds.yandex.net/..." }
Параметр
Обязательный
Тип
Описание
task_idДа
stringИдентификатор задачи формирования архива.
stateДа
stringCтатус задачи. Возможные значения:
IN_PROGRESS— архив формируется. Периодически отправляйте GET-запросы, чтобы следить за выполнением задачи.DONE— архив сформирован. В полеdownload_urlпоявится ссылка для скачивания.FAILED— задача не выполнена по какой-либо причине.
download_urlДа
stringURL-адрес для скачивания архива, если задача имеет статус
DONE.
Коды ответа
Чтобы посмотреть структуру ответа подробнее, нажмите на причину.
|
Код |
Причина |
Описание |
|
403 |
ID пользователя, выдавшего токен, отличается от указанного в запросе. В примерах ниже JSON
XML
|
|
|
404 |
Не подтверждены права на управление сайтом. JSON
XML
|
|
Код |
Причина |
Описание |
|
403 |
ID пользователя, выдавшего токен, отличается от указанного в запросе. В примерах ниже JSON
XML
|
|
|
404 |
Не подтверждены права на управление сайтом. JSON
XML
|
|
|
404 |
Не найдена задача с указанным ID. JSON
XML
|
Узнайте больше
Тип: int64. ID пользователя. Необходим для вызова любых ресурсов API Яндекс Вебмастера. Чтобы получить его, используйте метод GET /v4/user.
Тип: host id (string). ID сайта. Чтобы получить его, используйте метод GET /v4/user/{user‑id}/hosts.
Обязательный параметр
Смещение в списке. Минимальное значение — 0. Значение по умолчанию: 0.
Количество записей (1-100). Значение по умолчанию: 10.
Описание
Код ошибки.
Описание
Сообщение об ошибке.
Описание
Значение.
Описание
Поле.
Описание
ID запрошенного сайта.
Описание
ID сайта.
Описание
Признак подтверждения сайта.
Описание
ID файла Sitemap.
Описание
Список поддерживаемых типов контента.
Описание
Лимит на количество добавленных сайтов.
Описание
Лимит количества фидов.
Описание
Лимит количества добавленных фидов.
Описание
ID пользователя, от имени которого разрешен доступ.
Описание
Дата и время, до которого адрес доступен для создания задачи.
Описание
Список поддерживаемых типов контента.
Описание
Список поддерживаемых типов кодировки.
Описание
Максимальная длина.
Описание
Минимальная длина.
Описание
Доступное количество запросов в сутки.
|
Индикатор |
Описание |
|
|
Изменился HTTP-кода ответа, который получил робот при обходе страницы. |
|
|
Изменился статус страницы в поиске (добавлена или удалена). |
|
|
Изменился заголовок страницы. |
|
|
Изменилось содержимое метатега Description. |
|
Индикатор |
Описание |
|
|
Подробнее о статусах см. в Справке. |
|
|
Неподдерживаемый HTTP-код, ошибка соединения и др. |
|
Индикатор |
Описание |
|
|
Роботу неизвестно о странице или она длительное время была недоступна. Отправьте страницу на переобход. |
|
|
При обращении к сайту роботу не удалось установить соединение с сервером. Проверьте ответ сервера, убедитесь в отсутствии блокировки робота Яндекса на стороне провайдера. Сайт начнет индексироваться автоматически, если станет доступным для робота. О User agent роботов см. в Справке. |
|
|
Страница осуществляет перенаправление, при котором индексируется его цель (RedirectTarget). Проверьте индексирование страницы, на которую выполняется редирект. |
|
|
При обращении к странице возникла ошибка «HTTP-ошибка». Проверьте ответ сервера. Если проблема актуальна, обратитесь к администратору своего сайта или сервера. Если страница уже доступна, отправьте ее на переобход. |
|
|
Страница проиндексирована по каноническому адресу, который был указан в атрибуте rel="canonical" в ее исходном коде. Исправьте или удалите атрибут, если он указан некорректно. Робот отследит изменения автоматически. |
|
|
Страница относится к неглавному адресу сайта, поэтому была исключена из поиска. |
|
|
При обращении к странице роботу не удалось получить ее содержимое. Проверьте ответ сервера или наличие запрещающих HTML-элементов. Если проблема актуальна, обратитесь к администратору своего сайта или сервера. Если страница уже доступна, отправьте ее на переобход. |
|
|
Индексирование сайта запрещено в файле |
|
|
Индексирование страницы запрещено в robots.txt. Робот автоматически начнет посещать страницу, когда она станет доступной для индексирования. |
|
|
Страница дублирует уже представленную в поиске страницу сайта. Подробнее см. в Справке. |
|
|
Страница отсутствует в поиске в результате работы алгоритма. Если алгоритм сочтет страницу достаточно релевантной запросам пользователей, она появится в поиске автоматически. |
|
|
Страница была исключена из поиска в результате обработки роботом директивы Clean-param. Чтобы страница индексировалась, измените |
|
|
Страница исключена из-за метатега robots со значением noindex. |
|
|
У робота нет актуальных данных для страницы. Проверьте ответ сервера или наличие запрещающих HTML-элементов. Если страница недоступна для робота, обратитесь к администратору своего сайта или сервера. Если страница уже доступна, отправьте ее на переобход. |