Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Что такое парсинг открытых данных?

Юриспруденция
Виктория Смирнова
Юриспруденция
  · 1,2 K
Специалист по обучению  · 15 авг 2021  · ivlev.ru

Парсинг - это автоматическое или полуавтоматическое извлечение информации из опубликованных размеченных и отформатированных данных. Форматирование и разметка производится в нескольких форматах, традиционно это XML - язык расширенной гипертекстовой разметки. Для некоторых организаций и ведомств публикация открытых данных предписана законом, они должны делать это либо на своём сайте, сайте ведомства или едином портале, например

ACF21955-124A-4D7D-9687-A6BDA0627606.png

Для извлечения можно использовать либо сторонние сервисы онлайн-просмотра (ручной режим), либо программный интерфейс (API) разрабатываемый хранителем для программистов, но если необходимо извлечь только часть данных из набора, стоит написать специальную программу парсер/Граббер, используя библиотеки парсинга имеющиеся в языках программирования.

Слушайте меня ежедневно в подкасте «Доброй ночи, Вьетнам!» Перейти на t.me/GoodNightVietnam
1 эксперт согласен
Первый
Парсинг открытых данных это технология считывания этих данных для дальнейшего анализа, структурировании и систематизации в автоматическом режиме. Например, робот-парсер проходит поочерёдно все открытые страницы сайта Почты России, выбирая индекс, адрес почтового отделения и телефонный номер. Из огромного массива считываемых данных данных можно так же искать закономерн... Читать далее