Парсинг - это автоматическое или полуавтоматическое извлечение информации из опубликованных размеченных и отформатированных данных. Форматирование и разметка производится в нескольких форматах, традиционно это XML - язык расширенной гипертекстовой разметки. Для некоторых организаций и ведомств публикация открытых данных предписана законом, они должны делать это либо на своём сайте, сайте ведомства или едином портале, например
Для извлечения можно использовать либо сторонние сервисы онлайн-просмотра (ручной режим), либо программный интерфейс (API) разрабатываемый хранителем для программистов, но если необходимо извлечь только часть данных из набора, стоит написать специальную программу парсер/Граббер, используя библиотеки парсинга имеющиеся в языках программирования.