Давно что-то у нас дата-саентисты без тестовых сидят. Пора исправлять ситуацию 👩🏻🎓
📔Требуется построить базовый алгоритм распознавания текста из документов. Основным документом будет являться паспорт РФ (примеры 10 паспортов можно взять
здесь).
Вам необходимо 👇🏻
1️⃣ подобрать открытые библиотеки по распознаванию документов и провести распознавание паспортов с указанной ссылки;
2️⃣ основная часть задания – обучить собственный алгоритм, который распознает ФИО с паспорта (не пользуясь готовыми библиотеками OCR, но пользуясь открытыми данными по распознаванию текста или сгенерировать самостоятельно из книг);
3️⃣ составить ноутбук с результатами, выложить на GitHub.
На выполнение даётся 10 дней ⏱️