Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя
Lead data scientist / data analyst / developer. Лектор и тренер в IT.  · 18 дек 2022

Пример тестового для дата-саентиста по OCR

Давно что-то у нас дата-саентисты без тестовых сидят. Пора исправлять ситуацию 👩🏻‍🎓
📔Требуется построить базовый алгоритм распознавания текста из документов. Основным документом будет являться паспорт РФ (примеры 10 паспортов можно взять здесь).
Вам необходимо 👇🏻
1️⃣ подобрать открытые библиотеки по распознаванию документов и провести распознавание паспортов с указанной ссылки;
2️⃣ основная часть задания – обучить собственный алгоритм, который распознает ФИО с паспорта (не пользуясь готовыми библиотеками OCR, но пользуясь открытыми данными по распознаванию текста или сгенерировать самостоятельно из книг);
3️⃣ составить ноутбук с результатами, выложить на GitHub.
На выполнение даётся 10 дней ⏱️
Канал PythonTalk в telegramПерейти на t.me/pythontalk_ru