Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Lead data scientist / data analyst / developer. Лектор и тренер в IT. · 18 дек 2022

Пример тестового для дата-саентиста по OCR

Давно что-то у нас дата-саентисты без тестовых сидят. Пора исправлять ситуацию 👩🏻‍🎓

📔Требуется построить базовый алгоритм распознавания текста из документов. Основным документом будет являться паспорт РФ (примеры 10 паспортов можно взять здесь).

Вам необходимо 👇🏻

1️⃣ подобрать открытые библиотеки по распознаванию документов и провести распознавание паспортов с указанной ссылки;

2️⃣ основная часть задания – обучить собственный алгоритм, который распознает ФИО с паспорта (не пользуясь готовыми библиотеками OCR, но пользуясь открытыми данными по распознаванию текста или сгенерировать самостоятельно из книг);

3️⃣ составить ноутбук с результатами, выложить на GitHub.

На выполнение даётся 10 дней ⏱️

Канал PythonTalk в telegram

Перейти на t.me/pythontalk_ru