Нейросети Яндекса распознали тексты дореволюционного «Коммерсанта» и помогли обеспечить по ним удобный поиск

Нейросети Яндекса распознали тексты дореволюционного «Коммерсанта» и помогли обеспечить по ним удобный поиск

На сервисе Яндекса «Поиск по архивам» пользователи теперь могут смотреть выпуски дореволюционной деловой газеты «Коммерсант» и искать в них информацию — так же быстро, как по текстовым запросам в интернете. Это стало возможным благодаря сотрудничеству сервиса с Национальной электронной библиотекой (НЭБ) и Российской национальной библиотекой (РНБ). Выпуски дореволюционного «Коммерсанта» могут заинтересовать как исследователей, так и любителей истории, а «Поиск по архивам» поможет им узнать больше о людях и событиях начала XX века.

Пользователям доступно на сервисе 2250 номеров газеты — это больше 10 тыс. страниц. Чтобы это реализовать, РНБ — один из ключевых участников Национальной электронной библиотеки — передала для проекта оригиналы из своих фондов, а Яндекс преобразовал отсканированные и хранящиеся в НЭБ копии в электронные тексты. Для этого «Поиск по архивам» использовал технологию оптического распознавания символов и нейросеть, которая умеет считывать мелкие газетные шрифты.

Этот проект «Поиска по архивам», РНБ и НЭБ приурочен к 115-летию со дня выхода первого номера дореволюционного «Коммерсанта» — 5 августа (23 июля) 1909 года. Последний выпуск газеты вышел в 1917 году.

В издании можно найти самую разную информацию о людях и событиях начала прошлого века. Например, газета публиковала статьи об экономической жизни Российской империи, списки приезжих покупателей с указанием торговых подворий и гостиниц, где они проживали, данные о торгах на подряды и поставки по всей стране, информацию о банкротствах, извещения о платежах. В издании также можно посмотреть, как выглядела реклама более чем 100 лет назад.

На сервисе «Поиск по архивам» для поиска информации также доступны архивы газет «Советский спорт», «Вечерняя Москва», «Сенатские ведомости», «Русский инвалид» более чем за 100 лет, а также архив издания «Красная звезда» за 1924–1953 годы. 

Больше изображений — на Яндекс Диске.

О «Поиске по архивам»

«Поиск по архивам» — запущенный в начале 2023 года сервис Яндекса, который помогает быстро находить упоминания людей, населённых пунктов и событий в расшифрованных нейросетью рукописных документах XVIII–XX веков. В базе сервиса представлено более 13 миллионов страниц исторических документов из архивов Москвы, Московской, Оренбургской, Вологодской, Иркутской, Астраханской и других областей, а также нескольких муниципальных архивов. Кроме того, в сервисе можно искать информацию в архивах епархиальных ведомостей, «Советского спорта», «Вечерней Москвы», «Сенатских ведомостей», «Дагестанской правды» и «Красной звезды», а также в справочниках из фондов Национальной электронной библиотеки и Российской государственной библиотеки.

Теги

Контакты

Пресс-служба компании «Яндекс»
Ольга Молодан
Тел.: +7 495 739-70-00
Электронная почта: pr@yandex-team.ru

Поделиться

Карьера в Яндексе — создавайте с нами сервисы, которыми пользуются миллионы