Нейросети Яндекса научились расшифровывать архивные записи со сложной дореволюционной орфографией.

На данный момент можно опробовать технологию в действии на странице сервиса.

Реклама: 2VtzquY3wEz

«Поиск по архивам» открывает доступ к более чем 2,5 миллионам страниц исторических документов с текстовой расшифровкой. Новый алгоритм, построен на основе системы оптического распознавания символов и учитывает особенности почерка, считывает потерявшие актуальность буквы и понимает особенность структуры старинных документов.

Пример поиска

Чтобы научится расшифровывать записи из архива, нейросеть обучали на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII–XIX веков. Материалы для обучения размечали и расшифровывали эксперты, они же контролировали качество распознавания. Рукописи, которые неподготовленному человеку сложно разобрать, технология Яндекса почти мгновенно превращает в печатный текст.

Поиск по архивам в Яндексе

Благодаря этому в базе сервиса можно быстро находить документы с упоминанием фамилии, населенного пункта или любых других слов. Искать можно по материалам XVIII — начала XX веков, которые больше всего пользуются популярностью у пользователей. Это метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения.

Документы можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями Яндекса. Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.

Ранее водители Яндекс Такси получили возможность получать выплаты без комиссий.

Сравнение онлайн-курсов
Перед тем, как купить любой курс, сравните условия от разных школ — стоимость обучения, скидки, длительность, есть ли программа трудоустройства.

Подобрать онлайн-курс >>
Реклама
Больше статей по теме:

ОСТАВЬТЕ ОТВЕТ

Напишите комментарий
Введите своё имя