Нейросети Яндекса научились расшифровывать архивные записи со сложной дореволюционной орфографией.
На данный момент можно опробовать технологию в действии на странице сервиса.
«Поиск по архивам» открывает доступ к более чем 2,5 миллионам страниц исторических документов с текстовой расшифровкой. Новый алгоритм, построен на основе системы оптического распознавания символов и учитывает особенности почерка, считывает потерявшие актуальность буквы и понимает особенность структуры старинных документов.
Чтобы научится расшифровывать записи из архива, нейросеть обучали на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII–XIX веков. Материалы для обучения размечали и расшифровывали эксперты, они же контролировали качество распознавания. Рукописи, которые неподготовленному человеку сложно разобрать, технология Яндекса почти мгновенно превращает в печатный текст.
Благодаря этому в базе сервиса можно быстро находить документы с упоминанием фамилии, населенного пункта или любых других слов. Искать можно по материалам XVIII — начала XX веков, которые больше всего пользуются популярностью у пользователей. Это метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения.
Документы можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями Яндекса. Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.
Ранее водители Яндекс Такси получили возможность получать выплаты без комиссий.
⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.
⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.