Яндекс с помощью нейросети расшифровал более 10 млн страниц архивных документов
Сервис «Поиск по архивам» компании «Яндекс» в партнерстве с Главархивом Москвы расшифровал тексты с устаревшими символами. В базу загружено более 5,4 млн страниц исторических материалов.
Сейчас на платформе представлены документы из архивов 11 регионов России. Машинные алгоритмы «Яндекса» распознали более 60 тыс. рукописных и печатных текстов середины XVIII — начала XX веков: в сумме это более 10 млн страниц, сообщает пресс-служба «Яндекса».
Также в сервисе предоставлены оцифрованные страницы таких изданий, как «Советский спорт», «Вечерняя Москва» и епархиальные ведомости.
Технология расшифровки нейросети основана на оптическом распознавании символов. Она узнает утратившие актуальность знаки, например, исчезнувшие из алфавита буквы, учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст.