документы, ИИ
IT / Новости
ИИ технологии
25.1.2024

Яндекс с помощью нейросети расшифровал более 10 млн страниц архивных документов

Сервис «Поиск по архивам» компании «Яндекс» в партнерстве с Главархивом Москвы расшифровал тексты с устаревшими символами. В базу загружено более 5,4 млн страниц исторических материалов.

Сейчас на платформе представлены документы из архивов 11 регионов России. Машинные алгоритмы «Яндекса» распознали более 60 тыс. рукописных и печатных текстов середины XVIII — начала XX веков: в сумме это более 10 млн страниц, сообщает пресс-служба «Яндекса».

Также в сервисе предоставлены оцифрованные страницы таких изданий, как «Советский спорт», «Вечерняя Москва» и епархиальные ведомости.

Технология расшифровки нейросети основана на оптическом распознавании символов. Она узнает утратившие актуальность знаки, например, исчезнувшие из алфавита буквы, учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст.

Изображение: Adobe Stock

Еще по теме

К чему приведет применение искусственного интеллекта в военной сфере

Как выстраивать и масштабировать инфраструктуру электронной коммерции в кризис

Что и как угрожает сейчас российской ИТ-инфраструктуре

Как веб-мастера, агентства и блогеры зарабатывают на рынке хостинга

Какие проблемы бизнеса решают MDM-системы

Почему программные роботы способствуют сохранению мотивации и продуктивности человека

Навыки, которые помогут сделать карьеру в ИТ-индустрии

Как искусственный интеллект помогает снизить затраты в логистике

Можно ли создавать собственные ИТ-продукты без программистов

Искусственный интеллект как спаситель книжного бизнеса

Как использовать плюсы и нивелировать минусы гибридных ИТ-инфраструктур

Как понять при онлайн-покупке, что игрушка безопасна для здоровья ребенка

Кибермошенники устраиваются в компании с помощью дипфейк-технологий

Как обеспечить безопасность персональных данных при переходе на цифровой документооборот

Почему генеративный ИИ пока далек от идеала, но еще себя покажет