В России создали технологию умной потоковой обработки данных из чеков
Грамматические ошибки, опечатки и сокращения допускаются в 60-65% кассовых чеков из магазинов. Два года назад этот показатель был на уровне 80-85 процентов. Для исключения этой проблемы «Платформа ОФД» разработала технологию обработки коротких текстов, которая позволяет точно определять и идентифицировать товары и категории, указанные в чеках.
О применении технологии рассказал в ходе пресс-конференции «5 лет системе ОФД и онлайн-касс в России» генеральный директор «Платформы ОФД» Алексей Баров, сообщила пресс-служба «Платформы ОФД».
По его словам, процесс обработки происходит в режиме реального времени, позволяя в «потоке» фискальных документов скоростью более 1 тыс. транзакций в секунду – классифицировать, сравнивать и верифицировать товарные записи, в том числе содержащие грамматические ошибки.
«Благодаря технологиям MachineLearning и накопленной за несколько лет экспертизе в данных, мы научили нейросети нашей системы четко, оперативно, с минимум погрешностей – распознавать и анализировать поступающую информацию. Это позволяет находить смыслы в наборе букв и цифр. Сегодня такая потоковая обработка охватывает до 21 млн товаров (SKU) из 3,5 тыс. категорий, с шестью уровнями вложенности. С ростом объема данных, технология будет совершенствоваться и становиться «умнее». Мы планируем развивать это направление еще интенсивнее», – отметил А. Баров.