Google опробовала офлайн-решение для распознавания речи
Компания Google создала систему распознавания речи, которая занимает всего 20 Мб памяти мобильного устройства и не требует подключения к интернету.
В ходе тестирования решение Google продемонстрировало коэффициент погрешности 13,5 процента, передает CNews. В компании отметили, что этот показатель хуже, чем у облачных аналогов, но все равно является достаточно хорошим. Проверка системы состоялась на смартфоне LG Nexus 5.
Для сравнения, распознавание речи в Google Now происходит с погрешностью в восемь процентов, у голосового помощника Apple — Siri — это значение равно пяти процентам. Обе технологии работают только при наличии подключения к интернету, так как обработка команд выполняется на сервере.
Технология Google включает квантованную акустическую модель Long Short-Term Memory (LSTM) вместе с Connectionist Temporal Classification (CTC).
Для верного распознавания имен в языковую модель был интегрирован список контактов с мобильного устройства. После этого система была обучена посредством трех миллионов голосовых взаимодействий общей продолжительностью свыше 2 тыс. часов.
В компании не уточнили, появится ли когда-нибудь подобная система в коммерческих продуктах.
Изображение: lori.ru