«Яндекс» запускает облачный сервис распознавания речи
Компания «Яндекс» запустила для разработчиков облачный сервис распознавания речи SpeechKit Cloud. В его основе — технология распознавания голоса Yandex SpeechKit, которую компания представила в 2013 году.
Сервис работает с русским и турецким языками. В пресс-службе «Яндекса» сообщили, что SpeechKit основывается на следующих языковых моделях:
general — для поисковых запросов и коротких фраз (3–5 слов) на различную тематику;
maps — для ввода адресов, названий географических объектов и организаций;
freeform — для свободной диктовки коротких текстов, создания SMS, заметок, комментариев и т.д.
music — для запросов на музыкальную тематику (названия песен и групп, имена исполнителей).
SpeechKit Cloud может принимать голосовые команды в ноутбуках, мобильных устройствах и бытовой технике, осуществлять голосовое управление навигатором и другими автомобильными программами, обеспечивать работу голосового меню автоответчика, протоколировать прием пациента в медицинских организациях.
В «Яндексе» отмечают, инфраструктура сервиса спроектирована под высокие нагрузки. Кроме того, распознавание идет в реальном времени одновременно с передачей звуковых данных. Задержка от окончания отправки данных до получения результата распознавания не превышает 1 секунды.
При работе с SpeechKit Cloud, распознавание происходит на серверах, партнеры оплачивают использование технологии в зависимости от количества запросов. Для облачного сервиса средняя стоимость составляет 5 долларов за 1000 запросов. Для мобильной версии оплата зависит от условий соглашения, но при объеме до 10 тысяч голосовых запросов в сутки SpeechKit Mobile SDK предоставляется бесплатно.
Узнать подробнее о работе нового сервиса можно по ссылке.