ИТ / Новости
технологии
24.5.2021

Facebook создала систему распознавания речи

Компания создала wav2vec Unsupervised (wav2vec-U) – систему распознавания речи, которая не требуют транскрибируемых данных. Разработку уже протестировали на таких языках, как суахили и татарский, для которых сейчас недоступны высококачественные модели распознавания речи.

«Это важный шаг на пути к созданию машин, которые смогут решать широкий круг задач, просто извлекая уроки из своих наблюдений. Мы думаем, что эта работа приблизит нас к миру, в котором речевые технологии доступны гораздо большему количеству людей», – говорится в сообщении Facebook.

Работа системы начинается с изучения структуры речи из немаркированного звука. Разработка сегментирует голосовую запись на речевые единицы, которые приблизительно соответствуют отдельным звукам. Например, слово «кот» включает в себя три звука: «/ K /», «/ AE /» и «/ T /».

«В более общем плане люди учатся многим навыкам, связанным с речью, просто слушая окружающих, – объяснили в Facebook. – Это говорит о том, что существует лучший способ обучения моделей распознавания речи, который не требует большого объема помеченных данных. Разработка более интеллектуальных систем такого рода – амбициозная долгосрочная научная задача, и мы верим, что wav2vec-U поможет нам продвинуться к этой важной и захватывающей цели».


Изображение: Freepik.xom

Еще по теме

Почему сейчас лучший момент для совершенствования сервисной поддержки дата-центров

Как крупный бизнес диктует собственные правила в технологическом секторе

Как собрать в одном доступе цифровые медицинские ИТ-помощники

Что нужно знать техлиду при запуске проектов на основе искусственного интеллекта

В каких отраслях промышленности искусственный интеллект находит применение

Как региональные фестивали стали источниками кадров для столичных компаний

Грозит ли сбой, аналогичный инциденту с Microsoft, критической инфраструктуре РФ

Стоит ли ожидать дефицита качественной информации для обучения ИИ-моделей

За счет чего российская цифровая техника будет востребована за рубежом

Как изменились подходы и скорость цифровизации за последние 20 лет

Почему будущих специалистов по информбезопасности разбирают еще со школы

Новые схемы интернет-мошенников и как им противостоять

Почему буксует импортозамещение электронных компонентов

Почему рынок коммерческих дата-центров нуждается в регулировании

Что ждет начинающего тестировщика в 2024 году