Nvidia представила нейросеть для улучшения качества видеозвонков
Компания создала платформу Nvidia Maxine для разработки сервисов видеосвязи на базе искусственного интеллекта и с GPU-ускорением для улучшения потокового видео. Maxine будет обрабатывать звонки в облаке с помощью графических процессоров Nvidia и повышать качество звонков.
Компания утверждает, что платформа поможет исправить некоторые из наиболее распространенных проблем при видеозвонках. В частности, Nvidia Maxine позволяет снизить требования к пропускной способности «до одной десятой от требований стандарта сжатия потокового видео» – инструмент передает только «ключевые точки лица», а ИИ восстанавливает изображение в видео на другой стороне. Снижение требований позволит снизить расходы провайдеров на инфраструктуру, отметили в компании.
Кроме того, с помощью ИИ платформа может выравнивать лица и глаза звонящих так, чтобы они всегда были обращены в камеру, повысить разрешение видео и подавить фоновый шум. Также платформа может в реальном времени показывать субтитры и перевод речи.
Разработчики также смогут добавлять в свои сервисы функции, позволяющие пользователям заменить себя на анимированных аватаров – они будут в реальном времени повторять голос и тон участников видеозвонка.