«Яндекс» создал «Шедеврум» для генерации картинок
«Яндекс» представил прототип нейросети для генерации изображений по текстовым запросам. Бета-версия приложения «Шедеврум» доступна для мобильных платформ Android и iOS.
Изначально наиболее реалистичные фотографии создавались с помощью генеративных состязательных сетей (GAN), однако в последнее время пальма первенства принадлежит диффузионным моделям, которые итеративно преобразуют текстовое описание и случайный шум в некоторое изображение (text-to-image), рассказал RSpectr директор по науке лаборатории ИИ Сбера Андрей Савченко.
Большинство из них находятся в свободном доступе. Это такие сервисы как Stable Diffusion, Midjouney, Kandinsky и другие.
Руководитель исследовательских проектов Vision Labs Александр Паркин считает, что для весомых результатов в сегменте text-to-image потребуется еще пару лет. Он сообщил RSpectr, что пока для получения успешного изображения нейросети необходимо сделать несколько десятков запросов.