В России разработали технологию самообучения ИИ
Российские специалисты Московского физико-технического института (МФТИ) разработали технологию, которая дает возможность искусственному интеллекту (ИИ) самостоятельно собирать текстовые данные для обучения нейросетей.
Эта технология позволяет автоматически выполнять этот подготовительный этап. Ранее аннотаторы или краудсорсеры, специально подобранные для этой работы выполняли этот монотонный и трудоемкий процесс около 2 месяцев, пишут «Известия».
Новая методология будет широко применяться для аннотации лингвистических данных, которые необходимы для обработки диалогов для обучения чат-ботов.
Эксперты на обработку одного диалога тратят в среднем от 14,5 до 29 минут, технология позволяет выполнить этот процесс за 10 минут. Однако эксперты предупреждают, что самообучения языковых моделей может привести к увеличению числа фейков на интернет-площадках.