В России запустили платформу для оценки качества ИИ-моделей
В России появилась первая независимая русскоязычной платформа LLM Arena для оценки качества экспериментальных моделей нейросетей.
Сервис работает по принципу «чат-бот арены», где пользователям ресурса предлагается сравнить результат работы двух моделей и выбрать лучший, а на основе полученных оценок формируется рейтинг нейросетей, пишет «Коммерсантъ».
Разработчиком ресурса является Роман Куцев в коллаборации с экспертами по нейросетям и бывшими разработчиками TrainingData.ru.
На платформе можно оценить качество как зарубежных нейросетей: GPT-4o, Claude 3,5 Sonnet, Llama 3.1, так и экспериментальной модели YandexGPT.