«Яндекс» раскрыл крупнейшую базу данных беспилотных авто
Она содержит более 1,6 тыс. часов движения, разбитых на 600 тыс. размеченных фрагментов поездок на дорогах России, Израиля и США в различных погодных условиях.
«Яндекс» опубликовал самый большой в мире набор сведений беспилотных автомобилей для исследований в области машинного обучения и автономного транспорта, сообщила пресс-служба компании.
Датасет подготовлен для конкурса Shifts Challenge, который «Яндекс» проведет в рамках международной конференции NeurIPS 2021. Задача конкурса – привлечь внимание к проблеме «сдвига данных» в машинном обучении.
«Если вы привыкли водить машину в небольшом городе, то в Москве вы не сразу адаптируетесь к трафику и, скорее всего, поначалу будете более осторожны на дороге. Это и есть сдвиг данных. Вы можете оценить его масштаб и скорректировать свои действия», – сказал старший исследователь Yandex Research Андрей Малинин, слова которого приводятся в сообщении.
По его словам, машинно обученные модели должны уметь делать то же самое – оценивать величину сдвига и эффективно действовать в новых условиях.
Сдвиг данных возможен везде, где модели машинного обучения сталкиваются с незнакомыми ситуациями и неизвестными данными.
Для конкурса Shifts Challenge выбраны три области:
- предсказание траектории движения транспорта и пешеходов на дороге;
- прогнозирование погоды;
- машинный перевод текстов.
Все данные обезличены – датасет по беспилотным автомобилям содержит высокоточные карты маршрутов и треки всех окружающих машин и пешеходов (их положение, скорость, ускорение и прочее), но не использует видео, где были бы видны номера машин или лица прохожих.
Фото: yandex.ru/blog