ИТ / Новости
технологии цифровизация
22.7.2021

«Яндекс» раскрыл крупнейшую базу данных беспилотных авто

Она содержит более 1,6 тыс. часов движения, разбитых на 600 тыс. размеченных фрагментов поездок на дорогах России, Израиля и США в различных погодных условиях.

«Яндекс» опубликовал самый большой в мире набор сведений беспилотных автомобилей для исследований в области машинного обучения и автономного транспорта, сообщила пресс-служба компании.

 Датасет подготовлен для конкурса Shifts Challenge, который «Яндекс» проведет в рамках международной конференции NeurIPS 2021. Задача конкурса – привлечь внимание к проблеме «сдвига данных» в машинном обучении.

«Если вы привыкли водить машину в небольшом городе, то в Москве вы не сразу адаптируетесь к трафику и, скорее всего, поначалу будете более осторожны на дороге. Это и есть сдвиг данных. Вы можете оценить его масштаб и скорректировать свои действия», – сказал старший исследователь Yandex Research Андрей Малинин, слова которого приводятся в сообщении.

По его словам, машинно обученные модели должны уметь делать то же самое – оценивать величину сдвига и эффективно действовать в новых условиях.

Сдвиг данных возможен везде, где модели машинного обучения сталкиваются с незнакомыми ситуациями и неизвестными данными.

Для конкурса Shifts Challenge выбраны три области:

  • предсказание траектории движения транспорта и пешеходов на дороге;
  • прогнозирование погоды;
  • машинный перевод текстов.

Все данные обезличены – датасет по беспилотным автомобилям содержит высокоточные карты маршрутов и треки всех окружающих машин и пешеходов (их положение, скорость, ускорение и прочее), но не использует видео, где были бы видны номера машин или лица прохожих.

Фото: yandex.ru/blog  

Еще по теме

Как привлечь зарубежный капитал через международное сотрудничество

Рынок унифицированных коммуникаций на пороге консолидации. Причем тут экспорт?

Как правильно выбрать информационную систему и изменить работу медучреждения

Почему сейчас лучший момент для совершенствования сервисной поддержки дата-центров

Как крупный бизнес диктует собственные правила в технологическом секторе

Как собрать в одном доступе цифровые медицинские ИТ-помощники

Что нужно знать техлиду при запуске проектов на основе искусственного интеллекта

В каких отраслях промышленности искусственный интеллект находит применение

Как региональные фестивали стали источниками кадров для столичных компаний

Грозит ли сбой, аналогичный инциденту с Microsoft, критической инфраструктуре РФ

Стоит ли ожидать дефицита качественной информации для обучения ИИ-моделей

За счет чего российская цифровая техника будет востребована за рубежом

Как изменились подходы и скорость цифровизации за последние 20 лет

Почему будущих специалистов по информбезопасности разбирают еще со школы

Новые схемы интернет-мошенников и как им противостоять