ИТ / Новости
технологии цифровизация
22.7.2021

«Яндекс» раскрыл крупнейшую базу данных беспилотных авто

Она содержит более 1,6 тыс. часов движения, разбитых на 600 тыс. размеченных фрагментов поездок на дорогах России, Израиля и США в различных погодных условиях.

«Яндекс» опубликовал самый большой в мире набор сведений беспилотных автомобилей для исследований в области машинного обучения и автономного транспорта, сообщила пресс-служба компании.

 Датасет подготовлен для конкурса Shifts Challenge, который «Яндекс» проведет в рамках международной конференции NeurIPS 2021. Задача конкурса – привлечь внимание к проблеме «сдвига данных» в машинном обучении.

«Если вы привыкли водить машину в небольшом городе, то в Москве вы не сразу адаптируетесь к трафику и, скорее всего, поначалу будете более осторожны на дороге. Это и есть сдвиг данных. Вы можете оценить его масштаб и скорректировать свои действия», – сказал старший исследователь Yandex Research Андрей Малинин, слова которого приводятся в сообщении.

По его словам, машинно обученные модели должны уметь делать то же самое – оценивать величину сдвига и эффективно действовать в новых условиях.

Сдвиг данных возможен везде, где модели машинного обучения сталкиваются с незнакомыми ситуациями и неизвестными данными.

Для конкурса Shifts Challenge выбраны три области:

  • предсказание траектории движения транспорта и пешеходов на дороге;
  • прогнозирование погоды;
  • машинный перевод текстов.

Все данные обезличены – датасет по беспилотным автомобилям содержит высокоточные карты маршрутов и треки всех окружающих машин и пешеходов (их положение, скорость, ускорение и прочее), но не использует видео, где были бы видны номера машин или лица прохожих.

Фото: yandex.ru/blog  

Еще по теме

За счет чего российская цифровая техника будет востребована за рубежом

Как изменились подходы и скорость цифровизации за последние 20 лет

Почему будущих специалистов по информбезопасности разбирают еще со школы

Новые схемы интернет-мошенников и как им противостоять

Почему буксует импортозамещение электронных компонентов

Почему рынок коммерческих дата-центров нуждается в регулировании

Что ждет начинающего тестировщика в 2024 году

Как найти перспективные зарубежные рынки для российских решений

Какие угрозы несет интернет тел человечеству

Успеют ли банки заменить импортный софт и оборудование до 2025 года

Зачем компании вкладывают деньги в ИТ-состязания?

Импортозамещение и внутренняя разработка ПО в страховании

Почему рынок информационных технологий РФ возвращается к классической дистрибуции

Что сделано и не сделано в цифровизации России за 2023 год

Как заботу о вычислениях переложить на вендоров и почему не все к этому готовы