Воплощенный интеллект роботов ускоряет эволюцию: почему внедрение в реальные сценарии сталкивается с серьезными вызовами

Несмотря на впечатляющие демонстрации навыков человекоподобных роботов, их массовое внедрение в быту и на работе сдерживается нехваткой данных, отсутствием стандартов и неопределенностью технологических путей

news.sciencenet.cn

Короткое резюме

Человекоподобные роботы демонстрируют удивительные навыки, такие как занятия ушу или бег марафона, однако их путь в реальный мир для выполнения полезной работы полон трудностей. Технологический маршрут ещё не пройден, а потребительский рынок для универсальных роботов, за исключением специфических сценариев, ещё не сформировал устойчивого спроса. Ключевой проблемой является переход от лабораторных демонстраций к стабильной работе в изменчивых реальных условиях.

Основным препятствием считается острая нехватка высококачественных данных из реального мира для обучения «мозга» робота — мультимодальных моделей воплощённого интеллекта (VLA — Visual Language and Action). Для достижения отраслевого «момента ChatGPT» необходимы миллионы часов данных, но даже ведущие игроки отстают на порядок. Отрасль активно ищет решения: разрабатываются новые методы сбора данных (например, портативное устройство UMI — User-generated Multimodal Interface или головные камеры), которые позволяют упростить и удешевить процесс, а также алгоритмы для преобразования обычных видео в обучающие наборы данных для роботов. Однако отсутствие стандартизации форматов данных и разнообразие конструкций роботов (разные манипуляторы, «тела») мешают накоплению и совместному использованию качественных данных, что тормозит прогресс моделей.

В краткосрочной перспективе (1–2 года) ожидаются прорывные коммерческие внедрения в конкретных, узких сценариях, таких как уборка в домах вместе с клинерами (работниками клининговой компании) или сортировка товаров в супермаркетах, где роботы могут «учиться на практике». Однако до появления по-настоящему универсальных роботов, сравнимых с человеком, эксперты отводят 5–10 лет. Для устойчивого развития отрасль нуждается в консолидации: в Китае уже начали разрабатывать стандартную систему для человекоподобных роботов и воплощённого интеллекта, что сравнивают со строительством прочного фундамента для будущего «здоровья» всей индустрии. Хотя точный момент технологического взрыва предсказать сложно, отрасль движется методом проб и ошибок, и ответы будут появляться по мере развития.

Ключевые выводы

Дефицит данных — главный барьер

Для «момента ChatGPT» в области воплощённого интеллекта необходимы миллионы часов реальных данных, но текущие объёмы у ведущих компаний отстают на порядок

Отсутствие стандартов сдерживает прогресс

Разнообразие конструкций роботов и нестандартизированные форматы данных препятствуют накоплению и совместному использованию качественных обучающих наборов, что мешает скачку в возможностях моделей

Фокус на узких сценариях

В ближайшие 1–2 года ожидаются первые успешные коммерческие внедрения в конкретных областях (например, домашняя уборка, логистика), тогда как создание универсального робота займёт 5–10 лет

Инновации в сборе данных

Отрасль активно развивает новые методы, такие как портативные устройства сбора данных (UMI — User-generated Multimodal Interface), алгоритмы преобразования видео и головные камеры, чтобы сделать сбор данных массовым, дешёвым и не мешающим обычной жизни людей

Текст сгенерирован с использованием ИИ

Стандартизация, Воплощенный интеллект, Человекоподобные роботы, Обучение роботов, Сбор данных, Коммерческое внедрение

Воплощенный интеллект роботов ускоряет эволюцию: почему внедрение в реальные сценарии сталкивается с серьезными вызовами

Короткое резюме

Рекомендации по теме

Комментарии

Лента

Воплощенный интеллект роботов ускоряет эволюцию: почему внедрение в реальные сценарии сталкивается с серьезными вызовами

Короткое резюме

Рекомендации по теме

Комментарии

Лента.css-1kwqo06{position:absolute;height:2px;bottom:0;width:100%;-webkit-transition:all 300ms cubic-bezier(0.4, 0, 0.2, 1) 0ms;transition:all 300ms cubic-bezier(0.4, 0, 0.2, 1) 0ms;background-color:#282c6b;}

Лента