Прорыв, который заставляет роботизированные лица казаться менее жуткими
Робот из Колумбийского университета научился реалистично двигать губами, наблюдая за своим отражением и видео с людьми, что может помочь преодолеть «эффект зловещей долины»
Short Summary
Исследователи из Колумбийской школы инженерии создали робота, который методом самообучения освоил реалистичную синхронизацию движения губ с речью и пением. Вместо программирования жёстких правил робот сначала экспериментировал с 26 лицевыми моторами перед зеркалом, чтобы понять, как управлять своей мимикой, а затем анализировал видео людей с YouTube, связывая звуки с соответствующими движениями губ. Этот подход позволил роботу воспроизводить речь на разных языках и даже исполнять песню из своего AI-альбома.
Это достижение преодолевает два ключевых препятствия: техническую сложность создания гибкого лица с множеством приводов и алгоритмическую сложность синхронизации быстрых фонетических изменений с мимикой. Хотя результат не идеален (например, со звуками «Б» и «В» остаются сложности), метод машинного обучения обещает постоянное улучшение. Исследователи подчёркивают, что реалистичная мимика — недостающее звено для создания эмоциональной связи между роботами и людьми в таких сферах, как уход за пожилыми, образование и здравоохранение.
Работа представляет собой значительный шаг к преодолению «эффекта зловещей долины», когда несовершенная имитация человека вызывает отторжение. Учёные видят будущее, в котором роботы, способные к естественной невербальной коммуникации, станут повсеместными, но призывают к осторожному и этичному развитию этой мощной технологии, способной глубоко вовлекать людей в эмоциональное взаимодействие.
Самообучение через наблюдение
Робот освоил управление лицевой мимикой, сначала экспериментируя перед зеркалом, а затем анализируя человеческую речь на видео, что позволило связать звук с движением губ без прямого программирования
Преодоление ключевых технических барьеров
Использование гибкого лица с 26 моторами и алгоритма, связывающего зрение и действие (VLA), решило проблемы координации и синхронизации, типичные для жёстких роботизированных лиц
Шаг к преодолению «зловещей долины»
Реалистичная синхронизация губ — критически важный элемент для создания естественной эмоциональной связи и уменьшения жуткого впечатления от гуманоидных роботов
Основа для будущего взаимодействия человек-робот
В сочетании с разговорным ИИ (например, ChatGPT) эта технология откроет новые возможности для применения роботов в сферах, требующих эмпатии и коммуникации: от ухода за пожилыми до образования
Text generated using AI


