ИИ, возможно, не нужны огромные массивы тренировочных данных
Исследование показывает, что архитектура ИИ, вдохновлённая биологическим мозгом, может генерировать мозгоподобную активность даже без обучения, что ставит под сомнение текущую парадигму «больших данных»
Короткое резюме
Учёные из Университета Джонса Хопкинса обнаружили, что искусственные нейронные сети, чья архитектура напоминает биологический мозг, могут демонстрировать активность, схожую с человеческим мозгом, ещё до какого-либо обучения на данных. В частности, свёрточные нейронные сети (свёрточные нейронные сети), даже в нетренированном состоянии, показали паттерны активности, сопоставимые с мозговой реакцией приматов и людей на визуальные стимулы.
Исследователи сравнили три популярных архитектуры — трансформеры, полносвязные и свёрточные сети — в их нетренированном виде. Результаты показали, что увеличение количества нейронов в трансформерах и полносвязных сетях почти не меняло их активность, в то время как аналогичные модификации в свёрточных нейронных сетях приводили к значительному приближению к мозгоподобным паттернам. Это говорит о том, что сама архитектура играет критическую роль, возможно, не менее важную, чем объём тренировочных данных.
Открытие бросает вызов доминирующему подходу, требующему колоссальных вычислительных ресурсов и гигантских наборов данных, и указывает на альтернативный путь развития искусственного интеллекта. Правильная «биологическая» архитектура может стать выгодной стартовой точкой, позволяющей радикально ускорить обучение, снизить затраты и энергопотребление. Теперь команда изучает биологически вдохновлённые методы обучения для создания нового поколения эффективных систем искусственного интеллекта.
Архитектура как ключевой фактор
Свёрточные нейронные сети (свёрточные нейронные сети) в нетренированном состоянии показали активность, значительно более близкую к мозговой, чем другие архитектуры (трансформеры, полносвязные сети), что указывает на первостепенную роль дизайна системы
Конкуренция с обученными моделями
Нетренированные свёрточные нейронные сети продемонстрировали активность, сопоставимую с традиционными системами искусственного интеллекта, которые прошли обучение на миллионах или миллиардах изображений, лишь за счёт своей архитектуры
Вызов парадигме «больших данных»
Исследование ставит под сомнение необходимость исключительно масштабных данных и вычислительных мощностей для достижения мозгоподобного поведения, предлагая альтернативу в виде биологически вдохновлённого дизайна
Потенциал для ускоренного развития
Правильная архитектура закладывает выгодную стартовую позицию, что может позволить значительно ускорить обучение искусственного интеллекта, снизить его стоимость и энергопотребление, открывая путь к более эффективным системам
Текст сгенерирован с использованием ИИ


