2.4 триллиона параметров: официальная версия Ernie 5.0 запущена
Baidu представила официальную версию собственной нативной мультимодальной модели Ernie 5.0 с 2.4 трлн параметров, которая демонстрирует производительность мирового уровня
Короткое резюме
Китайская компания Baidu 22 января официально запустила нативную мультимодальную модель Ernie 5.0 с рекордными 2.4 триллионами параметров. Модель обладает способностями к пониманию и генерации текста, изображений, аудио и видео, и уже доступна для пользователей через приложение Ernie, официальный сайт и облачную платформу Qianfan для бизнеса и разработчиков.
Ernie 5.0 использует инновационную архитектуру нативного единого мультимодального моделирования, которая обучает данные разных модальностей в единой авторегрессионной структуре, а не объединяет их на позднем этапе. Это обеспечивает глубокое слияние признаков. Модель также построена на сверхкрупной смешанной структуре экспертов (MoE) с ультраразреженной активацией (менее 3%), что повышает эффективность вывода. В ходе тестов её языковые и мультимодальные способности сравнялись с такими моделями, как Gemini-2.5-Pro и GPT-5-High.
Запуск модели знаменует значительный прогресс Baidu в области ИИ и укрепляет её позиции в глобальной «первой лиге». Проект «Наставник Ernie», в котором участвуют более 835 отраслевых экспертов, продолжит направленное обучение модели для повышения её логической строгости, профессиональной глубины и качества творческих результатов. Это событие подчёркивает растущую конкуренцию и инновации на мировом рынке больших языковых моделей.
Рекордный масштаб модели
Ernie 5.0 содержит 2.4 триллиона параметров, что делает её одной из крупнейших моделей в мире
Нативная мультимодальная архитектура
В отличие от распространённого подхода «позднего слияния», модель использует единую структуру для совместного обучения текста, изображений, видео и аудио, обеспечивая более глубокое понимание
Высокая эффективность вывода
Благодаря смешанной структуре экспертов (MoE) с ультраразреженной активацией (менее 3%) модель сочетает высокую производительность с эффективным использованием вычислительных ресурсов
Производительность мирового уровня
В независимых тестах языковые и мультимодальные способности Ernie 5.0 соответствуют ведущим мировым моделям, таким как Gemini-2.5-Pro и GPT-5-High
Текст сгенерирован с использованием ИИ

