News

00:00
Со страниц China Science Daily
Со страниц China Science Daily
...
News
18:56, 25 Jan

2.4 триллиона параметров: официальная версия Ernie 5.0 запущена

Baidu представила официальную версию собственной нативной мультимодальной модели Ernie 5.0 с 2.4 трлн параметров, которая демонстрирует производительность мирового уровня

2.4万亿参数,文心5.0正式版上线—新闻—科学网
news.sciencenet.cn

Short Summary

Китайская компания Baidu 22 января официально запустила нативную мультимодальную модель Ernie 5.0 с рекордными 2.4 триллионами параметров. Модель обладает способностями к пониманию и генерации текста, изображений, аудио и видео, и уже доступна для пользователей через приложение Ernie, официальный сайт и облачную платформу Qianfan для бизнеса и разработчиков.

Ernie 5.0 использует инновационную архитектуру нативного единого мультимодального моделирования, которая обучает данные разных модальностей в единой авторегрессионной структуре, а не объединяет их на позднем этапе. Это обеспечивает глубокое слияние признаков. Модель также построена на сверхкрупной смешанной структуре экспертов (MoE) с ультраразреженной активацией (менее 3%), что повышает эффективность вывода. В ходе тестов её языковые и мультимодальные способности сравнялись с такими моделями, как Gemini-2.5-Pro и GPT-5-High.

Запуск модели знаменует значительный прогресс Baidu в области ИИ и укрепляет её позиции в глобальной «первой лиге». Проект «Наставник Ernie», в котором участвуют более 835 отраслевых экспертов, продолжит направленное обучение модели для повышения её логической строгости, профессиональной глубины и качества творческих результатов. Это событие подчёркивает растущую конкуренцию и инновации на мировом рынке больших языковых моделей.

Key Takeaways
Рекордный масштаб модели

Ernie 5.0 содержит 2.4 триллиона параметров, что делает её одной из крупнейших моделей в мире

Нативная мультимодальная архитектура

В отличие от распространённого подхода «позднего слияния», модель использует единую структуру для совместного обучения текста, изображений, видео и аудио, обеспечивая более глубокое понимание

Высокая эффективность вывода

Благодаря смешанной структуре экспертов (MoE) с ультраразреженной активацией (менее 3%) модель сочетает высокую производительность с эффективным использованием вычислительных ресурсов

Производительность мирового уровня

В независимых тестах языковые и мультимодальные способности Ernie 5.0 соответствуют ведущим мировым моделям, таким как Gemini-2.5-Pro и GPT-5-High

Text generated using AI

Искусственный интеллект, Baidu, Ernie 5.0, Мультимодальный ИИ, Большая языковая модель, Смешанная структура экспертов (MoE)
1

Recommendations on the topic

Comments

Golos Nauki Logo
Home page
Support Project
Sections
Быстрый доступ
  • Author's interview
  • Video Abstracts
Sponsor
* is not an advertisement
Presentation
Information

    Phone: 8 (800) 350 17-24email: office@golos-nauki.ru
    Sign Up
    Со страниц China Science DailyNews Feed
    Other News