Официально представлена предварительная версия DeepSeek V4

DeepSeek выпустил предварительную версию V4, достигнув лидерства в области с открытым исходным кодом по возможностям агента, мировым знаниям и производительности логического вывода, и ввёл поддержку механизма внимания нового поколения для работы с контекстом объёмом в миллион знаков.

news.sciencenet.cn

Короткое резюме

DeepSeek 24 апреля официально выпустил предварительную версию новой серии моделей DeepSeek-V4 и сделал её открытой для сообщества. Модель обладает контекстом длиной в миллион символов и лидирует в области внутренних и открытых разработок по возможностям агента, знаниям о мире и производительности логического вывода. Модель разделена на две версии по размеру — V4-Pro и V4-Flash, служба API также была обновлена одновременно.

DeepSeek-V4-Pro в тестировании возможностей агента достиг лучшего уровня среди открытых моделей и стал моделью AgenticCoding, используемой внутренними сотрудниками компании, превосходя Sonnet 4.5 и приближаясь к Opus 4.6 в режиме без размышлений. В тестировании знаний о мире V4-Pro значительно опережает другие открытые модели, уступая лишь ведущей закрытой модели Gemini-Pro-3.1. V4-Flash в простых задачах агента сопоставим с V4-Pro, но в задачах высокой сложности всё ещё есть разрыв. Модель также внедрила совершенно новый механизм внимания (DSA — разрежённое внимание), сжимающий данные на уровне токенов, что значительно снижает требования к вычислениям и видеопамяти, контекст в 1 миллион символов станет стандартной функцией всех официальных сервисов DeepSeek.

Действия DeepSeek происходят на фоне обострения конкуренции в сфере отечественного ИИ, компания сталкивается с острой конкуренцией со стороны компаний Zhiyue, MiniMax, Kimi. Ранее сообщалось, что DeepSeek начинает первое внешнее финансирование с оценочной стоимостью более 100 миллиардов долларов и планирует привлечь не менее 3 миллиардов долларов для пополнения денежных резервов, чтобы справиться с растущими затратами на гонку вооружений в области ИИ. Выпуск версии V4 рассматривается как важный шаг для противостояния конкуренции и сохранения технологического лидерства.

Ключевые выводы

Выпуск новой модели

Предварительная версия DeepSeek-V4 официально выпущена и открыта для сообщества, обладает контекстом длиной в миллион символов

Лидерство в производительности

V4-Pro лидирует в области открытых разработок по возможностям агента, знаниям о мире и производительности логического вывода, в некоторых аспектах приближаясь или превосходя ведущие закрытые модели

Инновационный механизм внимания

Модель использует новый механизм разрежённого внимания DSA, сжимающий данные на уровне токенов, что снижает требования к вычислениям и видеопамяти

Финансирование и конкурентный контекст

DeepSeek в условиях острой рыночной конкуренции начинает первое внешнее финансирование с оценочной стоимостью более 100 миллиардов долларов для пополнения денежных резервов

Текст сгенерирован с использованием ИИ

DeepSeek, DeepSeek V4, ИИ агенты

Официально представлена предварительная версия DeepSeek V4

Короткое резюме

Рекомендации по теме

Комментарии

Лента

Официально представлена предварительная версия DeepSeek V4

Короткое резюме

Рекомендации по теме

Комментарии

Лента.css-1kwqo06{position:absolute;height:2px;bottom:0;width:100%;-webkit-transition:all 300ms cubic-bezier(0.4, 0, 0.2, 1) 0ms;transition:all 300ms cubic-bezier(0.4, 0, 0.2, 1) 0ms;background-color:#282c6b;}

Лента