Официально представлена предварительная версия DeepSeek V4
DeepSeek выпустил предварительную версию V4, достигнув лидерства в области с открытым исходным кодом по возможностям агента, мировым знаниям и производительности логического вывода, и ввёл поддержку механизма внимания нового поколения для работы с контекстом объёмом в миллион знаков.
Короткое резюме
DeepSeek 24 апреля официально выпустил предварительную версию новой серии моделей DeepSeek-V4 и сделал её открытой для сообщества. Модель обладает контекстом длиной в миллион символов и лидирует в области внутренних и открытых разработок по возможностям агента, знаниям о мире и производительности логического вывода. Модель разделена на две версии по размеру — V4-Pro и V4-Flash, служба API также была обновлена одновременно.
DeepSeek-V4-Pro в тестировании возможностей агента достиг лучшего уровня среди открытых моделей и стал моделью AgenticCoding, используемой внутренними сотрудниками компании, превосходя Sonnet 4.5 и приближаясь к Opus 4.6 в режиме без размышлений. В тестировании знаний о мире V4-Pro значительно опережает другие открытые модели, уступая лишь ведущей закрытой модели Gemini-Pro-3.1. V4-Flash в простых задачах агента сопоставим с V4-Pro, но в задачах высокой сложности всё ещё есть разрыв. Модель также внедрила совершенно новый механизм внимания (DSA — разрежённое внимание), сжимающий данные на уровне токенов, что значительно снижает требования к вычислениям и видеопамяти, контекст в 1 миллион символов станет стандартной функцией всех официальных сервисов DeepSeek.
Действия DeepSeek происходят на фоне обострения конкуренции в сфере отечественного ИИ, компания сталкивается с острой конкуренцией со стороны компаний Zhiyue, MiniMax, Kimi. Ранее сообщалось, что DeepSeek начинает первое внешнее финансирование с оценочной стоимостью более 100 миллиардов долларов и планирует привлечь не менее 3 миллиардов долларов для пополнения денежных резервов, чтобы справиться с растущими затратами на гонку вооружений в области ИИ. Выпуск версии V4 рассматривается как важный шаг для противостояния конкуренции и сохранения технологического лидерства.
Выпуск новой модели
Предварительная версия DeepSeek-V4 официально выпущена и открыта для сообщества, обладает контекстом длиной в миллион символов
Лидерство в производительности
V4-Pro лидирует в области открытых разработок по возможностям агента, знаниям о мире и производительности логического вывода, в некоторых аспектах приближаясь или превосходя ведущие закрытые модели
Инновационный механизм внимания
Модель использует новый механизм разрежённого внимания DSA, сжимающий данные на уровне токенов, что снижает требования к вычислениям и видеопамяти
Финансирование и конкурентный контекст
DeepSeek в условиях острой рыночной конкуренции начинает первое внешнее финансирование с оценочной стоимостью более 100 миллиардов долларов для пополнения денежных резервов
Текст сгенерирован с использованием ИИ

