News

00:00
Со страниц China Science Daily
Со страниц China Science Daily
...
News
03:03, 27 Apr

Официально представлена предварительная версия DeepSeek V4

DeepSeek выпустил предварительную версию V4, достигнув лидерства в области с открытым исходным кодом по возможностям агента, мировым знаниям и производительности логического вывода, и ввёл поддержку механизма внимания нового поколения для работы с контекстом объёмом в миллион знаков.

news.sciencenet.cn

Short Summary

DeepSeek 24 апреля официально выпустил предварительную версию новой серии моделей DeepSeek-V4 и сделал её открытой для сообщества. Модель обладает контекстом длиной в миллион символов и лидирует в области внутренних и открытых разработок по возможностям агента, знаниям о мире и производительности логического вывода. Модель разделена на две версии по размеру — V4-Pro и V4-Flash, служба API также была обновлена одновременно.

DeepSeek-V4-Pro в тестировании возможностей агента достиг лучшего уровня среди открытых моделей и стал моделью AgenticCoding, используемой внутренними сотрудниками компании, превосходя Sonnet 4.5 и приближаясь к Opus 4.6 в режиме без размышлений. В тестировании знаний о мире V4-Pro значительно опережает другие открытые модели, уступая лишь ведущей закрытой модели Gemini-Pro-3.1. V4-Flash в простых задачах агента сопоставим с V4-Pro, но в задачах высокой сложности всё ещё есть разрыв. Модель также внедрила совершенно новый механизм внимания (DSA — разрежённое внимание), сжимающий данные на уровне токенов, что значительно снижает требования к вычислениям и видеопамяти, контекст в 1 миллион символов станет стандартной функцией всех официальных сервисов DeepSeek.

Действия DeepSeek происходят на фоне обострения конкуренции в сфере отечественного ИИ, компания сталкивается с острой конкуренцией со стороны компаний Zhiyue, MiniMax, Kimi. Ранее сообщалось, что DeepSeek начинает первое внешнее финансирование с оценочной стоимостью более 100 миллиардов долларов и планирует привлечь не менее 3 миллиардов долларов для пополнения денежных резервов, чтобы справиться с растущими затратами на гонку вооружений в области ИИ. Выпуск версии V4 рассматривается как важный шаг для противостояния конкуренции и сохранения технологического лидерства.

Key Takeaways
Выпуск новой модели

Предварительная версия DeepSeek-V4 официально выпущена и открыта для сообщества, обладает контекстом длиной в миллион символов

Лидерство в производительности

V4-Pro лидирует в области открытых разработок по возможностям агента, знаниям о мире и производительности логического вывода, в некоторых аспектах приближаясь или превосходя ведущие закрытые модели

Инновационный механизм внимания

Модель использует новый механизм разрежённого внимания DSA, сжимающий данные на уровне токенов, что снижает требования к вычислениям и видеопамяти

Финансирование и конкурентный контекст

DeepSeek в условиях острой рыночной конкуренции начинает первое внешнее финансирование с оценочной стоимостью более 100 миллиардов долларов для пополнения денежных резервов

Text generated using AI

DeepSeek, DeepSeek V4, ИИ агенты
1

Recommendations on the topic

Comments

Golos Nauki Logo
Home page
Support Project
Sections
Быстрый доступ
  • Author's interview
  • Video Abstracts
Sponsor
* is not an advertisement
Presentation
Information

    Phone: 8 (800) 350 17-24email: office@golos-nauki.ru
    Sign Up
    Со страниц China Science DailyNews Feed
    Other News