Китайская компания DeepSeek выпустила обновлённую версию своей reasoning-модели R1 под названием R1-0528. Модель уже доступна на платформе Hugging Face, однако официального анонса и подробностей от разработчиков пока не последовало.
Несмотря на это, предварительные тесты показывают, что R1-0528 демонстрирует улучшенные способности в генерации кода и структурировании ответов.
Согласно результатам бенчмарка LiveCodeBench, разработанного университетами Беркли, MIT и Корнеллом, обновлённая модель R1 занимает позицию сразу за o4-mini и o3 от OpenAI, опережая при этом Grok 3 mini от xAI и Qwen 3 от Alibaba. Это свидетельствует о том, что DeepSeek продолжает укреплять свои позиции в области ИИ, несмотря на отсутствие подробностей об обновлении.
Ранее, в январе 2025 года, DeepSeek представила первую версию модели R1, которая была полностью открыта и лицензирована по MIT. Модель отличалась высокой эффективностью в задачах, связанных с математикой, программированием и логикой, и предлагала пользователям 50 бесплатных запросов в день. Кроме того, R1 использовала инновационный подход к обучению с подкреплением, что позволило ей достигать высоких результатов при минимальных затратах.
Ожидается, что в ближайшее время DeepSeek представит более продвинутую модель R2, которая была запланирована к выпуску в мае. Пока же обновлённая версия R1-0528 продолжает демонстрировать конкурентоспособность китайских разработок в сфере искусственного интеллекта.
Ранее Яндекс научился генерировать контент прямо в Поиске.