DeepSeek выпустила обновление ИИ-модели R1

Китайская компания DeepSeek выпустила обновлённую версию своей reasoning-модели R1 под названием R1-0528. Модель уже доступна на платформе Hugging Face, однако официального анонса и подробностей от разработчиков пока не последовало.

Несмотря на это, предварительные тесты показывают, что R1-0528 демонстрирует улучшенные способности в генерации кода и структурировании ответов.

Согласно результатам бенчмарка LiveCodeBench, разработанного университетами Беркли, MIT и Корнеллом, обновлённая модель R1 занимает позицию сразу за o4-mini и o3 от OpenAI, опережая при этом Grok 3 mini от xAI и Qwen 3 от Alibaba. Это свидетельствует о том, что DeepSeek продолжает укреплять свои позиции в области ИИ, несмотря на отсутствие подробностей об обновлении.

Ранее, в январе 2025 года, DeepSeek представила первую версию модели R1, которая была полностью открыта и лицензирована по MIT. Модель отличалась высокой эффективностью в задачах, связанных с математикой, программированием и логикой, и предлагала пользователям 50 бесплатных запросов в день. Кроме того, R1 использовала инновационный подход к обучению с подкреплением, что позволило ей достигать высоких результатов при минимальных затратах.

Ожидается, что в ближайшее время DeepSeek представит более продвинутую модель R2, которая была запланирована к выпуску в мае. Пока же обновлённая версия R1-0528 продолжает демонстрировать конкурентоспособность китайских разработок в сфере искусственного интеллекта.

Ранее Яндекс научился генерировать контент прямо в Поиске.

Источник

Теги

29.05.2025

16 Время чтения: 1 минута

Читать следующую

DeepSeek выпустила обновление ИИ-модели R1

Читать следующую

ByteDance выпустила Seedance 2.0 Mini — модель уже доступна в Dreamina и CapCut

В США ограничили доступ к новым ИИ-моделям Anthropic

Codex от OpenAI: что это такое, для чего нужен, что умеет и как работает

Krea добавила Generative Sliders — в Krea 2 появились новые настройки для генерации изображений

Kimi-K2.7-Code вышла в open source — нейросеть доступна в Kimi Code и через API

Бесплатный мастер-класс «ChatGPT — ваш новый рабочий стол»

Промты для фото и открыток ко Дню России, +нейросети для генерации

Google выпустила Gemini 3.5 Live Translate — аудиомодель переводит речь на 70+ языках

Anthropic выпустила Claude Fable 5 — публичную версию модели Mythos

В GigaChat появились инструменты профессиональной работы с изображениями на базе Kandinsky 6.0

ByteDance выпустила Seedance 2.0 Mini — модель уже доступна в Dreamina и CapCut

В США ограничили доступ к новым ИИ-моделям Anthropic

Codex от OpenAI: что это такое, для чего нужен, что умеет и как работает

Krea добавила Generative Sliders — в Krea 2 появились новые настройки для генерации изображений

Kimi-K2.7-Code вышла в open source — нейросеть доступна в Kimi Code и через API

Бесплатный мастер-класс «ChatGPT — ваш новый рабочий стол»

Промты для фото и открыток ко Дню России, +нейросети для генерации

Google выпустила Gemini 3.5 Live Translate — аудиомодель переводит речь на 70+ языках

Anthropic выпустила Claude Fable 5 — публичную версию модели Mythos

В GigaChat появились инструменты профессиональной работы с изображениями на базе Kandinsky 6.0

Добавить комментарий Отменить ответ

«Лента» откроет супермаркеты в двух новых многофункциональных центрах в Новой Москве

Доля отечественных телевизоров на рынке достигла 31,5%

Как использовать мемы в контенте, в рекламе и маркетинге

Музыкальные инструменты в России подорожали на 12%

«Эфко» запустит в Воронежской области производство эмульгаторов

В России впервые снизилось количество продавцов на Ozon и Wildberries

В Госдуме поддержали поправки о поэтапном снижении порога доходов для уплаты НДС при УСН

Производителям игристого вина изменили правила расчета мощности оборудования

Grow Food: больше 60% россиян считают себя толстыми, но только треть планирует худеть к Новому году

В феврале средняя стоимость нового отечественного автомобиля снизилась на 2%

«585 Золотой»: почти половину клиентов ломбардов составляют миллениалы