AI

Alibaba представила Qwen3-Max-Thinking — новую ИИ-модель, рассуждающую как человек

Alibaba выпустила раннюю версию модели Qwen3-Max-Thinking — промежуточный чекпойнт, который всё ещё находится в обучении. Несмотря на это, при использовании инструментов и увеличенных вычислений на этапе инференса модель показала 100% точности на сложных олимпиадных тестах AIME 2025 и HMMT.

Попробовать ИИ-модель можно уже сейчас в Qwen Chat и через API Alibaba Cloud. Это первый публичный показ «thinking»-версии Qwen3, которая делает ставку на многошаговые рассуждения и способность планировать решение сложных задач. Подробности в материале Postium.

Читайте также: 6 лучших чат-ботов на базе ИИ

Что нового в Qwen3-Max-Thinking?

Чтобы использовать Qwen3-Max-Thinking, выберите модель «Qwen3-Max» и включите режим «Thinking».

Промежуточный релиз. Qwen3-Max-Thinking — не финальный продукт, а «intermediate checkpoint»: модель продолжают дообучать, а результаты будут улучшаться. Alibaba специально открыла доступ к промежуточной версии, чтобы показать потенциал новой архитектуры.

Режим рассуждений. Главная особенность — так называемый tool-augmented reasoning. Это когда модель не просто генерирует ответ, а умеет подключать внешние инструменты, например, калькулятор, код-интерпретатор или поиск — чтобы уточнить промежуточные шаги. По сути, она «думает» как человек, который сначала прикидывает решение в уме, потом проверяет себя на черновике или с помощью калькулятора.

100% на бенчмарках — с оговоркой. Заявленные 100% на AIME и HMMT были достигнуты при использовании дополнительных инструментов и увеличенного test-time compute — то есть при запуске модели с расширенным количеством проходов и вычислений. В обычном режиме показатели будут ниже, но факт достижения «идеального» результата в усиленной конфигурации показывает потенциал новой архитектуры.

Как развивается чат-бот Qwen

Alibaba последовательно наращивает линейку Qwen — от базовых моделей к специализированным версиям для рассуждений и генерации кода.

  • Весной 2024 года компания представила QwQ-32B, ориентированную на reasoning-задачи;
  • Осенью вышла Qwen3-Max, одна из крупнейших и самых мощных моделей Alibaba, которая конкурирует с GPT-4 и Claude 3 в задачах логики и программирования;
  • Сейчас добавили режим «Мышление», где приоритет — глубина рассуждений, а не скорость генерации.

Qwen3-Max-Thinking напрямую соперничает с другими «reasoning»-моделями — DeepSeek-R, o1 и Claude 3.5 Sonnet, которые также развивают идею увеличенного вычисления на инференсе и многошагового мышления.

Ранний доступ к Qwen3-Max-Thinking открыт для пользователей Qwen Chat и разработчиков через Alibaba Cloud Model Studio API.

Итог: Qwen3-Max-Thinking — шаг Alibaba к ИИ, который не просто отвечает, а умеет думать. Пока модель показывает идеальные результаты только в усиленном режиме, но именно такой подход приближает к человеческому способу рассуждения.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

11 + 20 =

Кнопка «Наверх»