Z.ai выпустила GLM-5.2 — новую флагманскую модель для задач, где нужно долго удерживать контекст: работать с большими проектами, связывать несколько шагов и писать код с учётом требований.
Вместе с релизом в Z.ai Chat появился AI-агент для создания презентаций. Достаточно описать тему, и агент соберёт структуру, подготовит содержание и оформит материал в виде слайдов.
Модель уже опубликована на Hugging Face под лицензией MIT. Z.ai также предоставляет доступ через API и чат-бот. Подробности в материале Postium.
Читайте также: ТОП-5 нейросетей для ежедневной работы
Что умеет GLM-5.2 и как работает
GLM-5.2 получила контекстное окно до 1 млн токенов. Это нужно для работы с крупными репозиториями, длинными документами и задачами, где модель должна помнить не только последний запрос, но и структуру проекта, требования и правила разработки.
Z.ai называет GLM-5.2 заметным шагом вперёд по сравнению с GLM-5.1 именно в длинных задачах. В модели появились уровни «thinking effort»: разработчик может выбирать, что важнее в конкретном сценарии — более качественный ответ, меньшая задержка или более низкая вычислительная нагрузка.
Z.ai также сообщает, что GLM-5.2 стала дешевле при работе с длинными запросами. Для этого компания изменила внутренний механизм внимания: модель не пересчитывает часть данных на каждом слое, а переиспользует уже найденные связи в тексте. По заявлению Z.ai, это снижает нагрузку при работе с контекстом до 1 млн токенов.
Ещё одно изменение ускоряет генерацию ответов. Модель заранее предлагает несколько следующих токенов, а затем проверяет, какие из них можно оставить. Z.ai утверждает, что в GLM-5.2 этот механизм стал принимать до 20% больше таких предсказанных токенов, поэтому модель может отвечать быстрее.
На бенчмарках для кода и агентных задач GLM-5.2 показала следующие результаты: 62.1 на SWE-bench Pro, 81.0 на Terminal-Bench 2.1, 77.0 на MCP-Atlas и 54.7 на Humanity's Last Exam с tools. По данным Z.ai, модель заметно обходит GLM-5.1 и в ряде тестов конкурирует с закрытыми моделями уровня GPT-5.5, Gemini 3.1 Pro и Claude Opus 4.8.
Как пользоваться GLM-5.2 бесплатно
Откройте сайт чат-бота Z.ai. GLM-5.2 уже доступна там по умолчанию, отдельно выбирать модель не нужно.
В окне запроса можно настроить уровень ответа и выбрать, насколько подробно модель должна прорабатывать задачу. Там же можно включить или выключить Deep Think.
Чтобы создать презентацию, откройте раздел AI PPT в левом меню. Затем опишите задачу в чате: тему, формат, аудиторию и содержание слайдов. Агент соберёт презентацию по запросу.
Если хотите запустить GLM-5.2 локально, откройте страницу модели на Hugging Face, скачайте веса и разверните их на компьютере, сервере или в собственной инфраструктуре. Для запуска можно использовать Transformers, vLLM или SGLang. В карточке модели также доступны Docker Model Runner и квантизированные версии для запуска с меньшими требованиями к ресурсам.
Почему это важно? GLM-5.2 — открытая модель с контекстом до 1 млн токенов. Это редкое сочетание: сильные результаты в задачах на код и агентных сценариях, длинный контекст и возможность развернуть модель у себя, а не использовать только через сторонний чат или API.
Итог: GLM-5.2 стала новой открытой моделью Z.ai для длинных задач по программированию с контекстным окном до 1 млн токенов.






