OpenAI выпустила ограниченное превью новой линейки GPT-5.6. В неё вошли три модели: Sol — флагманская версия для сложных задач, Terra — более сбалансированная модель для повседневной работы, Luna — быстрая и самая доступная модель серии.
Сначала доступ откроют небольшой группе доверенных партнёров и организаций через API и Codex. OpenAI планирует расширить запуск для пользователей ChatGPT, Codex и API в ближайшие недели, но точные сроки и список тарифов пока не раскрыла.
Компания объяснила, почему выбрала такой формат запуска. По просьбе правительства США OpenAI сначала показывает модели ограниченному кругу партнёров, участие которых согласовано с властями. Компания подчёркивает, что не считает такой порядок долгосрочной нормой и рассматривает его как временную меру перед более широким релизом.
Читайте также: 5 лучших нейросетей для работы
Что нового в GPT-5.6 Sol
GPT-5.6 Sol — новая флагманская модель OpenAI. По данным компании, Sol стала сильнее в задачах, связанных с программированием, биологией и кибербезопасностью. Полный набор оценок OpenAI обещает опубликовать позже, когда модели станут доступны более широкому кругу пользователей.
В GPT-5.6 появился новый уровень рассуждений — max reasoning effort. Он даёт Sol больше времени на решение сложных задач, где нужно планировать несколько шагов и проверять промежуточные результаты. Ещё один режим — ultra mode — использует субагентов: модель распределяет сложную работу между несколькими агентами вместо одного потока выполнения.
Для разработчиков OpenAI выделяет результат Sol в Terminal-Bench 2.1. Этот бенчмарк проверяет работу в командной строке: модель должна использовать инструменты, исправлять ошибки, запускать команды и получать результат за несколько итераций.
В биологических задачах Sol показала рост на GeneBench v1 — тесте для длинных сценариев в геномике и количественной биологии. По данным OpenAI, модель обходит GPT-5.5 и при этом расходует меньше токенов.
Самый важный блок релиза — кибербезопасность. OpenAI пишет, что GPT-5.6 Sol стала сильнее в длинных задачах, связанных с поиском уязвимостей и анализом эксплуатации. При этом компания подчёркивает: модель лучше подходит для поиска и устранения уязвимостей, чем для проведения атак от начала до конца.
В тестах с Chromium и Firefox GPT-5.6 Sol находила баги и элементы, из которых можно построить эксплойт, но не смогла автономно выполнить полноценную цепочку атаки в условиях оценки. Поэтому, по версии OpenAI, модель не пересекла порог Cyber Critical в Preparedness Framework.
Доступность и цены
Во время ограниченного превью модели GPT-5.6 будут доступны через API и Codex для выбранных партнёров и организаций. Для пользователей ChatGPT запуск обещан позже.
В новой схеме названий число обозначает поколение модели, а Sol, Terra и Luna — уровни возможностей, скорости и стоимости. Эти уровни OpenAI планирует сохранить и развивать отдельно.
Цены в API указаны за 1 млн токенов. GPT-5.6 Sol стоит $5 за входные токены и $30 — за выходные. Terra — $2,50 за входные и $15 — за выходные. Luna — $1 за входные и $6 — за выходные.
OpenAI также меняет механизм кэширования промптов для GPT-5.6 и следующих моделей. Появятся явные cache breakpoints и минимальный срок хранения кэша — 30 минут. Запись в кэш будет стоить в 1,25 раза дороже обычных входных токенов, а чтение сохранит скидку 90%.
В июле OpenAI планирует запустить GPT-5.6 Sol на Cerebras со скоростью до 750 токенов в секунду. На старте доступ также ограничат выбранными клиентами, пока компания расширяет вычислительные мощности.
Почему это важно? OpenAI выпускает GPT-5.6 не как обычное обновление модели. Компания ограничивает первый этап запуска, поскольку рост возможностей в кибербезопасности требует дополнительной проверки защитных механизмов в реальных условиях.
При этом новая линейка Sol, Terra и Luna делает выбор модели более прозрачным. Вместо одной модели пользователям предлагают три варианта: Sol — для самых сложных задач, Terra — баланс между стоимостью и возможностями, Luna — для быстрых и недорогих сценариев.
Итог: GPT-5.6 — первый релиз OpenAI с ограниченным доступом, который компания объясняет требованиями безопасности и необходимостью дополнительной проверки перед массовым запуском.




