
Рассказываем о новом решении, которое позволяет подключать GPT-модели через привычный endpoint и использовать единый баланс лимитов для API и SEO-инструментов PR-CY.
Представляем новый инструмент для разработчиков, SEO-специалистов и агентств — OpenAI-совместимый шлюз к GPT-моделям. Он расширяет возможности платформы и позволяет использовать ИИ в собственных продуктах и внутренних сервисах.
Как подключить и начать работу
Доступ к этому API есть на любом платном тарифе PR-CY. Отдельный тариф для API не требуется, один и тот же баланс лимитов используется и для API-запросов, и для SEO-инструментов платформы. Оплачивать можно российскими картами.
Чтобы начать работу, нужно:
-
Зарегистрироваться или войти в аккаунт PR-CY.
-
Купить любой платный тариф PR-CY, если он еще не подключен.
-
Открыть раздел «Настройки API» в личном кабинете и скопировать ключ.
-
Указать base_url: https://api.pr-cy.ru/v1.
-
Отправить запрос на /v1/chat/completions.
Пример cURL-запроса:
curl https://api.pr-cy.ru/v1/chat/completions -H "Authorization: Bearer $PRCY_API_KEY" -H "Content-Type: application/json" -d '{ "model": "prcy-5.4-mini", "max_tokens": 400, "messages": [ { "role": "system", "content": "Ты SEO-копирайтер PR-CY." }, { "role": "user", "content": "Сделай SEO-title и description для страницы угловых диванов." } ] }'
Особенности инструмента
Передовые модели
Шлюз принимает модели семейства GPT:
-
prcy-5.4-nano — экономичная быстрая модель для массовых задач. Контекст до 200K символов, максимальный вывод до 32K токенов.
-
prcy-5.4-mini — мини-версия GPT-5.4 для регулярных задач и массовой генерации. Контекст до 200K символов, вывод до 32K токенов.
-
prcy-4o-mini — базовая быстрая модель. Контекст до 128K символов, максимальный вывод до 16,4K токенов.
-
prcy-5.5 и prcy-5.4 — флагманские модели для сложных текстов и рассуждений. Контекст до 200K символов, вывод до 32K токенов.
Стоимость списания зависит от модели. Для входа лимиты считаются за 1000 символов промпта, для выхода — за 1000 токенов ответа. Самыми экономичными вариантами будут nano- и mini-модели: prcy-5.4-nano, prcy-4o-mini и prcy-5.4-mini. Флагманские модели prcy-5.5 и prcy-5.4 выйдут дороже, но лучше подойдут для сложных задач.
Если модель не указана, запрос по умолчанию направляется в модель prcy-4o-mini.
Совместимость с IDE и AI-агентами
API можно подключать к инструментам, которые поддерживают связку base_url + api_key. Среди поддерживаемых сценариев — интеграции с IDE и агентами, включая Opencode, Continue, Cursor и Aider.
Решение позволяет отправлять запросы к моделям через адрес https://api.pr-cy.ru/v1 и использовать привычную схему OpenAI API без установки новых библиотек и переписывания кода.
Для подключения достаточно указать:
-
baseURL: https://api.pr-cy.ru/v1.
-
apiKey: API-ключ из кабинета PR-CY.
-
список моделей PR-CY, например, prcy-4o-mini, prcy-5.4-mini, prcy-5.5.
Endpoint /v1/chat/completions совместим со схемой OpenAI и поддерживает привычные параметры, включая model, messages, stream, temperature. Ответ возвращается в формате стандартного объекта chat.completion, поэтому его можно парсить теми же библиотеками и инструментами, которые уже используются в проектах.
Поддержка стриминга и изображений
API поддерживает потоковую генерацию через параметр «stream»: true с использованием Server-Sent Events. Модели, поддерживающие изображения, принимают блок image_url в content по аналогии с OpenAI vision.
Обработка ошибок
Формат ошибок совместим с OpenAI. API возвращает HTTP-код и JSON с полем error.message. Основные коды:
-
401 — неверный ключ, нужно проверить заголовок Authorization: Bearer <ключ>.
-
402 — недостаточно лимитов или модель недоступна на текущем тарифе.
-
404 — модель не найдена, нужно проверить идентификатор модели или вызвать /v1/models.
- 422 — некорректный запрос (например, отсутствует messages или нарушен формат JSON).
-
429 — превышен лимит частоты или закончились лимиты тарифа.
-
5xx — временная ошибка апстрима, рекомендуем повторить запрос с экспоненциальной задержкой.
Прозрачное списание лимитов
API использует единый баланс лимитов аккаунта. В расчет входят системное сообщение, пользовательский запрос и вся история переписки. Если общая длина превышает контекст модели, часть истории, которая не помещается в контекст, срезается и не участвует в стоимости.
Вход считается в символах, а не в токенах, что упрощает предварительный расчет стоимости запроса. Для этого используется длина промпта в mb_strlen. Выход считается в токенах ответа.
Формула списания:
лимиты = вход × [prompt_chars / 1000] + выход × [сompletion_tokens / 1000]
Округление выполняется вверх, минимум — одна единица входа. Фактический объем запроса возвращается в поле usage каждого ответа.
Для vision-моделей изображения учитываются отдельно. Каждый image_url добавляет лимиты в зависимости от разрешения по формуле [width / 512] × [height / 512] × 170 токенов на изображение.
Списание проходит в два этапа: при запуске запроса система резервирует стоимость промпта и 1000 токенов ответа, а после генерации корректирует итоговую сумму, если фактический completion_tokens оказался больше.
Планы на будущее
Сейчас через API маршрутизируются модели семейства GPT. Мы также тестируем другие семейства моделей — Claude, Gemini и DeepSeek. После проверки совместимости с OpenAI-схемой они будут открываться через тот же endpoint /v1/chat/completions.
Полезные инструменты
Редактор текста на базе ИИ Генерация изображений нейросетью Анализ текста ИИ-редактор изображений Анализ сайта Переводчик эмодзи Проверка IP в спам базах HTML редактор онлайн Проверка размера страницы Google Rich Snippets для FAQ
Источник


