AI

«Сбер» научил Kandinsky Image делать надписи на русском языке 

«» обновил модель Kandinsky Image, добавив поддержку надписей на русском языке. Теперь нейросеть может вписывать кириллический текст непосредственно в изображение — на вывесках, этикетках, одежде или предметах. Раньше модель корректно обрабатывала только английские слова.

По данным компании, Kandinsky дообучили на 10 млн изображений с русским текстом в разных форматах — печатном, рукописном, вышитом, гравированном и других. Это позволило улучшить распознавание форм букв и адаптировать их к различным текстурам и ракурсам.

Функция уже доступна в -ботах Kandinsky и GigaChat, а также в веб-версии GigaChat, релиз на сайте Kandinsky.ai ожидается в ближайшее время.

Теперь пользователи могут создавать изображения с подписями вроде «Москва ночью», «С днём рождения!» или «Кофейня на углу» прямо в генерации, без последующего редактирования в графических редакторах. Лучше всего модель работает с короткими словами и простыми фразами. «Сбер» отмечает, что Kandinsky способна учитывать материал букв — например, «металлические», «неоновые» или «вышитые» — и естественно интегрировать текст в окружение.

Тестируем. Вот результат генерации по запросу: [нарисуй кофейню с вывеской «Кофе с тобой»]

«Сбер» научил Kandinsky Image делать надписи на русском языке 

Комиксный стиль. Проверяем отрисовку комикса со словами. Запрос: [Комикс в современном стиле.Офисный работник сидит за ноутбуком, удивлённо смотрит на экран.Над его головой белое облачко речи с фразой:«О, ГигаЧат научился писать на русском!»].

«Сбер» научил Kandinsky Image делать надписи на русском языке 

Обложка журнала. Проверяем размер текста и позиционирование на креативе. Запрос [Стильная девушка на глянцевой обложке журнала. Заголовок сверху большими буквами: «МОДА». Дополнительный текст мелко: «Тренды 2025»].

«Сбер» научил Kandinsky Image делать надписи на русском языке 

Текст прописью. Проверяем, как справляется с длинным рукописным текстом. Запрос: [учитель пишет на доске текст белым мелом прописью: «Сегодня мы будем изучать русский язык и его особенности.»]

«Сбер» научил Kandinsky Image делать надписи на русском языке 

Твёрдый знак. Смотрим, сможет ли нейронка сгенерить надписи, где есть «Ъ». Запрос: [Витрина старинной булочной, на деревянной или стеклянной вывеске дореволюционным шрифтом написаны три слова: «ХЛЕБЪ», «СЫРЪ», «ПИРОГЪ»].

«Сбер» научил Kandinsky Image делать надписи на русском языке 

Материал букв. Проверяем как рисует буквы из указанного материала. Запрос: [слово «СТАЛЬ» объёмными буквами из настоящей стали на тёмном фоне].

«Сбер» научил Kandinsky Image делать надписи на русском языке 

Kandinsky — собственная генеративная модель «Сбера», созданная на архитектуре diffusion и обученная на российских датасетах. В мае 2024 года вышла версия Kandinsky 3.1, которая повысила качество композиции и детализацию.

Осенью в GigaChat появилась возможность генерировать видеофрагменты и 3D-сцены. Новый апдейт с поддержкой кириллицы продолжает курс компании на локализацию и развитие отечественных AI-инструментов.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

четыре − 2 =

Кнопка «Наверх»