Новость
Сбербанк представил флагманскую модель генеративного ИИ Kandinsky 6.0 Image, которая легла в основу обновленного редактора изображений в «ГигаЧате». Пользователи получили бесплатный профессиональный инструмент без лимитов на количество генераций.
Новая модель работает до двух раз быстрее предыдущей, точнее интерпретирует сложные запросы и выдает более проработанные изображения. Среди добавленных функций — реставрация снимков, стилизация под актуальные тренды, нейрофотосессии, смена одежды и фона, а также ретушь и наложение макияжа. Кроме того, Kandinsky научился лучше ориентироваться в современных темах благодаря встроенному поиску по изображениям.
По данным внутренних замеров Сбера, в ряде задач по качеству редактирования новая модель сопоставима с мировыми аналогами — Nano-Banana, Flux и Qwen. Все возможности уже доступны в веб-версии, мобильном приложении и мессенджерах «ГигаЧата».
Антон Фролов, старший вице-президент, руководитель блока «Развитие генеративного ИИ» Сбербанка: «Редактирование и создание изображений — одна из самых популярных функций в ИИ-помощнике «ГигаЧат»: за все время пользователи уже создали несколько сотен миллионов картинок. Наша цель — дать каждому инструмент профессионального уровня с широкими возможностями для самых разных задач, от творчества до работы. С Kandinsky 6.0 мы сделали большой шаг в этом направлении. Также продолжаем развивать наши модели для видео — в ближайшее время пользователи ИИ-помощника получат новые возможности работы с видеоконтентом».
Теперь одним текстовым запросом можно добавить объект в кадр или удалить лишнее, применить фильтр или объединить элементы из разных снимков. Реставрация «оживляет» старые и поврежденные фотографии, возвращая четкость выцветшим или поцарапанным изображениям. Стилизация переводит фото в формат аниме, комикса или мультфильма. Режим нейрофотосессии на основе одной фотографии генерирует серию новых кадров — с другим фоном, одеждой или локацией.
Модель стала аккуратнее работать с точечными правками: при замене прически или добавлении очков остальные детали изображения остаются нетронутыми. Улучшена детализация сложных сцен — интерьеров, сервировки стола, многолюдных кадров. Сократилось число ошибок и «галлюцинаций», текст на изображениях генерируется корректнее.
За счет встроенного механизма поиска по изображениям (Image RAG) Kandinsky 6.0 может найти референс для объекта, которого не знает, — например, недавно появившегося поп-персонажа. Это позволяет генерировать точные изображения даже тех сущностей, которые возникли после обучения модели.
Новый инструмент подходит для быстрого редактирования фотографий, создания контента для соцсетей, подготовки рекламных макетов, визуализации идей в дизайне и маркетинге, а также для задач в строительстве, недвижимости и электронной коммерции — например, создания карточек товаров без фотостудии. Сгенерированные картинки можно сразу анимировать через модель Kandinsky Video, доступную в «ГигаЧате».
В основе Kandinsky 6.0 Image лежит архитектура Mixture of Experts (MoE), ставшая стандартом для передовых нейросетей. Вместо активации всей модели на каждый запрос система выборочно подключает нужные блоки — «экспертов», которые узко специализированы на своих задачах. Это ускоряет работу, снижает потребление ресурсов и упрощает дальнейшее развитие модели.