В последние месяцы появилось много нейросетей, которые генерируют качественные изображения. Их можно использовать для своих социальных сетей, рекламы и творчества. Среди конкурентов выделяется Kandinsky. Отечественная разработка от Сбера, названная в честь художника Василия Кандинского. Эта нейросеть отлично понимает запросы на русском языке и подходит для создания интересных творческих проектов. В конце 2023 года разработчики познакомили ИИ с нашей культурой, сказками, персонажами, фольклором и даже реальными знаменитостями. Благодаря этому Kandinsky имеет преимущество над иностранными аналогами, которые хуже подходят для генерации изображений, связанных с отечественной культурой или действительностью. Kandinsky предоставляет массу возможностей для генерации как изображений, так и видео. При этом нейросеть доступна абсолютно бесплатно, без VPN или сложной регистрации. В этом гайде рассмотрим все основные функции Kandinsky и научимся генерировать качественные и применимые в жизни изображения. Начало работы и обзор интерфейса Знакомство с нейросетью стоит начать со страницы https://www.sberbank.com/promo/kandinsky/. Здесь Вы найдете всю основную информацию о технологии и способах взаимодействия с ней. На странице много примеров изображений, при необходимости можно переключиться на английскую версию. Чтобы генерировать картинки, необходимо выбрать один из способов взаимодействия с ИИ. Вариантов много: отдельный сайт, Telegram бот, диалог ВК, мобильное приложение СбербанкОнлайн и ассистент Салют. Основной и самый удобный способ сгенерировать качественное изображение – редактор на сайте. Fusionbrain Для начала работы здесь необходимо будет зарегистрироваться. Для этого понадобится только почта и пароль. Процесс простой и быстрый, после него становятся доступными все функции. После регистрации видим рабочее поле и квадрат на нем – это границы будущего изображения. Над ним разрешение и формат картинки, его можно поменять. Внизу окно для ввода текстового запроса. Написать промт можно на русском языке, что выгодно отличает Kandinsky от зарубежных аналогов. На вкладке «негативный промт», она находится рядом, можно прописать объекты, которые не должны получаться на изображении. Это очень удобно, если не получается достичь нужного результата, на фото всегда есть что-то лишнее. Далее видим вкладку «стили». Доступно 17 вариантов. Если нет идеального – можно оставить «свой стиль». Также под очертанием будущего изображения есть кнопка «ArtGPT». С помощью этой функции можно доработать промт с помощью искусственного интеллекта и получить более качественный результат. Удобно, что эта функция уже встроена на сайте и находится под рукой. В верхней панели можно активировать ластик, вставить изображение, отменить или повторить действие. Также доступна справка и кнопки сохранения, удаления. В панели слева можно переключиться на режим создания видео, поменять язык или ознакомиться с документацией. Комбинации клавиш В Fusionbrain многие действия можно осуществлять с помощью нажатия сочетаний определённых клавиш. Прямо как в профессиональных редакторах и сложных программах. При большом объеме работы это может сильно сэкономить время. Список вариантов комбинаций можно найти в разделе справки или на скриншоте ниже. Если по каким-то причинам работать на отдельном сайте неудобно, можно воспользоваться альтернативными вариантами взаимодействия с нейросетью. Например, запустить Telegram-бот. Если аккаунт в мессенджере уже есть, не потребуется дополнительной регистрации, можно сразу создавать картинки и видео. Пробуем Kandinsky в работе После знакомства с основным функционалом самое время сгенерировать картинку. Самый простой способ – написать текстовый запрос с описанием того, что должно получиться (промт). Примечание. Чтобы создать хороший запрос, который позволит быстро получить желаемую картинку, нужно следовать простым правилам. Сначала нужно указать главный объект, который будет на картинке. Далее указываются характеристики этого предмета. Например, цвет или размер. Затем прописываем действие, которое совершается или происходит на фото и место, где находится наш объект. Для примера создадим картинку с грузовиком на дороге. Получаем результат, который в точности соответствует запросу. На изображении есть все элементы, которые были прописаны, окружение также соответствует промту. Артефактов и нежелательных объектов почти нет, но итоговый результат не похож на настоящее фото, реализма не хватает. Примечание. В запросах лучше избегать частицы «не», так как нейросеть можно воспринять только идущее за ней слово. Если нужно прописать то, чего не должно быть на картинке, лучше использовать вкладку «негативный промт». Посмотрим, как нейросеть справится с генерацией изображения с человеком. Результат очень похожий – все основные пожелания отображены на итоговой картинке, но реализма опять не хватает. Очевидно, что картинку сгенерировал ИИ. Используемый промт: «Молодая девушка в белой рубашке и чёрных брюках сидит за стеклянным офисным столом, печатает на ноутбуке, вокруг — современный open-space с большими окнами, солнечный свет, стиль фотореализм, высокая детализация» Работа с изображениями (Img2Img) В отличие от многих конкурентов, Kandinsky поддерживает загрузку изображений и может с ними работать. Но функционал этой возможности очень ограничен. Нейросеть не смогла стереть или добавить объект на фото корректно и точно. Редактировать фотографии с помощью текстовых запросов не получится. В Telegram боте доступны функции переноса стиля, объединения двух изображений и создание новой вариации картинки. К сожалению, ни одна из них не дает идеального результата. По крайней мере с первого раза. Результат работы функции «вариации». Исходное фото слева. В режиме редактирования изображений становится доступна вкладка «слои». Их можно объединять в группы – «композиции». На верхней панели есть инструмент «ластик». Обычно в редакторах с AI этот инструмент помогает убрать объекты с фото. Например, над кроватью висит картина, она обводится ластиком, после чего нейросеть менять фото, картина исчезает. В Kandinsky логика этого инструмента другая – ластик просто стирает выделенный участок со слоя или всех слоев сразу. Приблизительно также, как в самых простых графических редакторов. Поэтому применить ластик в работе и получить хороший результат достаточно сложно. Генерация видео Бесплатное создание видео – интересная возможность, которую сейчас почти никто не предлагает. Обычно создание даже коротких роликов платное. Для начала генерации в Kandinsky нажимаем на кнопку «видео» в левой панели и попадаем в удобный и продуманный редактор. Здесь можно создавать видео и анимации. Начнем с более сложной задачи. На вкладке «модель» выбираем видео, далее можно задать соотношение сторон и разрешение. Оставим 1:1. Остается только окошко для ввода запроса. Прописываем его по ранее разобранной схеме и ждем около 4-х минут. Получаем видео, длинной 5 секунд. Результат нельзя назвать идеальным – грузовик на видео едет назад, а общее качество видео, детализация объектов и окружения достаточно слабые. Но после нескольких повторных генераций можно добиться неплохого результата, особенно для совсем коротких вставок. Аналогичный результат показывают почти все модели, которые создают короткие ролики бесплатно. Возможно, с анимацией Kandinsky справится лучше. Для нее инструментов больше – можно анимировать 2 сцены, задать движение камеры из готовых вариантов. Прописываем промт и выбирает разное движение камеры в двух сценах. Получается ролик длинной 8 секунд, похожий на слайд шоу. Камера действительно перемещается, как и задано. С таким инструментом можно создавать интересные творческие проекты буквально за несколько минут. Заключение Kandinsky – универсальная и применимая для реальных задач нейросеть. Ее можно использовать не только для генерации картинок, но редактировать изображения и создавать видео. На данном этапе (самая актуальная версия Kandinsky 3.1) не все функции работают идеально и с первого раза. Но уже сейчас разработчики добавили в нейросеть полезные возможности: работу со слоями, поддержку горячих клавиш, показали ей российский фольклор и персонажей. Такое внимание к функционалу дает нейросети большой потенциал для роста. С обновлением модели качество генераций будет возрастать. Не стоит забывать и то, что на данный момент Kandinsky доступен совершенно бесплатно и на русском языке.