img2img AI and Full Frontal Nudity! |
[Jun. 7th, 2025|06:14 pm] |
[ | Current Mood |
| | giddy | ] |
[ | Current Music |
| | Tomahawk - Mit Gas | ] | Когда я писал посте про «Валу», то я исполязавал генеративный AI ideogram. До этого я использовал ranware flux ai, пока тот был бесплатным. Я хотел их сравнить. Поэтому я закинул 20 $ на runware, и мне открылся полный арсенал их инструментов. Я взял несколько своих старых рисунков с фурри и попробовал воссоздать их в высоком качестве. Вот Что у меня получилось:
18+ NSFW Я попробовал использовать ControlNet Сanny, чтобы создавать картинки, похожие на образцы. Canny — это алгоритм для обнаружения контуров. Я немного отредактировал результат работы алгоритма, чтобы сделать его проще, и не нервировать нейросеть Full Frontal Nudity. Но с потенциальным NSFW контентом нейросети Flux справляются стоически, просто рисуют на фоне причинных мест честное ничего. Так их обучали. Отказалась модель выполнять только запрос в котором я написал «Sucking a big black cock». Поэтому цензура тут есть, но не такая назойливая как была у сбера в его Кандинским, когда я последний раз им пользовался. Промпт я писал очень тупое скучное описание первоначальной картинки.

Процесс генерации изображения персонажа кот Фриц
Конечно, не обошлось без черипикинга. И подгонки параметров было много. Вот разные варианты.

Приличные варианты кота Фрица.
Потом я также взял второго персонажа, лиса Хабиби. Тут я использовал немножко другую архитектуру без препроцессинга. Нейросеть Flux Dev, к которой подключается Control Net. Я попробовал два варианта Control Net Pose и Control Net Canny. Без препроцессинга Control Net Canny может делать более широкие вариации. И Control Net Canny показался мне менее всратым для этого типа картинок чем Control Net Pose. Поэтому в итоге я использовал Control Net Canny. В качестве входных параметров кроме веса и изображения Сontrol Net принимает подинтервал интервала [0,1]. Грубо говоря, чем больше подинтервал тем больше может быть изменений, но взависимости от его положения, ближе к нулю или 1, изменения могут быть более глобальные или локальные. Вот что получилось:

Процесс генерации изображения персонажа лис Хабиби
 Приличные варианты лиса Хабиби.
Потом я решил попробовать сгенерировать сцены с несколькими персонажами. Но старые методы тут могли генерировать только дурацкие плохо-сгенерированные кадры из мультики. Думаю им не хватало числа шагов. Максимальное у runware cтоит 50. Потом я нашел инструмент Flux Context. И я заметил, что если дать ему промпт типа того, который я всегда даю, и референс-картинку, то она изобразит промт в стиле и с объектами из референса. И это работает совершенно поразительно! Оказывается можно дать, а качестве референса коллаж с персонажами и объектами, а в промпте описание сцены, и Flux Kontext нарисует сцену с данными персонажами. Я потом еще пытался исправлять мелкие ошибки методом inpinting c помощью сети flux dev. Также этим методом я добавил сексуальные набедренные повязки, потому что я решил, что это лучше чем честное ничего. Вот что у меня получилось:

Процесс генерации изображении сложной сцены
 Первоначальное изображение.
 Результат отобранный у Flux Context
 Улучшение? методом inpainting

 Эти варианты у меня получились после ебанутого промт инжиниринга от сети deepseek и использованием улучшенного изображения в качестве референса. Что-то тут есть. Например, первое изображение обладает лучшей геометрией из всех сгенерированных по этой теме. А второе выглядит реалистичней. Но персонажи получились меньше похожи на себя.
 Вот еще интересный вариант с другой геометрией.
 А вот что получается, если просто скормить в Kontext изначальную картину. Потом я пихал эту картинку в Control Net.


 Но помощью Control Net получалось слишком примитивно.
Вообще нейросеть Flux Kontext преподносилась как нейросеть для редактирование изображений текстовыми командами. Но если работать с выходными данными генеративных нейросетей, то удобней использовать inpainting, потому что часто нужно убрать хуйню, которая неизвестно как называется, или перерисовать неправильно нарисованную руку. Но с задачей создания сцен с похожими предметами и персонажами он справляется хорошо. Дальше я решил скормить нейросеткам постельную сцену с тем же персонажами. Секс он рисовать не может, поэтому пришлось остановиться на предварительных ласках. Видимо из-за такого зазора эта сцена пошла хуже. Ее я пытался редактировать текстовыми командами в Kontext-е. Но потом все равно пришлось чисть изображение в Flux Dev.

Процесс генерации изображения со сложной сценой
 Первичное изображение.
 Результат Kontext-а
 Отредактированная версия Коntext-ом и Девом. Я заметил, что Прогон через Дев снижает цветность.
 Попытка сделать картинку белее реалистичной с помощью контекста
 Сексуальные уродцы от контекста
 Другая версия от нейросети HiDream. Но я не уверен, что я использую ее правильно.
Выводы тут какие. Я не жалею, что потратил деньги, потому что я познакомился с новыми технологиями. Но в финансовам плане надо учитывать, что генерация в Kontext за 1 доллар можно сгенерировать 14 картинок, а в Dev около 500. Потому Kontext стоит использовать, если вы понимаете как решать с его помощью задачу. А эксперементы с Kontext-ом обходятся в копеечку. Поэтому для экспериментов и других задач лучше использовать прошлые модели типа Flux 1 Dev. Мне кажется, что Flux Context вполне справляется с теми задачами, которые я перед ним поставил. А особенно хорошо справляться с этими задачами должна цепочка правильных инструментов. В этом плане работа ai-художника похожа на работу обычного художника. Потому что получение хорошего результата тоже требует затрат времени и выбора правильных инструментов. С другой стороны для получения этих картинок можно было бы за те же деньги нанять профессионального художника. Не уверен, что 20 долларов хватило бы на 4 картинки. И с AI я действительно получаю больше картинок. Но чтобы добиться качества сравнимого с работой настоящего художника может потребоваться еще больше генераций. Я думаю, эти цепочки инструментов сейчас уже активно используют для создания разного рода контента. Но меня смущает, например, вот что, что хотя новые картинки получились более качественные, они стали менее острыми и символичными. Думаю такое будущее нас ждет, с формально высоким качеством, но в действительности крайне пресным ai-контентом.
|
|
|