Видео сейчас на этапе на котором генержка картинок была год назад.
Нет, но поддержку этой модели добавили в репу автоматика (которая да, в первую очередь для моделей stable diffusion сделана была) в виде расширения.
Кстати, добавление тефтелей в промпт результат делает еще интересней.
Это не Stable Diffusion, а модель modelscope от китайцев.
А мне нравится гротесктная и абсурдная часть вахи. Тем более от этого не избавится, это в ее ядре. У нас блин есть кибогезированные в почти полных роботов организация жрецов, которые своими механическими руками и тентаклями пишут перьями в свитках. И ниче, все привыкли, хотя это также абсурдно, как и то, что ты написал.
В основном варианты masterpice, 1girl, (upper body:1.4), , , alice in wonderland, creepy dark postapocalypse machinery surreal background, expressionless, pale skin, goth, makeup, night, dark blue color scheme, surreal, shadow demonic figures in background, fisheye,
Negative prompt: glowing eyes, easynegative, 3d, ((disfigured)), ((bad art)), ((deformed)),((extra limbs)), ((b&w)), wierd colors, blurry, (((duplicate))), ((morbid)), ((mutilated)), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))), out of frame, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck))), Photoshop, video game, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, mutation, mutated, extra limbs, extra legs, extra arms, disfigured, deformed, cross-eye, body out of frame, blurry, bad art, bad anatomy, 3d render

Использовал собственно обученные lora.
Модель
https://civitai.com/models/1540/unstableinkdream
Версия v5, а не v5 photoreal.
В том отчете его тестили еще без фишки чтения изображений.
Сейчас опенаи вообще ничего не пишет именно в плане тренировки, архитекутры, описания датасета, только метрики, да отчеты по безопасности. Причем в самой среде машинного обучения это людей прям бесит, так как раньше в этом поле царила относительная открытость. Нет, большие ребята конечно редко выкладывали код и веса модели, но обычно гуглы, майки, да и сама опенаи выкладывала научные работы с хоть какими-то подробностями. Но опенаи сейчас полностью ушла в закрытость и людей пугает, что это задаст трэнд остальным и полезные знания так и будут за закрытыми дверями.
А за параметрами перестали гнаться, после научной работы дипмайнда с их моделью Chinchilla, где они показали, что прошлые гигантские модели сильно недотренированы и что банально с большим количеством данных и времени тренировки, можно добиться таких же результатов, но на гораздо более худых моделей. Что очень сейчас актуально их надо деплоить, а гпу-хи не резиновые и бесплатные. Так что GPT4 возможно даже меньше чем GPT3.