Так сетка опенсурсная. На офф сервисах конечно поставляется с NSFW фильтром. Но можно собрать ее локально и его отключить.
Может, но не легко. Приходится продираться через десяток таких генераций
А вот как dalle 2 решает. Тут просят красный куб на верху синего. Вроде простое описания, но понимать отношения сеткам тяжело
Плюс на задачах отношения нескольких объектов и их свойств сетки все сейчас лажают в той или иной степени. Задачка с маленький зелёный куб на верху большого красного куба сейчас святой граль таких нейронок, а не это ваше нейропорно.
https://twitter.com/MelMitchell1/status/1562110030823948290
Вообще сетки будут становится все лучше, я уверен, но вот что они смогут точно следовать детальным описаниям, если они подробные, то я скептичен. То есть с задачей нарисовать "Рыцаря в изящной детальной фэнтезийной броне" я уверен сетки смогут справляется без нареканий и идеально, но вот с "рыцарь в изящной детальной фентезийной броне, левий наплечник имеет вид льва с красными рубинами в качестве глаз, на кирасе герб в виде феникса, на лице шрам идущий через глаз до подбородка, на правой руке отсутствует мизинец, левая придерживает меч..." и так на большой абзац. Сейчас сетки с таким не справятся, дай бог пару деталей смогут верно понять и я думаю такая детальность будет проблемой и в будущем и это не говоря уже про более сложные композиции когда к примеру людей много каждый должен быть детально описан и они заняты на картине какой-то сложной деятельностью.
И это даже проблема не сеток, а датасеты на которых они обучаются. А обучаются они от многих сотен миллионов до миллиардов пар изображение описание к нему. А где взять столько изображений, где описание подробное прям на абзацы. Да нигде, просто парсятся интернет ресурсы это все фильтруется используя к примеру другие нейронки, на глаз если это все и просматривается, то только что бы туда случайно не попала какое-нибудь ЦП. Но о каком-то детальном качестве описания к каждой картинке речи и не идёт, слишком много человеко ресурсов надо. Хотя конечно чисто через количество это помогает сеткам в обобщении знаний, но не до конца.
Ну я изначально Тифу генерил и пытался сделать ещё более похожей перегенерив лицо и юбку. Может и зря.
А финальные феи без апскейлинга такие
Ну так все остальное сетки тоже делали. Я перегенерить той же сеткой лица и кисти. У фей они точно всратые, а вот с первой может и зря, но я изначально Тифу из финалки заказывал, хотелось больше похоже на нее.
Вот заблюриность да, но это артефакт другой сетки апскейлера, что бы увеличить разрешение. Родное разрешение у SD небольшое сильно дальше 512 и она начинает мутантов делать.
Без повышения у последней вот так было
Здесь. Но нужна регистрация.
https://huggingface.co/CompVis/stable-diffusion
Ну вот к примеру ролик с разбором