dmitry17
Это потому что нейронщики не создают информацию, а только перерабатывают существующую, да и та примитивна. Закон сохранения энергии работает и на информацию, в данном случае он будет звучать так: количество информации загруженной в нейросеть и выдаваемой ею, в условиях замкнутой системы, величина постоянная.
То есть, если в нейросеть не вливать информацию от себя, то она будет клепать лишь то, что уже было. Вот почему нейро-картинки меня не цепляют в 99% случаях. Количество новой информации на нуле.
Это исходит банально из принципов работы нейросетей. Энкодер сжимающий картинку в шум для базы данных и декодер восстановливающий шум в картинку. Это буквально всё, что умеет нейросеть генерирующая картинки. Чему то новому тут в фундаменте неоткуда взяться. Однако, этого уже достаточно, чтобы переработать существующие. Промпт это интерфейс генератора шума из текста, который позволяет создать шум изображения, которого никогда не существовало. То есть, при помощи текста можно влить и получить новую информацию.
Если описать это в целом, то нейросеть это упоротый словарь zip-архива изображений интернета без самих изображений с распаковкой при помощи псевдослучайной генерации, но с полезным побочным эффектом в виде возможности распаковать то, что никогда и не запаковывалось. И ко всему этому прикрутили сбоку генератор сжатых данных (того самого шума) из текста, который создаёт шум основываясь на словаре самой нейросети. Если задуматься, лютейшая дичь, до которой даже под тяжелыми веществами не додумаешься. Настоящие искусство от мира IT.
Но есть нюанс - нейросеть просто восстанавливает шум исходя из правил составленных после обработки сотен тысяч картинок. Ну то есть технически, она просто выполняет распаковку полученного из изображения шума обратно в изображение по правилам, что ранее заучила. То, что изображения, из которого якобы был получен шум, никогда не существовало - не важно. Шум на входе, изображение на выходе, а происхождение шума не важно.
Следовательно, нейросеть вложит в изображение столько информации, сколько вложили при составлении шума. И качество этой информации так же не изменится. Помимо этого она не способна выдать то, что ей не известно. Ну, то есть нейросеть не может выдать образ, который даже косвенно ей не попадался.
По факту, это обычный, но пиздец какой сложный, конечный автомат с состоянием на входе и выходе, а так же функцией внутри. Только функция написана не вручную, а автоматически при помощи другого алгоритма. Дискретная математика товарищи!
Нынешние нейронщики как будто не осознают это, а наоборот, думают что нейросети сами создадут им что то новое. Потому они фактически не вносят никакой осмысленной информации, от того и все картинки - пустышки.
Ах да, разумеется они не осознают. Они же читали "как поставить stable diffusion", а не "как работает stable diffusion". А стоит почитать как работают диффузионные нейросети, так сразу вся магия исчезнет. Но это же многобукав надо прочитать и, о ужас, немного понимать матан!
Я знаю только Exragnarokknight, который хоть и нейронщик, но явно пытается что то нам показать от себя. То есть, он вливает в нейросеть осмысленную информацию, потому его картинки и выделяются.
Можете глянуть:
Стиль он конечно взял не фотореалистичный, но если не знать, что это нейронщик, то можно подумать что это какой то странный художник, совершающий странные ошибки в мимике и постановке.
В тоже время большая часть картинок выглядит так
На первом примере просто стоит в одежде из ремней, на втором сидит на ковре раздвинув ноги. И чё?
А теперь сравните с этим:
Даже заменив на хуманов понятно, что сюда вложили больше смысловой информации. Автор пытался сделать нечто осмысленное и сложное, с эмоциями и ситуацией, хотя не всегда получается правильно. У него бывают настолько элементарные ошибки, что их любой видит. Например, взгляд и положение головы не сочетаются.
В предыдущих же примерах явно ничего осмысленного вложить не пытались. Это буквально "ЫЫЫААА!!! НАРЫСУЙ АЗЫАТКУ!!! А ТЭПЫРЬ С РЭМНЕМИ!!!".
Почему так? Как я и говорил - качество и количество информации не изменяется. По сути, вбивая банальный и не правильный промпт мы подсовываем декодеру сжатые данные изображения с откровенной смысловой хуйнёй.
...хрень не потому что нейросеть тупая, а потому что ей подсунули шум такого изображения. Перед вами буквально восстановленное изображение двух девах с одним покерфейсом на двоих в бронелифчиках. Это хуита какая то, нарисуй это художник или нейросеть.
Нейросеть тупит когда совершает технические ошибки в виде кривых лиц, шестого пальца, криповых рёбер или делает форму кожи как у латексного костюма.
Остальное - проблема входных данных. А чтобы входные данные были адекватными надо иметь чёткое представление что изобразить и как это должно адекватно выглядеть. И самый прикол в том, что этому художники в том числе и учатся! XD
Можно математически точно уметь изображать кувшин, но если не понимаешь куда и как этот кувшин адекватно засунуть, то от этого нет никакой пользы.
Вот нейросеть научили правильно изображать условный кувшин, а КУДА его засунуть должны ей говорить мы. Мы же видим, что почти ни кто не знает куда этот кувшин засунуть, потому большая часть нейро-картинок представляет собой это:
Вместо кувшина у нас люди в различных стилях, фурри и прочие ксеносы. Технически красиво и детально, но это кувшин.
В нейро-картинках не хватает того, что позволило бы называть их нейро-артами, этого самого Art. То есть, не хватает искусства или хотя бы творчества. Оно нам в целом сейчас нужно как никогда.
И что самое главное, у людей юзающих нейросети не хватает навыков осмысленного составления визуальных образов, которым учатся художники.