Когда midjorney нейросеть рисует по словам

Рисование по словам выполняется с помощью генеративных нейронных сетей, таких как DRAW или StackGAN. Они обучаются на большом наборе изображений и слов, чтобы понимать соответствие между ними, и могут генерировать изображения, которые соответствуют заданным словам.

Инструменты ИИ, подобные DALL-E, которые генерируют изображения на основе коротких текстовых описаний, сейчас в моде, поэтому вполне логично, что другие системы начинают конкурировать за место на зарождающемся рынке ИИ-искусства.

Оформи ОСАГО не выходя из дома!

Ведь только так можно сэкономить, выбирая полис от разных компаний.

Узнать больше

В отличие от DALL-E, Midjourney, похоже, особенно преуспел в создании окружающей среды, особенно фантастических и антиутопических научно-фантастических сцен с драматическим освещением, которые выглядят как рендеринг концепт-арта из видеоигры.

Что такое MidJourney?

Подобно DALL-E 2 или Craiyon (бывший DALL-E Mini), MidJourney – это ИИ, преобразующий текст в изображение и создающий великолепные визуальные образы на основе ваших текстовых подсказок.

В то время как DALL-E предназначен для создания всего, что вы можете себе представить, включая обыденное или уродливое, MidJourney по умолчанию склоняется к созданию живописных, эстетически приятных изображений. Если есть выбор, MidJourney предпочитает создавать изображения с комплиментарными цветами, художественным использованием света и тени, четкими деталями и композицией с удовлетворительной симметрией или перспективой.

По словам его основателя, “мы просто хотим, чтобы программа была проста в использовании – и мы хотим, чтобы фотографии выглядели хорошо”.

Итак, давайте посмотрим, как это работает на практике!

Как пользоваться MidJourney?

В отличие от DALL-E 2 или DALL-E Mini, Midjourney не работает как веб-приложение. Также не требуется никакого кодирования.

Вместо этого вы используете его в популярном чат-приложении Discord, “разговаривая” с ботом. (Discord, для тех, кто не знаком, очень похож на Slack, и так же, как Slack, он работает как в браузере, так и в отдельном приложении, как на настольных, так и на мобильных компьютерах. )

Отдохни, попей чай

Попробуй вкусный чай, пока везде распродажи.

Посмотреть что за чай :)

Для бесплатного/пробного пользователя это особенно хаотично, потому что вы взаимодействуете с ботом в оживленном публичном чате, где все остальные ВСЕГДА делают то же самое!

Тем не менее, это также довольно забавный способ начать: вы можете видеть точные подсказки, которые пробуют все остальные, и их результаты – в прямом эфире и без фильтрации!

Став платным пользователем (всего от 10 долларов в месяц), вы сможете общаться с ботом в приватной беседе, что делает общение гораздо более спокойным. (Вы все еще можете следить за публичными каналами, чтобы узнать, что происходит, или участвовать в конкурсах, если вы чувствуете себя любопытным).

Как и следовало ожидать, создание образов состоит из ввода предложения и наблюдения за тем, что произойдет.

Шаг первый: подсказка DALL-E

Генерация изображений занимает примерно в два раза больше времени, чем DALL-E, – около 50 секунд уходит на то, чтобы показать начальные миниатюры.

Однако, в отличие от DALL-E, вы можете наблюдать, как ИИ постепенно генерирует ваши изображения, от первоначальных размытых цветов до миниатюр высокой четкости. Это довольно гипнотическое зрелище, которое только усиливает чувство восхитительного предвкушения.

В отличие от DALL-E, здесь есть второй шаг: начальные миниатюры имеют размер всего 256px (хотя вы можете загрузить все четыре в виде сетки!), после чего вы можете увеличить понравившееся изображение до полного качества, что стоит еще один кредит.

Этот процесс масштабирования занимает дополнительную минуту или около того – вы также сможете наблюдать, как он происходит, пока Midjourney заполняет детали.

Подобно DALL-E, вы также можете создавать “вариации” любого изображения MJ, где вы хотели бы увидеть похожие результаты. (Обратите внимание, это возможно только при использовании пользовательского интерфейса предыдущего поколения – вы не можете загрузить свое собственное изображение для изменения).

Запрос вариации генерирует четыре варианта, а не три, как в DALL-E.

Интересно, что вариации требуют меньше вычислительных затрат, чем создание изображения из текста – например, на базовом тарифном плане за 10 долларов можно создать 666 вариаций (всего 2664 миниатюры), но только 200 текстовых запросов.

Газпромбанк. Кредит наличными от 4,9% годовых

Лучший момент – сейчас!
Сумма: от 300 тысяч до 7 миллионов руб.
При сумме кредита до 7 млн. руб. нужен только паспорт.
Срок кредита: До 5 лет
Минимальная ставка: 4,4%

Узнать больше

Добавить комментарий