Рисование по словам выполняется с помощью генеративных нейронных сетей, таких как DRAW или StackGAN. Они обучаются на большом наборе изображений и слов, чтобы понимать соответствие между ними, и могут генерировать изображения, которые соответствуют заданным словам.
Инструменты ИИ, подобные DALL-E, которые генерируют изображения на основе коротких текстовых описаний, сейчас в моде, поэтому вполне логично, что другие системы начинают конкурировать за место на зарождающемся рынке ИИ-искусства.
Оформи ОСАГО не выходя из дома!
Ведь только так можно сэкономить, выбирая полис от разных компаний.
Узнать большеВ отличие от DALL-E, Midjourney, похоже, особенно преуспел в создании окружающей среды, особенно фантастических и антиутопических научно-фантастических сцен с драматическим освещением, которые выглядят как рендеринг концепт-арта из видеоигры.
Что такое MidJourney?
Подобно DALL-E 2 или Craiyon (бывший DALL-E Mini), MidJourney – это ИИ, преобразующий текст в изображение и создающий великолепные визуальные образы на основе ваших текстовых подсказок.
В то время как DALL-E предназначен для создания всего, что вы можете себе представить, включая обыденное или уродливое, MidJourney по умолчанию склоняется к созданию живописных, эстетически приятных изображений. Если есть выбор, MidJourney предпочитает создавать изображения с комплиментарными цветами, художественным использованием света и тени, четкими деталями и композицией с удовлетворительной симметрией или перспективой.
По словам его основателя, “мы просто хотим, чтобы программа была проста в использовании – и мы хотим, чтобы фотографии выглядели хорошо”.
Итак, давайте посмотрим, как это работает на практике!
Как пользоваться MidJourney?
В отличие от DALL-E 2 или DALL-E Mini, Midjourney не работает как веб-приложение. Также не требуется никакого кодирования.
Вместо этого вы используете его в популярном чат-приложении Discord, “разговаривая” с ботом. (Discord, для тех, кто не знаком, очень похож на Slack, и так же, как Slack, он работает как в браузере, так и в отдельном приложении, как на настольных, так и на мобильных компьютерах. )
Отдохни, попей чай
Попробуй вкусный чай, пока везде распродажи.
Посмотреть что за чай :)Для бесплатного/пробного пользователя это особенно хаотично, потому что вы взаимодействуете с ботом в оживленном публичном чате, где все остальные ВСЕГДА делают то же самое!
Тем не менее, это также довольно забавный способ начать: вы можете видеть точные подсказки, которые пробуют все остальные, и их результаты – в прямом эфире и без фильтрации!
Став платным пользователем (всего от 10 долларов в месяц), вы сможете общаться с ботом в приватной беседе, что делает общение гораздо более спокойным. (Вы все еще можете следить за публичными каналами, чтобы узнать, что происходит, или участвовать в конкурсах, если вы чувствуете себя любопытным).
Как и следовало ожидать, создание образов состоит из ввода предложения и наблюдения за тем, что произойдет.
Шаг первый: подсказка DALL-E
Генерация изображений занимает примерно в два раза больше времени, чем DALL-E, – около 50 секунд уходит на то, чтобы показать начальные миниатюры.
Однако, в отличие от DALL-E, вы можете наблюдать, как ИИ постепенно генерирует ваши изображения, от первоначальных размытых цветов до миниатюр высокой четкости. Это довольно гипнотическое зрелище, которое только усиливает чувство восхитительного предвкушения.
В отличие от DALL-E, здесь есть второй шаг: начальные миниатюры имеют размер всего 256px (хотя вы можете загрузить все четыре в виде сетки!), после чего вы можете увеличить понравившееся изображение до полного качества, что стоит еще один кредит.
Этот процесс масштабирования занимает дополнительную минуту или около того – вы также сможете наблюдать, как он происходит, пока Midjourney заполняет детали.
Подобно DALL-E, вы также можете создавать “вариации” любого изображения MJ, где вы хотели бы увидеть похожие результаты. (Обратите внимание, это возможно только при использовании пользовательского интерфейса предыдущего поколения – вы не можете загрузить свое собственное изображение для изменения).
Запрос вариации генерирует четыре варианта, а не три, как в DALL-E.
Интересно, что вариации требуют меньше вычислительных затрат, чем создание изображения из текста – например, на базовом тарифном плане за 10 долларов можно создать 666 вариаций (всего 2664 миниатюры), но только 200 текстовых запросов.
Газпромбанк. Кредит наличными от 4,9% годовых
Лучший момент – сейчас!
Сумма: от 300 тысяч до 7 миллионов руб.
При сумме кредита до 7 млн. руб. нужен только паспорт.
Срок кредита: До 5 лет
Минимальная ставка: 4,4%