Midjourney 5 улучшает почти все аспекты изображений, создаваемых искусственным интеллектом.
Становиться лучше: Учитывая все последние новости, вращающиеся вокруг ChatGPT и других крупных языковых моделей, легко забыть, что их родственники — генераторы изображений с искусственным интеллектом — все еще совершенствуются. Возможно, кто-то придумал, как визуализировать глаза и руки, не делая объект похожим на кошмар. однако результаты все еще пугают некоторых людей.
Ранее на этой неделе исследовательская лаборатория Midjourney выпустила бета-версию пятой версии своего одноименного программного обеспечения для обработки изображений с использованием искусственного интеллекта. Согласно объявлению в Твиттере, последняя версия добавляет более высокое качество изображения, более «разнообразные» результаты, более широкий диапазон стилей, бесшовные текстуры и многое другое.
С сегодняшнего дня наше сообщество может протестировать Midjourney V5. Он имеет гораздо более высокое качество изображения, более разнообразные выходные данные, более широкий стилистический диапазон, поддержку бесшовных текстур, более широкие соотношения сторон, лучшую подсказку изображения, более широкий динамический диапазон и многое другое. Давайте исследовать!
Пользователи уже опубликовали сотни потрясающих результатов, и чувства по поводу улучшений неоднозначны. Большинство из них впечатлены тем, что ИИ визуализации с трудом воспроизводит такие аспекты, как тени, отражения, глаза и руки. Ниже приведено изображение, которое мы создали с помощью Dall-E от OpenAI, в качестве примера неисправности машины.
Композиция несколько необычная, общее ощущение мультяшное. Освещение совсем неправильное. Глаза и руки сильно деформированы. Ноги испачканы артефактами, как и контейнер для попкорна и сиденье рядом с объектом. Этот результат является одним из четырех с похожими проблемами в разной степени.
Версия 5 Midjourney, кажется, улучшилась в этом отношении, по крайней мере, судя по примерам, которыми поделились другие. Результаты простых подсказок граничат с «жуткой долиной» — достаточно реалистичны, чтобы во многих случаях сойти за профессиональные фотографии, но все же с таким странным качеством, которое вы не можете точно определить. Хотя изображения невероятно реалистичны, многие описывают их как жуткие.
Midjourney v5 уже здесь! (на этот раз по-настоящему, лол) Вот несколько моих подсказок, v4 против v5, а также несколько новых подсказок и снимков толпы. По мере экспериментирования я буду добавлять к этому больше. pic.twitter.com/qSEZWQBXou
Наш собственный Кишалая Кунду сказал: «Честно говоря, я больше боюсь, чем впечатлен», после просмотра серии почти безупречных фотографий Midjourney V5. Опасения заключаются в том, что можно довольно легко создать фальшивый образ и выдать его за подлинный.
Помимо фактора ползучести, по сравнению с V4, Midjourney V5 имеет значительно улучшенное качество. Графический дизайнер Джули Виланд какое-то время использовала Midjourney V4 (выпущенную в ноябре прошлого года) и говорит, что версия 5 имеет «невероятно реалистичные» текстуры кожи. Эффекты освещения также стали намного лучше, включая отражения, блики и тени. Возможно, самое главное, ИИ генерирует руки и глаза, которые большую часть времени выглядят естественно.
�"� Совет MJ: снимки через окно наконец-то стали возможны с V5! Я жаждал эстетики "My Blueberry Nights" с тех пор, как впервые попробовал Dalle2 (и все получилось нормально), но v5 это ошеломляет! �' найдите подсказку в ALT-тексте изображений #synthography #midjourneyv5 pic.twitter.com/kAOagopucG
«Глаза почти идеальны и больше не шатаются», — рассказал Виланд Ars Technica. «Руки в большинстве случаев правильные, с пятью пальцами вместо 7-10 на одной руке. MJ v5 в настоящее время кажется мне, как будто я наконец-то получил очки после того, как слишком долго игнорировал плохое зрение. Внезапно вы видите все в 4k; кажется странно ошеломляющим, но в то же время удивительным».
Фотография молодой женщины в уличном стиле 1960-х годов, сидящая, парусник, зеленое платье Dior, зеленое шелковое платье, зеленое платье, шелк, жемчужное ожерелье, жемчуг Тиффани, жемчужное ожерелье Тиффани, закат, океан, снято на Agfa Vista 200, 4k --ar 16:9v4 (слева) v5 (справа) pic.twitter.com/wz7GbI3fvA
Midjourney также улучшила исходное разрешение с 512x512 пикселей до 1024x1024 пикселей. Увеличение соответствует рейтингу Dall-E. Однако версия 4 могла использовать суперсэмплирование для удвоения собственного разрешения. Вполне разумно ожидать, что V5 будет использовать ту же технику для создания изображений 2048x2048, но это будет обновление, которое произойдет в будущем.