В апреле «Яндекс» показал прототип приложения «Шедеврум» для генерации изображений с помощью нейросети. Приложение с кошкой-картошкой на логотипе доступно для iOS и Android, понимает запросы на русском и английском языках, работает бесплатно.

Нейросеть «Шедеврума» формирует изображения по методу каскадной диффузии: сначала создает картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. Первую версию генеративной модели для бета-теста разработчики обучили на 240 миллионах примеров картинок с текстовыми описаниями. Обучение продолжается на наборе данных из 500 миллионов примеров, в следующих обновлениях качество обещают улучшить.

Мы протестировали молодую нейросеть, дав задание изобразить семь российских достопримечательностей. Показываем, что из этого вышло.

Как генерировать картинки в «Шедевруме»

Понадобится аккаунт в «Яндексе» и устройство на iOS или Android, для веба приложение пока недоступно. Главная страница сформирована по принципу ленты с именами пользователей и делится на «Недавние» и «Лучшие» изображения, которым можно поставить лайки (они сохранятся в избранном).

Для создания картинки нужно нажать на плюс рядом со значком аккаунта и ввести текст на русском или английском. Создатели говорят, что нейросеть учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), способна подражать известным живописцам и работать в заданных художественных стилях. При этом приложение запрещает генерацию изображений с упоминанием конкретных людей.

На генерацию понадобится около минуты, после чего «Шедеврум» предложит четыре варианта изображений (так делает, например, и Midjourney). Можно выбрать одно из них и опубликовать в ленте, а затем скачать.

Готовые изображения доступны мгновенно в разрешении 256 × 256 пикселей, но если чуть-чуть подождать — появятся в разрешении 1 024 × 1 024. На процесс улучшения указывает значок волшебной палочки в правом нижнем углу.

Что у нас получилось

Мы попросили «Шедеврум» изобразить рандомный набор природных и архитектурных достопримечательностей: район «Москва-Сити», Золотой мост во Владивостоке, плато Маньпупунёр в Республике Коми, карельские Кижи, конструктивистскую Белую башню в Екатеринбурге, Иволгинский дацан в Бурятии и здание Морского порта с золотым шпилем в Сочи.

Для запросов указывали через запятую название достопримечательности, локацию, детали и требования — например, «фотореализм» или «вечернее небо». Результаты получились от приближенных к реальности до абсолютно футуристичных — обратите внимание на утопленный в Черном море шпиль здания Морского порта или микс из снесенной в Екатеринбурге телебашни и существующей Белой.

Фотографии: обложка — «Шедеврум»