Как работает нейросеть «Шедеврум» — на примере достопримечательностей от Владивостока до Сочи
И от «Москва-Сити» до плато Маньпупунёр
В апреле «Яндекс» показал прототип приложения «Шедеврум» для генерации изображений с помощью нейросети. Приложение с кошкой-картошкой на логотипе доступно для iOS и Android, понимает запросы на русском и английском языках, работает бесплатно.
Нейросеть «Шедеврума» формирует изображения по методу каскадной диффузии: сначала создает картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. Первую версию генеративной модели для бета-теста разработчики обучили на 240 миллионах примеров картинок с текстовыми описаниями. Обучение продолжается на наборе данных из 500 миллионов примеров, в следующих обновлениях качество обещают улучшить.
Мы протестировали молодую нейросеть, дав задание изобразить семь российских достопримечательностей. Показываем, что из этого вышло.
Как генерировать картинки в «Шедевруме»
Понадобится аккаунт в «Яндексе» и устройство на iOS или Android, для веба приложение пока недоступно. Главная страница сформирована по принципу ленты с именами пользователей и делится на «Недавние» и «Лучшие» изображения, которым можно поставить лайки (они сохранятся в избранном).
Для создания картинки нужно нажать на плюс рядом со значком аккаунта и ввести текст на русском или английском. Создатели говорят, что нейросеть учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), способна подражать известным живописцам и работать в заданных художественных стилях. При этом приложение запрещает генерацию изображений с упоминанием конкретных людей.
На генерацию понадобится около минуты, после чего «Шедеврум» предложит четыре варианта изображений (так делает, например, и Midjourney). Можно выбрать одно из них и опубликовать в ленте, а затем скачать.
Готовые изображения доступны мгновенно в разрешении 256 × 256 пикселей, но если чуть-чуть подождать — появятся в разрешении 1 024 × 1 024. На процесс улучшения указывает значок волшебной палочки в правом нижнем углу.
Что у нас получилось
Мы попросили «Шедеврум» изобразить рандомный набор природных и архитектурных достопримечательностей: район «Москва-Сити», Золотой мост во Владивостоке, плато Маньпупунёр в Республике Коми, карельские Кижи, конструктивистскую Белую башню в Екатеринбурге, Иволгинский дацан в Бурятии и здание Морского порта с золотым шпилем в Сочи.
Для запросов указывали через запятую название достопримечательности, локацию, детали и требования — например, «фотореализм» или «вечернее небо». Результаты получились от приближенных к реальности до абсолютно футуристичных — обратите внимание на утопленный в Черном море шпиль здания Морского порта или микс из снесенной в Екатеринбурге телебашни и существующей Белой.
Фотографии: обложка — «Шедеврум»