Bagel AI от ByteDance: Нейросеть, которая редактирует изображения

Сами авторы сравнивают возможности с GPT-4o от OpenAI и Gemini 2.0 от Google

Кристина Захезина, 26 мая 2025

Компания ByteDance, разработчик TikTok, выпустила новую ИИ-модель Bagel с открытым исходным кодом. Система способна редактировать изображения и, по заявлениям создателей, конкурирует с GPT-4o от OpenAI и Gemini 2.0 от Google. Технология обещает расширить возможности обработки визуального контента для разработчиков и обычных пользователей.

Bagel может обрабатывать как входные, так и текстовые данные в смешанном формате. Модель обучена на крупномасштабных, чередующихся видео и веб-данных, она может генерировать фотореалистичные изображения, видеокадры или чередовать изображение и текст — прежде всего нейросеть умеет «думать» перед генерацией визуальных выходных данных.

В процессе ИИ учится сохранять визуальные особенности и мелкие детали исходника и поэтому довольно эффективна для редактирования изображений. Также модель переключается между стилями и между «мирами» — научно-фантастическим, художественным и реальным.