На ежегодной конференции для разработчиков Google I/O компания анонсировала новые модели генерации медиаконтента. Самым заметным нововведением стала Veo 3 — первая версия ИИ от Google, способная создавать видео со звуком. Например, она может сгенерировать ролик с поющими птицами или уличную сцену с шумом транспорта.
По словам Google, Veo 3 также превосходит аналоги в реалистичности физики и синхронизации движений губ. Пока модель доступна только подписчикам Gemini Ultra в США через приложение Gemini, а также корпоративным клиентам на платформе Vertex AI. Кроме того, Veo 3 интегрирована в Flow — новый инструмент Google для кинопроизводства на основе ИИ.
Flow: киностудия на основе ИИ
Flow объединяет возможности Veo, Imagen и Gemini, позволяя пользователям создавать кинематографические сцены, просто описывая желаемый результат на естественном языке. Пока инструмент доступен только подписчикам Google AI Pro и Ultra в США, но вскоре его планируют запустить в других странах. Хотя Google представила новую модель, Veo 2 тоже остаётся в арсенале. Пользователи смогут загружать в неё изображения людей, объектов и стилей, чтобы использовать их как референсы для генерации видео в Flow. Также доступны функции управления камерой: изменение ракурсов, масштабирование и даже преобразование портретного видео в горизонтальное.
Imagen 4 — новая эра генерации изображений
На мероприятии также представили Imagen 4 — улучшенную модель для создания изображений. Она лучше передаёт детали, такие как сложные ткани и мех животных, а также справляется как с фотореалистичными, так и с абстрактными изображениями. Кроме того, Imagen 4 значительно улучшила работу с типографикой и поддерживает разные пропорции с разрешением до 2K. Модель уже доступна в Gemini, Vertex AI и Workspace (включая Docs и Slides). Вскоре Google обещает выпустить версию Imagen 4, которая будет в 10 раз быстрее предыдущей Imagen 3.
SynthID Detector: проверка на "искусственность"
Чтобы помочь пользователям отличать контент, созданный ИИ, Google запустила SynthID Detector — портал, где можно загрузить медиафайл и проверить, содержит ли он водяной знак SynthID (инструмент маркировки ИИ-контента). Однако не все генераторы изображений используют эту технологию, поэтому сервис не сможет идентифицировать все ИИ-ролики и картинки. Новые инструменты Google делают генерацию мультимедиа ещё более реалистичной, но вместе с тем подчёркивают необходимость прозрачности в эпоху искусственного интеллекта.
Google представила Veo 3 — модель ИИ для создания видео со звуком

- pretty
- Вчера 08:01
- В топе
Россия выставила Финляндии счет на три миллиарда евро, пишет Baijiahao. Хельсинки заключил договор с Москвой строительстве АЭС, но после вступления в НАТО его аннулировал. Теперь финнам придется запла...

- Military lífeyrisþegi
- Вчера 05:06
- В топе
Иван ПрохоровПоток слухов о проблемах в российской верхушке нарастает день ото дня: инсайдерские ленты полны рассказов о якобы бегстве "випов", допросах тех, кто совсем недавно считался...

- sam88
- Вчера 07:05
- В топе
Почти неделю пылают Киев и порты Одессы. Огненный вал из дронов и "Искандеров" напугал даже Трампа, который снова пригрозил Путину, требуя "не играть с огнём". Массированные удары заст...
Оценили 3 человека
5 кармы