Google представила Veo 3 — модель ИИ для создания видео со звуком

0 253

151-780x470 (1).webp

На ежегодной конференции для разработчиков Google I/O компания анонсировала новые модели генерации медиаконтента. Самым заметным нововведением стала Veo 3 — первая версия ИИ от Google, способная создавать видео со звуком. Например, она может сгенерировать ролик с поющими птицами или уличную сцену с шумом транспорта.

По словам Google, Veo 3 также превосходит аналоги в реалистичности физики и синхронизации движений губ. Пока модель доступна только подписчикам Gemini Ultra в США через приложение Gemini, а также корпоративным клиентам на платформе Vertex AI. Кроме того, Veo 3 интегрирована в Flow — новый инструмент Google для кинопроизводства на основе ИИ.

Flow: киностудия на основе ИИ

Flow объединяет возможности Veo, Imagen и Gemini, позволяя пользователям создавать кинематографические сцены, просто описывая желаемый результат на естественном языке. Пока инструмент доступен только подписчикам Google AI Pro и Ultra в США, но вскоре его планируют запустить в других странах. Хотя Google представила новую модель, Veo 2 тоже остаётся в арсенале. Пользователи смогут загружать в неё изображения людей, объектов и стилей, чтобы использовать их как референсы для генерации видео в Flow. Также доступны функции управления камерой: изменение ракурсов, масштабирование и даже преобразование портретного видео в горизонтальное.

Imagen 4 — новая эра генерации изображений

На мероприятии также представили Imagen 4 — улучшенную модель для создания изображений. Она лучше передаёт детали, такие как сложные ткани и мех животных, а также справляется как с фотореалистичными, так и с абстрактными изображениями. Кроме того, Imagen 4 значительно улучшила работу с типографикой и поддерживает разные пропорции с разрешением до 2K. Модель уже доступна в Gemini, Vertex AI и Workspace (включая Docs и Slides). Вскоре Google обещает выпустить версию Imagen 4, которая будет в 10 раз быстрее предыдущей Imagen 3.

SynthID Detector: проверка на "искусственность"

Чтобы помочь пользователям отличать контент, созданный ИИ, Google запустила SynthID Detector — портал, где можно загрузить медиафайл и проверить, содержит ли он водяной знак SynthID (инструмент маркировки ИИ-контента). Однако не все генераторы изображений используют эту технологию, поэтому сервис не сможет идентифицировать все ИИ-ролики и картинки. Новые инструменты Google делают генерацию мультимедиа ещё более реалистичной, но вместе с тем подчёркивают необходимость прозрачности в эпоху искусственного интеллекта.

Источник

Baijiahao, Китай. Путин не стал терпеть выходки Финляндии: она заплатит за вступление в НАТО
  • pretty
  • Вчера 08:01
  • В топе

Россия выставила Финляндии счет на три миллиарда евро, пишет Baijiahao. Хельсинки заключил договор с Москвой строительстве АЭС, но после вступления в НАТО его аннулировал. Теперь финнам придется запла...

"Герасимов сбежал, Шойгу допрашивают, Ту-154 летят на Урал": Слухи о схватке в верхах "штурмуют" Кремль

Иван ПрохоровПоток слухов о проблемах в российской верхушке нарастает день ото дня: инсайдерские ленты полны рассказов о якобы бегстве "випов", допросах тех, кто совсем недавно считался...

"Войны по-настоящему" не будет, пока два главных узла спокойно работают. Эксперт сказал, где находятся "мишени"
  • sam88
  • Вчера 07:05
  • В топе

Почти неделю пылают Киев и порты Одессы. Огненный вал из дронов и "Искандеров" напугал даже Трампа, который снова пригрозил Путину, требуя "не играть с огнём". Массированные удары заст...