На ежегодной конференции для разработчиков Google I/O компания анонсировала новые модели генерации медиаконтента

На ежегодной конференции разработчиков Google I/O компания анонсировала новую модель создания медиаконтента. Наиболее заметной новой функцией является Veo 3, первая версия искусственного интеллекта от Google, способная создавать видеоролики со звуком. Например, он может создавать видеоролики с пением птиц или уличными сценами с шумом транспорта.

Google утверждает, что Veo 3 также превосходит своих конкурентов с точки зрения реальной физики и синхронизации губ. В настоящее время модель доступна только пользователям Gemini Ultra в США через приложение Gemini и корпоративным клиентам на платформе Vertex AI. Veo 3 также интегрирует Flow — новый инструмент Google для создания фильмов на базе искусственного интеллекта.

Flow: киностудия на основе ИИ

Flow объединяет возможности Veo, Imagen и Gemini, позволяя пользователям создавать сцены из фильмов, просто описывая желаемые результаты на естественном языке. В настоящее время инструмент доступен только подписчикам Google AI Pro и Ultra в США, но в ближайшее время планируется внедрить его и в других странах.

Несмотря на то, что Google выпустила новую модель, Veo 2 остается в ее продуктовой линейке.

Обратите внимание: Бывший босс Google: «Через десять лет в мире будет два интернета».

Пользователи смогут загружать изображения людей, объектов и стилей, которые можно использовать в качестве справочных материалов для создания видеороликов в Flow. Также доступны элементы управления камерой: изменение угла обзора, масштабирование и даже преобразование портретного видео в альбомное.

Imagen 4 — новая эра генерации изображений

На мероприятии также была представлена ​​усовершенствованная модель создания изображений Imagen 4. Он лучше справляется с отображением таких деталей, как сложные ткани и мех животных, и может обрабатывать как фотореалистичные, так и абстрактные изображения. Кроме того, Imagen 4 отличается значительно улучшенными возможностями типографики и поддержкой различных соотношений сторон до разрешения 2K.

Модель доступна в Gemini, Vertex AI и Workspace (включая документацию и слайды). Google пообещала, что Imagen 4 выйдет скоро и будет в 10 раз быстрее своего предшественника Imagen 3.

SynthID Detector: проверка на "искусственность"

Чтобы помочь пользователям идентифицировать контент, созданный с помощью ИИ, Google запустил SynthID Detector — портал, на котором пользователи могут загрузить медиафайл и проверить, содержит ли он водяной знак SynthID (инструмент маркировки контента с помощью ИИ). Однако не все генераторы изображений используют эту технологию, поэтому сервис не сможет распознать все видео и фотографии ИИ.

Новый инструмент Google делает генерацию медиа более реалистичной, а также подчеркивает необходимость прозрачности в эпоху искусственного интеллекта.

Читайте все последние новости об искусственном интеллекте на New-Science.ru

Больше интересных статей здесь: Новости науки и техники.

Источник статьи: На ежегодной конференции для разработчиков Google I/O компания анонсировала новые модели генерации медиаконтента.