Meta, социальный медиа-гигант, недавно представил свои инновационные модели искусственного интеллекта для создания видео и редактирования изображений. Эти передовые модели все еще находятся в экспериментальной фазе, но первые результаты свидетельствуют о том, что они могут изменить игру для создателей контента, художников и аниматоров.
Раскрывая силу Emu Video и Emu Edit
Две модели искусственного интеллекта, представленные Meta, — это Emu Video и Emu Edit. Emu Video, улучшение предыдущей модели Emu Meta, может генерировать видеоролики из текстовых и изображенческих входов. С другой стороны, Emu Edit фокусируется на редактировании изображений, предлагая улучшенную точность при редактировании изображений.
Emu Video использует уникальный подход «факторизации», разделяя процесс обучения на два этапа, чтобы модель реагировала на различные входы. Сначала она генерирует изображения на основе текстового запроса, затем создает видео, используя как текст, так и сгенерированное изображение. Эта модель также может «оживлять» изображения на основе текстового запроса.
В отличие от других моделей, которые полагаются на глубокую каскадную модель, Emu Video использует только две модели диффузии для генерации видеороликов размером 512×512 пикселей длительностью в четыре секунды со скоростью 16 кадров в секунду. Emu Edit, с другой стороны, позволяет пользователям добавлять или удалять фоны изображений, выполнять цветовые и геометрические преобразования, редактировать изображения как локально, так и глобально.
Обязательство Meta к точности и отзывчивости
Meta подчеркивает, что основная цель этих моделей — не только создавать «правдоподобные» изображения. Вместо этого акцент делается на изменении только пикселей, соответствующих запросу на редактирование, с максимальной точностью. Например, если инструкция заключается в добавлении текста «Алоха!» на бейсбольную кепку, модель гарантирует, что сама кепка останется неизменной.
Emu Edit обучалась с использованием задач компьютерного зрения с набором данных из 10 миллионов синтезированных изображений, каждое с входным изображением, описанием задачи и целевым выходным изображением. Meta утверждает, что это самый крупный набор данных такого рода на сегодняшний день.
Обучение моделей искусственного интеллекта с использованием массивных наборов данных
Оригинальная модель Emu обучалась с использованием огромного объема данных, включая фотографии и подписи, размещенные пользователями в Facebook и Instagram. Об этом заявил генеральный директор Марк Цукерберг на мероприятии Meta Connect в сентябре.
Несмотря на потенциал этих инструментов искусственного интеллекта, Meta была осторожна в их внедрении из-за близкого внимания регуляторов. Например, Meta недавно объявила, что не позволит политическим кампаниям и рекламодателям использовать свои инструменты искусственного интеллекта для создания рекламы на Facebook и Instagram.
Погружаясь в мир искусственного интеллекта и его применений, платформы, такие как cryptoview.io, могут предоставить бесценные идеи в быстро развивающемся технологическом мире. Благодаря своим комплексным возможностям cryptoview.io может помочь пользователям быть в курсе последних событий в мире технологий.
