
گوگل و آمازون در فضای هوش مصنوعی پیشرفتهای بزرگی کردهاند. گوگل با معرفی مدلهای جدید ویدئویی و تصویری خود، Veo و Imagen 3، در پلتفرم Vertex AI، توانسته توجهات را به خودش جلب کند. مدل Veo، که در حال حاضر به صورت پیش نمایش ارائه شده است، از طریق متن یا تصاویر، ویدئوهای سینمایی با کیفیت بالا و طول بیش از ۶۰ ثانیه تولید میکند و با حفظ انسجام فریمها، حرکتهای طبیعی و روان ارائه میدهد. این ویژگی آن را به رقیبی برای مدلهایی همچون Gen-3 شرکت Runway تبدیل کرده است.
Imagen 3 نیز به تولید تصاویر فوتورئالیستی از طریق متن پرداخته و قابلیتهایی مانند مقیاسدهی، ترمیم تصویر inpainting و outpainting و جایگزینی پسزمینه را ارائه میدهد. کاربران میتوانند با ارائه تصاویر مرجع به این مدل، خروجیها را با برند یا نیازهای خاص مورد نظر خود تطبیق دهند. این مدل از هفته آینده برای همه کاربران Vertex AI به طور عمومی در دسترس خواهد بود. این ابزارها به تیمهای بازاریابی و تبلیغات کمک میکنند محتوای تصویری و ویدئویی را سریعتر و با هزینه کمتر تولید کنند. مشتریانی مانند Agoda و Mondelez از این مدلها برای تسریع تولید محتوای تبلیغاتی و کاهش زمان تولید استفاده میکنند. ویژگیهای ایمنی مانند واترمارک دیجیتال و قابلیتهای تعدیل محتوا در این مدل، به مدیریت ریسکهای مرتبط با هوش مصنوعی مولد کمک میکنند.
در همین حال، آمازون نیز با مدل جدید Nova Reel، بخشی از خانواده Nova، وارد میدان شده است. این مدل، ویدئوهای ۶ ثانیهای با کیفیت بالا را از متن و تصاویر تولید میکند و به زودی از طریق سرویس Amazon Bedrock در دسترس خواهد بود. رقابت در این فضا بین ارائهدهندگان خدمات ابری مانند گوگل، آمازون و مایکروسافت شدت گرفته است. با اینکه مایکروسافت هنوز مدلی برای تولید ویدئو ارائه نداده است، پیشبینی میشود با ورود مدل Sora از OpenAI، به این حوزه وارد شود. تلاشهای گوگل و آمازون نشاندهنده اهمیت روزافزون مدلهای چندوجهی (Multimodal) در نوآوریهای بازاریابی، کاهش هزینهها و تسریع فرآیندها است. این پیشرفتها، فرصتهای جدیدی برای شرکتها ایجاد کرده تا محتوای بصری را بهصورت خلاقانه و بهینه تولید کنند.
منبع خبر: venturebeat
پاسخ :