آواتارهای جدید ساخته شده با هوش مصنوعی می‌توانند پلک بزنند و حالات صورت واقعی داشته باشند

...

Synthesia، پلتفرم سازنده آواتار، جدیدترین نسل از آواتارهای مصنوعی خود را معرفی کرده است که اکنون قادر به گفتار گویاتر هستند. Synthesia که در سال 2017 تأسیس شد، می تواند متن وارد شده را در عرض چند دقیقه به ویدیو تبدیل کند. بی بی سی، نایک و گوگل از جمله شرکت هایی هستند که از Synthesia برای ایجاد آواتارهای سفارشی خود استفاده میکنند. کسب‌وکارها می‌توانند از آن‌ها برای کارکنان خود یا برای موارد بازاریابی استفاده کنند. آواتارهای جدید هوش مصنوعی Synthesia از مدل جدید Express-1 استفاده می‌کنند که آنها را قادر می‌سازد تا پاسخ‌های واقعی‌تری تولید کنند. آواتارهای جدید Synthesia اکنون میتوانند پلک بزنند و حالات چهره را به بهترین شکل ممکن شبیه سازی کنند که با آنچه کاربر میگوید کاملا هماهنگ باشد. این شرکت جدیدترین آواتارهای خود را به عنوان بازیگران دیجیتالی معرفی کرده است که قادر به خواندن ورودی های متنی شبیه به انسان میباشند. مدل Express-1 توسط مجموعه ای از مدل های از پیش آموزش دیده ارائه می شود که ترکیبی از آنها آواتار را قادر می سازد تا محتوای یک اسکریپت را بهتر از قبل درک کند. Synthesia گفت آواتارهای قبلی با روال های از پیش تعریف شده محدود شده بودند و همین موضوع عملکرد آنها را محدود می کرد. پلتفرم Synthesia با مدل زیربنایی جدید خود می تواند حرکات صورت و حالات صورت مورد نیاز، هنگام تبدیل متن به گفتار را در زمان واقعی شبیه سازی کند و از لحن و تاکید مناسب استفاده کند. اگر مدل نتواند خروجی مورد انتظار را تولید کند، کاربران می توانند آن را تا رسیدن به نتیجه دلخواه باز تولید کنند. جان استارک، مدیر ارشد فناوری Synthesia در یک پست وبلاگی نوشت: چه مکالمه شاد باشد و چه غم انگیز، آواتارهای ما عملکرد خود را بر این اساس تنظیم می کنند و سطحی از همدلی و درک را نشان می دهند که این ویژگی زمانی تنها مختص بازیگران انسانی بود. قابلیت‌های تولیدی این آواتارهای جدید نیز فراتر از حرکت است. حالات چهره، پلک زدن و حتی نگاه چشم آنها اکنون کاملاً با گفتار آنها هماهنگ است. استارک گفت: آواتارهای گوینده به طور بی عیب و نقصی با ورودی های صوتی همگام هستند و میتوانند هر حرکت و بیانی را کاملاً با کلمات گفتاری هماهنگ کنند. 

Synthesia

استارک گفت: این هماهنگی حرکت و صدا، واقع گرایی آواتارهای ما را بالا می‌برد و می‌تواند جزئیات دقیقی از بیان انسان را به تصویر بکشد. AWS از جمله شرکت‌هایی بود که دسترسی اولیه برای استفاده از امکانات جدید Synthesia به آنها داده شد. Synthesia سرویس خود را بر روی فضاهای ابری خود میزبانی می‌کند. تانوجا رندری، مدیر عامل AWS برای اروپا، خاورمیانه و آفریقا گفت: فناوری Synthesia این پتانسیل را دارد که ارتباطات تجاری جذاب را به زبان‌ها و سناریوهای مختلف ارائه دهد که در غیر این صورت ممکن نبود.Synthesia  اقداماتی را برای اطمینان از استفاده مسئولانه از آواتارهایش در نظر گرفته است، از جمله محدودکردن ورودی‌های خاص و استفاده از ابزارهایی برای بررسی اعتبار محتوا. تا به امروز، پلتفرم مبتنی بر هوش مصنوعی Synthesia برای تولید بیش از 18 میلیون ارائه ویدئویی در بیش از 130 زبان استفاده شده است.

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟