با مدل صوتی Audiobox متا آشنا شوید

...

• هوش مصنوعی Meta's Audiobox پیام‌های متنی را تبدیل به صدا و گفتار می‌کند.

متا، مادر فیس‌بوک، از جدیدترین مدل هوش مصنوعی نسل صوتی خود به نام Audiobox رونمایی کرد که به کاربران اجازه می‌دهد متن را به صدا تبدیل کنند. با استفاده از این مدل می‌توانید به سادگی، آنچه را که می‌خواهید بشنوید به صورت متنی توصیف کنید تا مدل تبدیل متن به صدا آن را به صدایی که درخواست کرده‌اید تبدیل کند. Audiobox که جایگزین مدل صوتی Voicebox است؛ با استفاده از پردازش زبان طبیعی درخواست‌ها را به صورت زبان طبیعی دریافت می‌کند. به‌عنوان‌مثال، می‌توانید عبارت «زنی جوان در حال صحبت در داخل کلیسا» را تایپ کنید تا مدل صوتی، صوت مربوط به آن را تولید کند. برای کسب اطلاعات بیشتر در مورد ورودی‌های این مدل صوتی، می‌توانید به برخی از نمونه‌های صوتی AudioBox در وب سایت تحقیقاتی متا گوش دهید.Audiobox  همچنین می‌تواند ورودی‌های صوتی را مدیریت کند به این معنی که کاربران می‌توانند یک ورودی صوتی و یک پیام متنی را برای ترکیب و تولید بهتر صدا ترکیب کنند. این به کاربران امکان می‌دهد سبک گفتار و جلوه‌های صوتی را که می‌خواهند تولید کنند مشخص کنند، ویژگی که در نسخه قبلی مدل یافت نمی‌شود. به گفته متا، وقتی یک ورودی صوتی و پیام متنی با هم استفاده می‌شوند، مدل می‌تواند با استفاده از پیام متنی جنبه‌های مختلف صوت را تغییر دهد. متا گفت که Audiobox می‌تواند برای تولید صدای با کیفیت برای رسانه‌هایی مانند پادکست‌ها و کتاب‌های صوتی استفاده شود. به این ترتیب، کاربران می‌توانند صدایی ایجاد کنند که در حالت عادی نیازمند دسترسی به کتابخانه‌های صوتی گسترده و همچنین تخصص برای به دست آوردن نتایج بهینه است. تخصصی که عموم مردم یا حتی علاقه‌مندان ممکن است از آن برخوردار نباشند. متا گفت که سیستم‌های تولید صدا مانند Audiobox موانع دسترسی برای ایجاد صدا را کاهش می‌دهند و تبدیل شدن به یک سازنده محتوای صوتی را برای هر کسی آسان می‌کنند. افراد می‌توانند از مدل‌هایی مانند Audiobox برای تولید صوت برای ویدئوها یا پادکست‌ها، جلوه‌های صوتی سفارشی برای بازی‌ها و یا موارد دیگر استفاده کنند. 

مدل صوتی audiobox

تشخیص صدای تولید شده توسط هوش مصنوعی:

Audiobox دارای واترمارک صوتی خودکار است که توسط آن هر صدای تولید شده توسط مدل هوش مصنوعی قابل ردیابی است. روش کار واترمارکینگ متا به این صورت است که سیگنالی را در صدا تعبیه می‌کند که به گفته شرکت برای گوش انسان نامحسوس است؛ اما می‌توان آن را در سطوح دقتی بسیار بالا تشخیص داد و پی برد که این صدا توسط هوش مصنوعی تولید شده است. Audiobox در برابر یک سری از حملات سایبری آزمایش شد و توانست از تمام آنها سربلند بیرون بیاید. نسخة نمایشی Audiobox که به زودی منتشر می‌شود، دارای ویژگی احراز هویت صوتی برای محافظت در برابر جعل هویت است. هرکسی که می‌خواهد صدایی را به نسخه نمایشی Audiobox اضافه کند، باید با استفاده از صدای خود یک پیام صوتی را بیان کند.Audiobox  تنها سیستم تولید صدا نیست که دارای محافظت از واترمارکینگ است. صوت‌های تولید شده توسط مدل صوتی Lyria Google DeepMind را هم می‌توان با استفاده از ابزار SynthID شناسایی کرد. 

نظرات 3

wave
  • commenter

    Shirin

    2 سال پیش

    پس می تونه تحول بزرگی تو صنعت سینما هم ایجاد کنه

  • commenter

    شاهین آقامعلی

    2 سال پیش

    بله در تمام زمینه هایی که مرتبط با صوت هست میتونه تغییرات بزرگی ایجاد کنه

  • commenter

    Shabnam AG

    2 سال پیش

    بسیاااار عالیییی👌

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟