تمرکز OpenAI بر روی تعامل صوتی با هوش مصنوعی

...

OpenAI به‌صورت جدی در حال سرمایه‌گذاری روی آینده‌ای است که در آن صدا به رابط اصلی تعامل انسان و هوش مصنوعی تبدیل می‌شود. طبق گزارش جدید وب‌سایت The Information، این شرکت طی دو ماه گذشته چندین تیم مهندسی، تحقیقاتی و محصول خود را با هم ادغام کرده تا نسل جدیدی از مدل‌های صوتی را توسعه دهد. هدف نهایی، آماده‌سازی زیرساخت لازم برای یک دستگاه شخصی صوت‌محور است که احتمالاً حدود یک سال دیگر معرفی خواهد شد.

این تصمیم OpenAI، بازتابی از یک روند بزرگ‌تر در صنعت فناوری است؛ روندی که در آن صفحه‌نمایش‌ها به حاشیه می‌روند و صدا در مرکز تجربه کاربری قرار می‌گیرد. امروزه دستیارهای صوتی از طریق اسپیکرهای هوشمند وارد بیش از یک‌سوم خانه‌های آمریکا شده‌اند و تعامل صوتی دیگر یک فناوری لوکس یا آزمایشی محسوب نمی‌شود. در همین راستا، شرکت Meta به‌تازگی قابلیتی جدید برای عینک‌های هوشمند Ray-Ban معرفی کرده که با استفاده از آرایه‌ای پنج‌میکروفونی، امکان تمرکز روی مکالمات در محیط‌های شلوغ را فراهم می‌کند؛ قابلیتی که عملاً صورت انسان را به یک ابزار شنیداری هوشمند تبدیل می‌کند. از سوی دیگر، گوگل نیز از ژوئن امسال آزمایش قابلیتی به نام Audio Overviews را آغاز کرده که نتایج جست‌وجو را به خلاصه‌های مکالمه‌ای صوتی تبدیل می‌کند.

 

تمرکز OpenAI بر روی صدا

 

در صنعت خودرو نیز این تغییر به‌وضوح دیده می‌شود. تسلا در حال ادغام چت‌بات Grok متعلق به xAI در خودروهای خود است تا کاربران بتوانند از طریق مکالمه طبیعی، همه‌چیز را از مسیریابی گرفته تا تنظیم دمای کابین کنترل کنند. البته فقط غول‌های فناوری نیستند که روی آینده صوتی شرط‌بندی کرده‌اند. استارتاپ‌های متعددی نیز وارد این میدان شده‌اند؛ هرچند همه آن‌ها موفق نبوده‌اند. پروژه Humane AI Pin با وجود سرمایه‌گذاری صدها میلیون دلاری، به نمونه‌ای شکست‌خورده از گجت‌های بدون صفحه‌نمایش تبدیل شد. گردنبند Friend AI که ادعا می‌کند زندگی کاربران را ضبط کرده و نقش یک همراه را ایفا می‌کند نیز با موجی از نگرانی‌های حریم خصوصی مواجه شده است.

در عین حال، شرکت‌هایی مانند Sandbar و استارتاپی به رهبری «اریک میگی‌کوفسکی» (بنیان‌گذار Pebble) در حال توسعه حلقه‌های هوشمند مجهز به هوش مصنوعی هستند که انتظار می‌رود در سال ۲۰۲۶ معرفی شوند؛ گجت‌هایی که امکان مکالمه مستقیم با دست را فراهم می‌کنند. با وجود تفاوت در فرم‌فکتورها، ایده اصلی یکی است: صدا، رابط کاربری آینده است. خانه، خودرو و حتی بدن انسان در حال تبدیل شدن به سطوح کنترلی هوشمند هستند.

 

تمرکز OpenAI بر روی صدا

 

گزارش‌ها حاکی از آن است که مدل صوتی جدید OpenAI که برای اوایل ۲۰۲۶ برنامه‌ریزی شده، طبیعی‌تر صحبت می‌کند، مکالمات را قطع نمی‌کند، وقفه‌ها را درک می‌کند و حتی می‌تواند هم‌زمان با کاربر صحبت کند؛ قابلیتی که مدل‌های فعلی از آن ناتوان‌اند. OpenAI همچنین به دنبال توسعه خانواده‌ای از دستگاه‌ها، از جمله عینک‌های هوشمند یا اسپیکرهای بدون نمایشگر است که بیشتر شبیه «همراه» باشند تا یک ابزار ساده. نکته قابل‌توجه این است که «جانی آیو»، طراح افسانه‌ای سابق اپل که پس از خرید ۶.۵ میلیارد دلاری شرکت io به OpenAI پیوسته، کاهش اعتیاد به دستگاه‌های دیجیتال را یکی از اهداف اصلی طراحی این محصولات می‌داند. از نگاه او، طراحی صوت‌محور فرصتی است برای جبران اشتباهات نسل قبلی گجت‌های مصرفی.

منبع خبر: techcrunch

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟