
OpenAI بهصورت جدی در حال سرمایهگذاری روی آیندهای است که در آن صدا به رابط اصلی تعامل انسان و هوش مصنوعی تبدیل میشود. طبق گزارش جدید وبسایت The Information، این شرکت طی دو ماه گذشته چندین تیم مهندسی، تحقیقاتی و محصول خود را با هم ادغام کرده تا نسل جدیدی از مدلهای صوتی را توسعه دهد. هدف نهایی، آمادهسازی زیرساخت لازم برای یک دستگاه شخصی صوتمحور است که احتمالاً حدود یک سال دیگر معرفی خواهد شد.
این تصمیم OpenAI، بازتابی از یک روند بزرگتر در صنعت فناوری است؛ روندی که در آن صفحهنمایشها به حاشیه میروند و صدا در مرکز تجربه کاربری قرار میگیرد. امروزه دستیارهای صوتی از طریق اسپیکرهای هوشمند وارد بیش از یکسوم خانههای آمریکا شدهاند و تعامل صوتی دیگر یک فناوری لوکس یا آزمایشی محسوب نمیشود. در همین راستا، شرکت Meta بهتازگی قابلیتی جدید برای عینکهای هوشمند Ray-Ban معرفی کرده که با استفاده از آرایهای پنجمیکروفونی، امکان تمرکز روی مکالمات در محیطهای شلوغ را فراهم میکند؛ قابلیتی که عملاً صورت انسان را به یک ابزار شنیداری هوشمند تبدیل میکند. از سوی دیگر، گوگل نیز از ژوئن امسال آزمایش قابلیتی به نام Audio Overviews را آغاز کرده که نتایج جستوجو را به خلاصههای مکالمهای صوتی تبدیل میکند.

در صنعت خودرو نیز این تغییر بهوضوح دیده میشود. تسلا در حال ادغام چتبات Grok متعلق به xAI در خودروهای خود است تا کاربران بتوانند از طریق مکالمه طبیعی، همهچیز را از مسیریابی گرفته تا تنظیم دمای کابین کنترل کنند. البته فقط غولهای فناوری نیستند که روی آینده صوتی شرطبندی کردهاند. استارتاپهای متعددی نیز وارد این میدان شدهاند؛ هرچند همه آنها موفق نبودهاند. پروژه Humane AI Pin با وجود سرمایهگذاری صدها میلیون دلاری، به نمونهای شکستخورده از گجتهای بدون صفحهنمایش تبدیل شد. گردنبند Friend AI که ادعا میکند زندگی کاربران را ضبط کرده و نقش یک همراه را ایفا میکند نیز با موجی از نگرانیهای حریم خصوصی مواجه شده است.
در عین حال، شرکتهایی مانند Sandbar و استارتاپی به رهبری «اریک میگیکوفسکی» (بنیانگذار Pebble) در حال توسعه حلقههای هوشمند مجهز به هوش مصنوعی هستند که انتظار میرود در سال ۲۰۲۶ معرفی شوند؛ گجتهایی که امکان مکالمه مستقیم با دست را فراهم میکنند. با وجود تفاوت در فرمفکتورها، ایده اصلی یکی است: صدا، رابط کاربری آینده است. خانه، خودرو و حتی بدن انسان در حال تبدیل شدن به سطوح کنترلی هوشمند هستند.

گزارشها حاکی از آن است که مدل صوتی جدید OpenAI که برای اوایل ۲۰۲۶ برنامهریزی شده، طبیعیتر صحبت میکند، مکالمات را قطع نمیکند، وقفهها را درک میکند و حتی میتواند همزمان با کاربر صحبت کند؛ قابلیتی که مدلهای فعلی از آن ناتواناند. OpenAI همچنین به دنبال توسعه خانوادهای از دستگاهها، از جمله عینکهای هوشمند یا اسپیکرهای بدون نمایشگر است که بیشتر شبیه «همراه» باشند تا یک ابزار ساده. نکته قابلتوجه این است که «جانی آیو»، طراح افسانهای سابق اپل که پس از خرید ۶.۵ میلیارد دلاری شرکت io به OpenAI پیوسته، کاهش اعتیاد به دستگاههای دیجیتال را یکی از اهداف اصلی طراحی این محصولات میداند. از نگاه او، طراحی صوتمحور فرصتی است برای جبران اشتباهات نسل قبلی گجتهای مصرفی.
منبع خبر: techcrunch

شاهین آقامعلی


پاسخ :