گوگل از دستیار صوتی Gemini Live خود رونمایی کرد

...

گوگل از قابلیت جدیدی به نام Gemini Live رونمایی کرده است که به عنوان یک دستیار صوتی مکالمه‌محور قرار است رقیب Voice Mode شرکت OpenAI باشد. این قابلیت از طریق اپلیکیشن Gemini در سیستم‌عامل‌های اندروید و iOS در دسترس است و به کاربران امکان می‌دهد با استفاده از صدا با هوش مصنوعی تعامل داشته باشند. قابلیت Gemini Live که توسط مدل Gemini 1.5 Flash گوگل پشتیبانی می‌شود، قادر است به سوالات کاربران در قالب ۱۰ صدای مختلف پاسخ دهد. کاربران می‌توانند از این دستیار برای مدیریت لیست‌های خرید، یا خلاصه‌سازی ایمیل‌های دریافتی استفاده کنند.Sissie Hsiao ، مدیر کل گوگل در مورد تجربه‌ کاری با Gemini و دستیار گوگل، اعلام کرد که این دستیار در حال تکامل است تا سطح جدیدی از کمک را ارائه دهد و تعاملاتی طبیعی‌تر و مکالمه‌ای‌تر ایجاد کند.

 

Gemini Live

 

قابلیت جدید گوگل به کاربران اجازه می‌دهد هنگام استفاده از سایر اپلیکیشن‌ها و حتی زمانی که گوشی قفل است، با دستیار صوتی ارتباط برقرار کنند، مشابه یک تماس تلفنی معمولی. Gemini Live در حال حاضر به زبان انگلیسی و برای مشترکین Gemini Advanced در دستگاه‌های اندرویدی قابل دسترس است و در هفته‌های آینده برای iOS و زبان‌های بیشتر ارائه خواهد شد. اشتراک Gemini Advanced یک ماه زمان آزمایشی رایگان دارد و پس از آن ماهانه ۲۰ دلار هزینه خواهد داشت. علاوه بر قابلیت‌های صوتی، مشترکین به مدل Gemini 1.5 Pro نیز دسترسی دارند که قابلیت پردازش داده‌های حجیم را دارد. همچنین این اشتراک امکاناتی مانند فضای ذخیره‌سازی بیشتر، دسترسی به Gemini در اپلیکیشن‌های Workspace و قابلیت آپلود فایل‌ها برای تعامل با چت‌بات را فراهم می‌کند.

 

گوگل در حال گسترش قابلیت‌های Gemini Live است که شامل سازگاری با اپلیکیشن‌های دیگر گوگل مانند YouTube Music می‌شود، جایی که کاربران می‌توانند با دستورات صوتی لیست پخش ایجاد کنند. همچنین، قابلیت پشتیبانی از تقویم نیز به زودی اضافه می‌شود، تا چت‌بات بتواند با اپلیکیشن تقویم کاربران تعامل داشته باشد و یادآوری‌های مربوط به رویدادهای آینده را تنظیم کند. گوگل برنامه دارد تا سرعت و کیفیت پاسخ‌های Live را نیز بهبود بخشد. مدل پایه Gemini 1.5 Flash که در رویداد Google I/O معرفی شد، با وجود اینکه از مدل پیشرفته 1.5 Pro کوچکتر است، همچنان توانایی پردازش ورودی‌های حجیم را داراست. قابلیت Gemini Live در حالی معرفی شده که OpenAI نیز در حال بهبود ویژگی‌های صوتی ChatGPT است و مدل جدید GPT-4o به طور قابل توجهی عملکرد صوتی چت‌بات را ارتقا داده است. اگرچه برخی ممکن است گوگل را به کپی کردن از Voice Mode چت‌بات OpenAI متهم کنند، اما گوگل مدت‌هاست که روی توسعه این قابلیت کار می‌کند. Gemini Live بخشی از پروژه‌ای است که با عنوان Project Astra در رویداد I/O در ماه مه معرفی شد.

منبع خبر: AI Business
 

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟