گوگل از قابلیت جدیدی به نام Gemini Live رونمایی کرده است که به عنوان یک دستیار صوتی مکالمهمحور قرار است رقیب Voice Mode شرکت OpenAI باشد. این قابلیت از طریق اپلیکیشن Gemini در سیستمعاملهای اندروید و iOS در دسترس است و به کاربران امکان میدهد با استفاده از صدا با هوش مصنوعی تعامل داشته باشند. قابلیت Gemini Live که توسط مدل Gemini 1.5 Flash گوگل پشتیبانی میشود، قادر است به سوالات کاربران در قالب ۱۰ صدای مختلف پاسخ دهد. کاربران میتوانند از این دستیار برای مدیریت لیستهای خرید، یا خلاصهسازی ایمیلهای دریافتی استفاده کنند.Sissie Hsiao ، مدیر کل گوگل در مورد تجربه کاری با Gemini و دستیار گوگل، اعلام کرد که این دستیار در حال تکامل است تا سطح جدیدی از کمک را ارائه دهد و تعاملاتی طبیعیتر و مکالمهایتر ایجاد کند.
قابلیت جدید گوگل به کاربران اجازه میدهد هنگام استفاده از سایر اپلیکیشنها و حتی زمانی که گوشی قفل است، با دستیار صوتی ارتباط برقرار کنند، مشابه یک تماس تلفنی معمولی. Gemini Live در حال حاضر به زبان انگلیسی و برای مشترکین Gemini Advanced در دستگاههای اندرویدی قابل دسترس است و در هفتههای آینده برای iOS و زبانهای بیشتر ارائه خواهد شد. اشتراک Gemini Advanced یک ماه زمان آزمایشی رایگان دارد و پس از آن ماهانه ۲۰ دلار هزینه خواهد داشت. علاوه بر قابلیتهای صوتی، مشترکین به مدل Gemini 1.5 Pro نیز دسترسی دارند که قابلیت پردازش دادههای حجیم را دارد. همچنین این اشتراک امکاناتی مانند فضای ذخیرهسازی بیشتر، دسترسی به Gemini در اپلیکیشنهای Workspace و قابلیت آپلود فایلها برای تعامل با چتبات را فراهم میکند.
گوگل در حال گسترش قابلیتهای Gemini Live است که شامل سازگاری با اپلیکیشنهای دیگر گوگل مانند YouTube Music میشود، جایی که کاربران میتوانند با دستورات صوتی لیست پخش ایجاد کنند. همچنین، قابلیت پشتیبانی از تقویم نیز به زودی اضافه میشود، تا چتبات بتواند با اپلیکیشن تقویم کاربران تعامل داشته باشد و یادآوریهای مربوط به رویدادهای آینده را تنظیم کند. گوگل برنامه دارد تا سرعت و کیفیت پاسخهای Live را نیز بهبود بخشد. مدل پایه Gemini 1.5 Flash که در رویداد Google I/O معرفی شد، با وجود اینکه از مدل پیشرفته 1.5 Pro کوچکتر است، همچنان توانایی پردازش ورودیهای حجیم را داراست. قابلیت Gemini Live در حالی معرفی شده که OpenAI نیز در حال بهبود ویژگیهای صوتی ChatGPT است و مدل جدید GPT-4o به طور قابل توجهی عملکرد صوتی چتبات را ارتقا داده است. اگرچه برخی ممکن است گوگل را به کپی کردن از Voice Mode چتبات OpenAI متهم کنند، اما گوگل مدتهاست که روی توسعه این قابلیت کار میکند. Gemini Live بخشی از پروژهای است که با عنوان Project Astra در رویداد I/O در ماه مه معرفی شد.
منبع خبر: AI Business
پاسخ :