
گوگل و دیپمایند با معرفی Gemini 3 وارد مرحلهای تازه از تکامل هوش مصنوعی شدند و به گفته مدیران این شرکت، این مدل جدید بزرگترین جهش گوگل در مسیر رسیدن به AGI محسوب میشود. ساندار پیچای در پیام رسمی خود اعلام کرد که از زمان آغاز عصر Gemini کمتر از دو سال گذشته و در همین مدت این خانواده مدلها توانستهاند به هستهای اصلی در اکوسیستم محصولات گوگل تبدیل شوند. اکنون بیش از دو میلیارد نفر هر ماه از AI Overviews در جستجو استفاده میکنند، اپلیکیشن Gemini بیش از ۶۵۰ میلیون کاربر ماهانه دارد و بیش از هفتاد درصد مشتریان گوگل کلاد از سرویسهای هوش مصنوعی آن بهره میبرند. همچنین تاکنون ۱۳ میلیون توسعهدهنده اپلیکیشنها و ابزارهای مختلف را بر پایه مدلهای Gemini ساختهاند. پیچای با تأکید بر اینکه رویکرد فولاستک گوگل—از زیرساخت سختافزاری تا مدلها و محصولات علت اصلی سرعت بالای پیشرفت این مجموعه است، اعلام کرد Gemini 3 از امروز در مقیاس جهانی و در محصولات کلیدی گوگل ارائه میشود.
Gemini 3 ادامه مسیر نسلهای پیشین خود است، اما با قدرت استدلال بسیار عمیقتر، تواناییهای چندرسانهای پیشرفتهتر و درکی دقیقتر از نیت و زمینه درخواست کاربران. جایی که Gemini 1 مفهوم چندرسانهای بودن و ویندوی متنی طولانی را متحول کرد و Gemini 2 قابلیتهای عاملمحور و تواناییهای استدلالی را گسترش داد، اکنون Gemini 3 تمام این ویژگیها را در قالب نسلی جدید و یکپارچه ارائه میکند؛ مدلی که به گفته گوگل، به معنای واقعی «اتاق را میخواند» و میتواند مقصود پشت درخواستها را بهتر از هر مدل قبلی درک کند.

در بخش فنی، Gemini 3 Pro توانسته است در تمام معیارهای مهم هوش مصنوعی نسبت به نسخه قبلی، یعنی 2.5 Pro، برتری چشمگیری کسب کند. این مدل با کسب امتیاز ۱۵۰۱ Elo در رتبه نخست LMArena قرار گرفته و در آزمونهای علمی سطح دکتری مانند GPQA Diamond به امتیاز ۹۱.۹ درصد دست یافته است؛ رقمی که نشاندهنده توان استدلال بسیار بالای این مدل است. در Humanity’s Last Exam نیز عملکرد قابلتوجهی ثبت شده که بار دیگر قدرت تحلیل مفاهیم پیچیده را ثابت میکند. Gemini 3 Pro در حوزه ریاضیات نیز رکورد جدیدی در MathArena Apex با امتیاز ۲۳.۴ درصد به جا گذاشته است. در بخش چندرسانهای، این مدل با دستیابی به امتیازهای ۸۱ درصد در MMMU-Pro و ۸۷.۶ درصد در Video-MMMU توانسته قدرت تحلیل تصاویر و ویدیو را در سطحی بیسابقه ارائه دهد. همچنین امتیاز ۷۲.۱ درصد در SimpleQA Verified نشاندهنده افزایش دقت حقایق و قابلیت اتکا در پاسخهاست؛ موضوعی که برای استفاده عمومی اهمیت حیاتی دارد.
در کنار نسخه اصلی، گوگل حالت جدیدی به نام Gemini 3 Deep Think را نیز معرفی کرده است که توان استدلال و تفکر پلهبهپله مدل را به میزان قابلتوجهی افزایش میدهد. این نسخه در ARC-AGI-2 با امتیاز ۴۵.۱ درصد عملکرد استثنایی داشته و در مقایسه با نسخه اصلی نیز نتایج قویتری در Humanity’s Last Exam و GPQA Diamond ثبت کرده است. گوگل اعلام کرده که این حالت در ابتدا تنها در اختیار ارزیابان ایمنی قرار میگیرد و پس از تکمیل ارزیابیها برای کاربران Ultra عرضه خواهد شد.
Gemini 3 با داشتن پشتیبانی از ورودیهای چندرسانهای و پنجره متنی یک میلیون توکن، امکان یادگیری از هر نوع محتوا را فراهم میکند. این مدل میتواند مقالههای علمی طولانی، ویدیوهای آموزشی چندساعته، تصاویر، نمودارها، دستنوشتهها و حتی کد را تحلیل کرده و از آنها محتوای آموزشی مناسب مانند فلشکارت، شبیهسازی یا نمودارهای تعاملی بسازد. همچنین قابلیت تحلیل ویدیوهای عملکردی، مانند بازیهای ورزشی و آموزشهای تکنیکی، و ارائه پیشنهادهای حرفهای برای بهبود عملکرد نیز در Gemini 3 تقویت شده است. علاوه بر این، جستجوی گوگل از امروز از Gemini 3 برای ایجاد تجربههای بصری و تعاملی جدید استفاده میکند؛ تجربههایی که شامل شبیهسازیهای زنده، چیدمانهای پویا و پاسخهای تصویری تولیدشده در لحظه میشود.

یکی از بزرگترین بخشهای معرفی Gemini 3 مربوط به توسعهدهندگان است. گوگل همزمان با معرفی این مدل، پلتفرم جدیدی به نام Google Antigravity را رونمایی کرده است؛ محیط توسعهای که بر پایه عاملهای هوشمند طراحی شده و میتواند بخش بزرگی از فرایند توسعه نرمافزار را خودکار کند. در این پلتفرم عاملها دسترسی کامل به ادیتور، ترمینال و مرورگر دارند و قادرند پروژهها را از برنامهریزی تا اجرا و تست به صورت مستقل انجام دهند. Gemini 3 در آزمونهای مربوط به توسعه و کدنویسی نیز عملکرد قابلتوجهی داشته؛ از جمله کسب امتیاز ۱۴۸۷ در WebDev Arena، امتیاز ۵۴.۲ درصد در Terminal-Bench و امتیاز ۷۶.۲ درصد در SWE-bench Verified. این نتایج نشان میدهد که Gemini 3 در زمینه «agentic coding» پیشرفتهترین مدل حال حاضر جهان است.
در بخش تواناییهای عاملمحور، Gemini 3 در آزمون Vending-Bench 2 رتبه اول را کسب کرده که نشاندهنده ظرفیت بالای آن در مدیریت وظایف بلندمدت و چندمرحلهای است. این قابلیت باعث میشود مدل بتواند وظایفی مانند رزرو سرویسها، مدیریت ایمیل، تنظیم برنامهها و اجرای فرایندهای پیچیده را با دقت بالا و تحت نظارت کاربر انجام دهد. گوگل اعلام کرده کاربران اشتراک Ultra از امروز میتوانند از Gemini Agent در اپ Gemini استفاده کنند و این قابلیت بهزودی به سایر محصولات نیز گسترش خواهد یافت.
در نهایت، گوگل تأکید کرده Gemini 3 امنترین مدل تاریخ این شرکت است و از نظر مقاومت در برابر دستکاری، حملات سایبری و خطاهای رفتاری پیشرفت چشمگیری داشته است. این مدل تحت ارزیابی شرکتهای امنیتی معتبر و سازمانهای تخصصی مستقل نیز قرار گرفته است. گوگل اعلام کرده که تنها آغاز عصر Gemini 3 است و بهزودی نسخههای جدیدتر و تکمیلی این سری منتشر خواهد شد.
منبع خبر: blog.google

شاهین آقامعلی


پاسخ :