عصر جدیدی از هوش با Gemini 3

...

گوگل و دیپ‌مایند با معرفی Gemini 3 وارد مرحله‌ای تازه از تکامل هوش مصنوعی شدند و به گفته مدیران این شرکت، این مدل جدید بزرگ‌ترین جهش گوگل در مسیر رسیدن به AGI محسوب می‌شود. ساندار پیچای در پیام رسمی خود اعلام کرد که از زمان آغاز عصر Gemini کمتر از دو سال گذشته و در همین مدت این خانواده مدل‌ها توانسته‌اند به هسته‌ای اصلی در اکوسیستم محصولات گوگل تبدیل شوند. اکنون بیش از دو میلیارد نفر هر ماه از AI Overviews در جستجو استفاده می‌کنند، اپلیکیشن Gemini بیش از ۶۵۰ میلیون کاربر ماهانه دارد و بیش از هفتاد درصد مشتریان گوگل کلاد از سرویس‌های هوش مصنوعی آن بهره می‌برند. همچنین تاکنون ۱۳ میلیون توسعه‌دهنده اپلیکیشن‌ها و ابزارهای مختلف را بر پایه مدل‌های Gemini ساخته‌اند. پیچای با تأکید بر اینکه رویکرد فول‌استک گوگل—از زیرساخت سخت‌افزاری تا مدل‌ها و محصولات علت اصلی سرعت بالای پیشرفت این مجموعه است، اعلام کرد Gemini 3 از امروز در مقیاس جهانی و در محصولات کلیدی گوگل ارائه می‌شود.

Gemini 3 ادامه مسیر نسل‌های پیشین خود است، اما با قدرت استدلال بسیار عمیق‌تر، توانایی‌های چندرسانه‌ای پیشرفته‌تر و درکی دقیق‌تر از نیت و زمینه درخواست کاربران. جایی که Gemini 1 مفهوم چندرسانه‌ای بودن و ویندوی متنی طولانی را متحول کرد و Gemini 2 قابلیت‌های عامل‌محور و توانایی‌های استدلالی را گسترش داد، اکنون Gemini 3 تمام این ویژگی‌ها را در قالب نسلی جدید و یکپارچه ارائه می‌کند؛ مدلی که به گفته گوگل، به معنای واقعی «اتاق را می‌خواند» و می‌تواند مقصود پشت درخواست‌ها را بهتر از هر مدل قبلی درک کند.

 

هوش مصنوعی Gemini 3

 

در بخش فنی، Gemini 3 Pro توانسته است در تمام معیارهای مهم هوش مصنوعی نسبت به نسخه قبلی، یعنی 2.5 Pro، برتری چشمگیری کسب کند. این مدل با کسب امتیاز ۱۵۰۱ Elo در رتبه نخست LMArena قرار گرفته و در آزمون‌های علمی سطح دکتری مانند GPQA Diamond به امتیاز ۹۱.۹ درصد دست یافته است؛ رقمی که نشان‌دهنده توان استدلال بسیار بالای این مدل است. در Humanity’s Last Exam نیز عملکرد قابل‌توجهی ثبت شده که بار دیگر قدرت تحلیل مفاهیم پیچیده را ثابت می‌کند. Gemini 3 Pro در حوزه ریاضیات نیز رکورد جدیدی در MathArena Apex با امتیاز ۲۳.۴ درصد به جا گذاشته است. در بخش چندرسانه‌ای، این مدل با دستیابی به امتیازهای ۸۱ درصد در MMMU-Pro و ۸۷.۶ درصد در Video-MMMU توانسته قدرت تحلیل تصاویر و ویدیو را در سطحی بی‌سابقه ارائه دهد. همچنین امتیاز ۷۲.۱ درصد در SimpleQA Verified نشان‌دهنده افزایش دقت حقایق و قابلیت اتکا در پاسخ‌هاست؛ موضوعی که برای استفاده عمومی اهمیت حیاتی دارد.

در کنار نسخه اصلی، گوگل حالت جدیدی به نام Gemini 3 Deep Think را نیز معرفی کرده است که توان استدلال و تفکر پله‌به‌پله مدل را به میزان قابل‌توجهی افزایش می‌دهد. این نسخه در ARC-AGI-2 با امتیاز ۴۵.۱ درصد عملکرد استثنایی داشته و در مقایسه با نسخه اصلی نیز نتایج قوی‌تری در Humanity’s Last Exam و GPQA Diamond ثبت کرده است. گوگل اعلام کرده که این حالت در ابتدا تنها در اختیار ارزیابان ایمنی قرار می‌گیرد و پس از تکمیل ارزیابی‌ها برای کاربران Ultra عرضه خواهد شد.

Gemini 3 با داشتن پشتیبانی از ورودی‌های چندرسانه‌ای و پنجره متنی یک میلیون توکن، امکان یادگیری از هر نوع محتوا را فراهم می‌کند. این مدل می‌تواند مقاله‌های علمی طولانی، ویدیوهای آموزشی چندساعته، تصاویر، نمودارها، دست‌نوشته‌ها و حتی کد را تحلیل کرده و از آن‌ها محتوای آموزشی مناسب مانند فلش‌کارت، شبیه‌سازی یا نمودارهای تعاملی بسازد. همچنین قابلیت تحلیل ویدیوهای عملکردی، مانند بازی‌های ورزشی و آموزش‌های تکنیکی، و ارائه پیشنهادهای حرفه‌ای برای بهبود عملکرد نیز در Gemini 3 تقویت شده است. علاوه بر این، جستجوی گوگل از امروز از Gemini 3 برای ایجاد تجربه‌های بصری و تعاملی جدید استفاده می‌کند؛ تجربه‌هایی که شامل شبیه‌سازی‌های زنده، چیدمان‌های پویا و پاسخ‌های تصویری تولیدشده در لحظه می‌شود.

 

هوش مصنوعی Gemini 3

 

یکی از بزرگ‌ترین بخش‌های معرفی Gemini 3 مربوط به توسعه‌دهندگان است. گوگل هم‌زمان با معرفی این مدل، پلتفرم جدیدی به نام Google Antigravity را رونمایی کرده است؛ محیط توسعه‌ای که بر پایه عامل‌های هوشمند طراحی شده و می‌تواند بخش بزرگی از فرایند توسعه نرم‌افزار را خودکار کند. در این پلتفرم عامل‌ها دسترسی کامل به ادیتور، ترمینال و مرورگر دارند و قادرند پروژه‌ها را از برنامه‌ریزی تا اجرا و تست به صورت مستقل انجام دهند. Gemini 3 در آزمون‌های مربوط به توسعه و کدنویسی نیز عملکرد قابل‌توجهی داشته؛ از جمله کسب امتیاز ۱۴۸۷ در WebDev Arena، امتیاز ۵۴.۲ درصد در Terminal-Bench و امتیاز ۷۶.۲ درصد در SWE-bench Verified. این نتایج نشان می‌دهد که Gemini 3 در زمینه «agentic coding» پیشرفته‌ترین مدل حال حاضر جهان است.

در بخش توانایی‌های عامل‌محور، Gemini 3 در آزمون Vending-Bench 2 رتبه اول را کسب کرده که نشان‌دهنده ظرفیت بالای آن در مدیریت وظایف بلندمدت و چندمرحله‌ای است. این قابلیت باعث می‌شود مدل بتواند وظایفی مانند رزرو سرویس‌ها، مدیریت ایمیل، تنظیم برنامه‌ها و اجرای فرایندهای پیچیده را با دقت بالا و تحت نظارت کاربر انجام دهد. گوگل اعلام کرده کاربران اشتراک Ultra از امروز می‌توانند از Gemini Agent در اپ Gemini استفاده کنند و این قابلیت به‌زودی به سایر محصولات نیز گسترش خواهد یافت.

در نهایت، گوگل تأکید کرده Gemini 3 امن‌ترین مدل تاریخ این شرکت است و از نظر مقاومت در برابر دستکاری، حملات سایبری و خطاهای رفتاری پیشرفت چشمگیری داشته است. این مدل تحت ارزیابی شرکت‌های امنیتی معتبر و سازمان‌های تخصصی مستقل نیز قرار گرفته است. گوگل اعلام کرده که تنها آغاز عصر Gemini 3 است و به‌زودی نسخه‌های جدیدتر و تکمیلی این سری منتشر خواهد شد.

منبع خبر: blog.google

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟