
گوگل بهصورت رسمی از مدل هوش مصنوعی Nano Banana Pro یا همان Gemini 3 Pro Image رونمایی کرد؛ نسخه ارتقایافته و حرفهای مدل Nano Banana که چند ماه پیش برای ویرایش و تولید تصاویر معرفی شده بود. این نسخه جدید با تکیه بر توان پردازشی و استدلالی Gemini 3 Pro طراحی شده و هدف آن ارائه دقیقترین، واقعیترین و هوشمندترین تجربه تولید و ویرایش تصویر برای کاربران عادی، طراحان، کسبوکارها و توسعهدهندگان است.
قدرت استدلالی و بصری نسل جدید
Nano Banana Pro فقط یک مدل تصویرساز نیست؛ بلکه ابزاری است که با استفاده از دانش جهانی، اطلاعات لحظهای و تحلیل پیشرفته میتواند ایدهها را با دقت بیشتری به تصویر تبدیل کند. این مدل میتواند بر اساس دادههای واقعی، تصاویر آموزشی، اینفوگرافیکها و نمودارهایی تولید کند که نهتنها جذاب هستند، بلکه از نظر اطلاعاتی دقیق و قابل استناد محسوب میشوند. اتصال مستقیم این مدل به Google Search باعث شده بتواند اطلاعات لحظهای مانند آبوهوا، نتایج ورزشی یا حتی خلاصه دستور پخت یک غذا را بهسرعت به تصویر بکشد.
تولید متن دقیق و خوانا داخل تصویر
یکی از بزرگترین پیشرفتهای Nano Banana Pro توانایی بینقص در تولید متن دقیق، خوانا و بدون خطا درون تصویر است. این ویژگی که همیشه یکی از چالشهای مدلهای تصویرساز بوده، اکنون با کمک Gemini 3 Pro بهبود زیادی پیدا کرده است. کاربران میتوانند متنهای طولانی، فونتهای متنوع، بافتهای گرافیکی، و حتی خطاطیهای چندزبانه را مستقیم در تصاویر خود قرار دهند. این قابلیت برای ساخت پوستر، جلد کتاب، موکاپهای تبلیغاتی و تصاویر رسانهای بسیار کاربردی است.

کیفیت خلاقانه و امکانات پیشرفته
گوگل در Nano Banana Pro امکان ترکیب تا ۱۴ تصویر و حفظ شباهت تا ۵ چهره مختلف را فراهم کرده است؛ ویژگیای که برای طراحان و برندها اهمیت زیادی دارد. این مدل میتواند از روی طرحها، اسکچها و نقشههای اولیه، تصاویر سهبعدی دقیق و شبیهسازیشده بسازد. پیشرفت مهم دیگر، کنترلهای حرفهای ویرایش است. کاربران اکنون میتوانند بخشهای دلخواه تصویر را انتخاب و ویرایش کنند، زاویه دوربین را تغییر دهند، فوکوس را جابهجا کنند، نورپردازی صحنه را اصلاح کنند یا حتی آن را از روز به شب تبدیل کنند. پشتیبانی از خروجیهای ۲K و ۴K نیز باعث میشود تصاویر نهایی برای چاپ و استفاده حرفهای کاملاً مناسب باشند.
دسترسی کاربران به Nano Banana Pro
گوگل این مدل را در سرویسهای مختلف خود در دسترس قرار داده است:
• کاربران عادی: در اپلیکیشن Gemini و بخش Create Images با مدل Thinking. کاربران رایگان سهمیه محدود دارند و سپس به نسخه معمولی برمیگردند.
• گوگل AI Plus، Pro و Ultra: سهمیه بیشتر و دسترسی گستردهتر.
• تبلیغکنندگان و کسبوکارها: مدل Nano Banana Pro به Google Ads اضافه شده است.
• Workspace (Slides و Vids): امکان تولید تصاویر با کیفیت برای ارائهها و ویدئوها.
• توسعهدهندگان: از طریق Gemini API، Google AI Studio و Vertex AI قابل استفاده است.
• فیلمسازان: مشترکان Google AI Ultra در ابزار Flow میتوانند فریمها و صحنهها را با دقت بالا طراحی کنند.

شناسایی تصاویر تولیدشده با گوگل
تمام تصاویر ساختهشده با ابزارهای گوگل با فناوری SynthID واترمارک دیجیتال نامحسوس دارند. کاربران حتی میتوانند با آپلود یک تصویر در Gemini تشخیص دهند که آیا توسط گوگل تولید شده است یا نه. علاوه بر آن، برای کاربران رایگان و Pro، یک واترمارک قابلمشاهده نیز روی تصویر قرار میگیرد، اما کاربران Ultra میتوانند تصاویر بدون علامت ظاهری دریافت کنند.
منبع خبر: blog.google

شاهین آقامعلی


پاسخ :