
گوگل بهتازگی نسخه جدید مدل تصویری خود، Gemini 2.5 Flash Image را در اپلیکیشن Gemini معرفی کرده است. این نسخه که در مرحله آزمایشی با نام رمز Nano Banana شناخته میشد، اکنون به عنوان یکی از بزرگترین بهروزرسانیهای هوش مصنوعی مولد گوگل معرفی شده و تمرکز اصلی آن بر ویرایش دقیق، ترکیب خلاقانه و حفظ هماهنگی در تصاویر تولیدی است. تا پیش از این، ابزارهای تولید تصویر با هوش مصنوعی در زمینه ویرایش با مشکلاتی مواجه بودند؛ تغییرات ناهماهنگ، ویرایش اشتباه بخشهای تصویر یا اجرای ناقص دستورات از جمله این چالشها بود. اما گوگل اعلام کرده که Gemini 2.5 Flash Image توانسته با بهرهگیری از «دانش جهانی» خود، این محدودیتها را تا حد زیادی برطرف کند.
با این بهروزرسانی، کاربران میتوانند چند تصویر را با هم ترکیب کنند، شخصیتها و عناصر را در تصاویر مختلف حفظ کنند و ویرایشهای دقیق را تنها با چند دستور متنی ساده انجام دهند. به عبارت دیگر، Gemini اکنون همانند یک «کارشناس فتوشاپ لحظهای» عمل میکند. برای شروع کار در نسخه وب Gemini، کافی است روی آیکون ابزارها در نوار ورودی کلیک کرده و گزینه «Create images» را انتخاب کنید. سپس میتوانید تصویر مورد نظر خود را بارگذاری کرده و از طریق دستورهای متنی تغییرات دلخواه را اعمال کنید.
به عنوان مثال، اگر بخواهید رنگ لباس فردی را عوض کنید، کافی است بنویسید:
«رنگ پلیور را به قرمز تغییر بده»
یا اگر بخواهید پسزمینه تصویر را تار کنید یا جسمی را حذف کنید، میتوانید با عباراتی ساده مانند
«پسزمینه را محو کن»
یا
«چراغ روی میز را حذف کن»
به نتیجه دلخواه برسید.
قابلیت ترکیب تصاویر نیز از نقاط قوت نسخه جدید است. کاربران میتوانند با انتخاب دو یا چند عکس، تصویری واحد و منسجم ایجاد کنند. برای مثال، میتوانید تصویری از خودتان و تصویری از لباس مورد علاقهتان را ترکیب کنید تا Gemini تصویری از شما با آن لباس بسازد. یا میتوانید حیوانات خانگیتان را در یک تصویر مشترک قرار دهید، بدون اینکه چهره یا ظاهرشان تغییر کند. همچنین Gemini 2.5 امکان افزودن یا حذف اشیا از صحنه را فراهم کرده است. میتوانید از آن بخواهید تا «فرد سمت راست را حذف کرده و پسزمینه را پر کند» یا «یک اتوبوس زرد در پسزمینه اضافه کند». این قابلیتها نشان میدهد که گوگل در تلاش است هوش مصنوعی خود را از تولید صرف به سمت ویرایش هوشمند و خلاقانه سوق دهد.
گوگل البته یادآور شده که اطلاعات واردشده در Gemini، از جمله تصاویر و گفتگوها، ممکن است برای بهبود مدلهای هوش مصنوعی مورد استفاده قرار گیرند. کاربران میتوانند با غیرفعال کردن بخش Activity در تنظیمات، از ذخیره دادههای خود جلوگیری کنند. در مجموع، نسخه جدید Gemini 2.5 Flash Image گامی بزرگ در جهت ویرایش بصری دقیق و شخصیسازیشده با کمک هوش مصنوعی است—گامی که میتواند آینده ابزارهای گرافیکی را برای همیشه تغییر دهد.
منبع خبر: popsci
پاسخ :