ویرایش تصاویر تولید شده هوش مصنوعی از طریق کد

...

Stanford's Spellburst یک مدل زبان بزرگ است که تصاویر را از متن تولید می‌کند که کد آن برای تنظیم دقیق‌تر تصویر قابل ویرایش است.

محققان دانشگاه استنفورد از Spellburst، یک مدل زبان بزرگ جدید پرده برداری کردند که تصاویر تولید شده را می‌توان با اصلاح خطوط کد ویرایش کرد.Spellburst  به هنرمندان اجازه می‌دهد تا یک درخواست اولیه زبان طبیعی را وارد کنند و پس از تولید تصویر، کد خروجی را ویرایش کنند تا خروجی‌های دقیق‌تری ایجاد کنند. این ابزار به طور مؤثر به کاربران امکان تنظیم دقیق برای تولید تصویر را می‌دهد. کاربران Spellburt می‌توانند از فرمان مثل «تصویر شیشه‌ای رنگ‌آمیزی از یک دسته گل زیبا و درخشان» استفاده کنند و اگر گل‌ها موجود در تصویر تولید شده خیلی صورتی بودند یا شیشه رنگی رنگ مناسبی نداشت، پنلی از تنظیمات برای ایجاد تغییرات روی تصویر باز می‌شود و به کاربر اجازه تنظیم دقیق تصویر تولید شده را می‌دهد. کاربران حتی می‌توانند نسخه‌های مختلف خروجی‌ها را ادغام کنند. تیم در استنفورد پس از مصاحبه با تعدادی از هنرمندان دیجیتال که نگرانی‌های در رابطه با عمومی شدن این نوع مدل‌های هوش مصنوعی مولد تصویر داشتند، این مدل را ساختند. تیم استنفورد گفت Spellburst می‌تواند فرایند زمان‌بر و دشوار هنر کدنویسی را سرعت بخشد.Hariharan Subramonyam ، استادیار دانشکده تحصیلات تکمیلی آموزش و عضو هیئت علمی مؤسسه Stanford Human-Centred AI در یک پست وبلاگی گفت: یک مدل زبان بزرگ می‌تواند نقطه شروع خوبی به شما بدهد. اما وقتی هنرمند می‌خواهد بافت‌ها، رنگ‌ها یا الگوهای مختلف را کشف کند، در آن مرحله کنترل دقیق‌تری می‌خواهد، که مدل‌های زبان بزرگ نمی‌توانند آن را فراهم کنند. 

editing-images-generated-by-AI-through-code

Spellburst اساساً به هنرمندان کمک می‌کند تا به طور یکپارچه بین فضای مفهومی و کد جابه‌جا شوند. هنگام ساخت Spellburst، محققان استنفورد با کدنویسان خلاق در مورد چگونگی توسعه مفاهیم، گردش کار خلاق و چالش‌های خود مصاحبه کردند. هنرمندان مولد خبره بعداً مجاز به آزمایش Spellburst شدند. سابرامونیام گفت: بازخورد در کل بسیار مثبت بود. مدل زبان بزرگ به هنرمندان کمک می‌کند تا از فضای معنایی به کدنویسی سریع‌تر منقل شوند و تصاویر مد نظر خود را بیافرینند، اما همچنین به آنها کمک می‌کند تا تنوع‌های مختلف را کشف کنند و خلاقانه‌تر عمل کنند. البته  Spellburst هم محدودیت‌های خود را دارد، همیشه درخواست‌ها را درست دریافت نمی‌کند و در برخی موارد ادغام نسخه‌ها باعث ایجاد مشکلاتی می‌شود. تیم پشتیبان این مدل خاطرنشان کرد که استفاده استنفورد از نمونه کوچکی از هنرمندانی که بازخورد ارائه می‌کنند علاقه جامعه هنرمندان به این نوع مدل‌های هوش مصنوعی را نشان می‌دهد. استنفورد در حال حاضر در حال برنامه ریزی برای راه اندازی این ابزار به عنوان منبع باز "در اواخر سال جاری" است. 
 

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟