
Stanford's Spellburst یک مدل زبان بزرگ است که تصاویر را از متن تولید میکند که کد آن برای تنظیم دقیقتر تصویر قابل ویرایش است.
محققان دانشگاه استنفورد از Spellburst، یک مدل زبان بزرگ جدید پرده برداری کردند که تصاویر تولید شده را میتوان با اصلاح خطوط کد ویرایش کرد.Spellburst به هنرمندان اجازه میدهد تا یک درخواست اولیه زبان طبیعی را وارد کنند و پس از تولید تصویر، کد خروجی را ویرایش کنند تا خروجیهای دقیقتری ایجاد کنند. این ابزار به طور مؤثر به کاربران امکان تنظیم دقیق برای تولید تصویر را میدهد. کاربران Spellburt میتوانند از فرمان مثل «تصویر شیشهای رنگآمیزی از یک دسته گل زیبا و درخشان» استفاده کنند و اگر گلها موجود در تصویر تولید شده خیلی صورتی بودند یا شیشه رنگی رنگ مناسبی نداشت، پنلی از تنظیمات برای ایجاد تغییرات روی تصویر باز میشود و به کاربر اجازه تنظیم دقیق تصویر تولید شده را میدهد. کاربران حتی میتوانند نسخههای مختلف خروجیها را ادغام کنند. تیم در استنفورد پس از مصاحبه با تعدادی از هنرمندان دیجیتال که نگرانیهای در رابطه با عمومی شدن این نوع مدلهای هوش مصنوعی مولد تصویر داشتند، این مدل را ساختند. تیم استنفورد گفت Spellburst میتواند فرایند زمانبر و دشوار هنر کدنویسی را سرعت بخشد.Hariharan Subramonyam ، استادیار دانشکده تحصیلات تکمیلی آموزش و عضو هیئت علمی مؤسسه Stanford Human-Centred AI در یک پست وبلاگی گفت: یک مدل زبان بزرگ میتواند نقطه شروع خوبی به شما بدهد. اما وقتی هنرمند میخواهد بافتها، رنگها یا الگوهای مختلف را کشف کند، در آن مرحله کنترل دقیقتری میخواهد، که مدلهای زبان بزرگ نمیتوانند آن را فراهم کنند.
Spellburst اساساً به هنرمندان کمک میکند تا به طور یکپارچه بین فضای مفهومی و کد جابهجا شوند. هنگام ساخت Spellburst، محققان استنفورد با کدنویسان خلاق در مورد چگونگی توسعه مفاهیم، گردش کار خلاق و چالشهای خود مصاحبه کردند. هنرمندان مولد خبره بعداً مجاز به آزمایش Spellburst شدند. سابرامونیام گفت: بازخورد در کل بسیار مثبت بود. مدل زبان بزرگ به هنرمندان کمک میکند تا از فضای معنایی به کدنویسی سریعتر منقل شوند و تصاویر مد نظر خود را بیافرینند، اما همچنین به آنها کمک میکند تا تنوعهای مختلف را کشف کنند و خلاقانهتر عمل کنند. البته Spellburst هم محدودیتهای خود را دارد، همیشه درخواستها را درست دریافت نمیکند و در برخی موارد ادغام نسخهها باعث ایجاد مشکلاتی میشود. تیم پشتیبان این مدل خاطرنشان کرد که استفاده استنفورد از نمونه کوچکی از هنرمندانی که بازخورد ارائه میکنند علاقه جامعه هنرمندان به این نوع مدلهای هوش مصنوعی را نشان میدهد. استنفورد در حال حاضر در حال برنامه ریزی برای راه اندازی این ابزار به عنوان منبع باز "در اواخر سال جاری" است.
پاسخ :