
یک تیم تحقیقاتی هوش مصنوعی از دانشگاه کارنگی ملون مدلی به نام LegoGPT طراحی کردهاند که میتواند تنها با دریافت ورودی متنی، طرحهای معتبر و قابل ساخت LEGO تولید کند. این مدل بر پایه یک زبانمدل بزرگ خودرگرسیو (autoregressive) توسعه یافته است که با پیشبینی آجر بعدی، طراحی را گامبهگام انجام میدهد. نکته مهم این است که LegoGPT میتواند از صفر، طراحیهای کاملاً جدید و منحصربهفرد ایجاد کند. مدل با استفاده از دیتاستی به نام StableText2Lego آموزش دیده که شامل بیش از ۴۷ هزار ساختار LEGO با بیش از ۲۸ هزار شی سهبعدی منحصربهفرد مانند صندلی، میز، ماشین، کشتی، کتابخانه، گیتار و غیره بوده است. این دادهها در یک شبکه مکعبی ۲۰x۲۰x۲۰ به شکل وُکسلبندی (voxel grid) شدهاند تا چیدمان اولیه آجرهای لگو ایجاد شود. سپس این چیدمان با حفظ ساختار کلی تغییر داده شده و طرحهای ناپایدار حذف شدهاند. نمونههای باقیمانده از ۲۴ زاویه مختلف رندر و سپس توسط مدل GPT-4o توصیف متنی شدهاند.
فرآیند طراحی به این صورت است که LegoGPT ابتدا متن ورودی را به یک طرح لگو تبدیل میکند. سپس این طرح به توکنهای متنی از پایین به بالا تقسیم میشود و هر آجر با توضیحاتی همراه میشود که رابطه بین متن و ساختار فیزیکی را برای مدل روشن میکند. در ادامه، مدل آجر بعدی را بهصورت مرحلهای و با بررسی صحت، موجود بودن در کتابخانه و نداشتن تداخل با آجرهای قبلی، پیشبینی میکند. این روند تا کامل شدن طراحی ادامه پیدا میکند. نکته مهم دیگر، بررسی پایداری طرح است؛ در صورت شناسایی طرح ناپایدار (مثلاً آجرهای معلق یا تداخلدار)، مدل به آخرین نقطه پایدار بازمیگردد و از آنجا طراحی را ادامه میدهد. در نهایت، خروجی نهایی طرحی پایدار و واقعی است که هم انسان و هم ربات میتوانند آن را بسازند.
از دیگر امکانات کاربردی این مدل، امکان ترکیب آن با مدلهای بینایی کامپیوتر است. بهعنوان مثال، با گرفتن عکس از آجرهای لگوی موجود، این هوش مصنوعی میتواند طرحهای متنوع و قابل ساخت بر اساس قطعات در دسترس ارائه دهد. دیتاست، کدها و مدل LegoGPT به صورت رایگان در GitHub منتشر شدهاند. بنابراین، علاقهمندان و توسعهدهندگان میتوانند آن را فورک کرده یا حتی آن را به یک اپلیکیشن قابل دانلود با کتابخانه آجرهای قابل تنظیم تبدیل کنند. این پروژه نه تنها از نظر فنی جالب است، بلکه نشاندهنده کاربرد نوآورانه هوش مصنوعی در طراحی فیزیکی و دنیای اسباببازیهاست. LegoGPT میتواند مسیر را برای ابزارهای تعاملی بیشتر در حوزه طراحی، آموزش و سرگرمی باز کند.
منبع خبر: tomshardware
پاسخ :