
محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) به همراه مؤسسه تحقیقاتی تویوتا (Toyota Research Institute) از یک ابزار نوآورانه مبتنی بر هوش مصنوعی مولد (Generative AI) رونمایی کردند که میتواند بهصورت خودکار صحنههای مجازی واقعگرایانه برای آموزش رباتها ایجاد کند. این فناوری با نام Steerable Scene Generation شناخته میشود و به رباتها کمک میکند در محیطهای شبیهسازیشده مانند آشپزخانه، رستوران یا اتاق نشیمن، وظایف واقعی را بهتر یاد بگیرند. این سیستم با بهرهگیری از یک پایگاه داده عظیم شامل بیش از ۴۴ میلیون صحنه سهبعدی (3D) آموزش دیده است و قابلیت هدایت یا "استیربل" دارد؛ یعنی مهندسان میتوانند جهت تولید صحنهها را بر اساس نیازهای خاص خود تنظیم کنند. برای مثال، میتوان صحنههایی با واقعگرایی بیشتر یا تعداد اشیای بیشتر تولید کرد.
مبنای عملکرد این ابزار بر الگوریتمی پیشرفته به نام Monte Carlo Tree Search (MCTS) استوار است. این الگوریتم به هوش مصنوعی کمک میکند تا در هر مرحله از تولید صحنه، تصمیمهای بهینه بگیرد و صحنهها را به مرور پیچیدهتر و کاملتر سازد. در واقع، فرایند تولید صحنه بهصورت تصمیمگیری متوالی (Sequential Decision Making) طراحی شده است. به گفتهی نیکلاس پفَف (Nicholas Pfaff)، پژوهشگر MIT و یکی از اعضای اصلی پروژه، این نخستین بار است که از روش MCTS برای تولید صحنه استفاده میشود. او میگوید: «ما صحنهها را بهصورت تدریجی میسازیم تا به مرور زمان به محیطهایی برسیم که واقعیتر و کاربردیتر از دادههای اولیه مدل هستند.»
کارشناسان صنعت رباتیک این پروژه را گامی بزرگ در مسیر آموزش مؤثرتر رباتها میدانند. جرمی بیناگیا از شرکت Amazon Robotics تأکید کرده است که این فناوری میتواند کمبود دادههای باکیفیت را در آموزش رباتها جبران کند و تولید صحنههای فیزیکی ممکن و واقعی را تضمین نماید. تیم MIT و تویوتا قصد دارند در نسخههای آینده این پروژه، تعداد اشیاء، محیطها و جزئیات را افزایش دهند تا رباتها بتوانند در محیطهای متنوعتر آموزش ببینند. هدف نهایی این پروژه ایجاد یک جامعه کاربری گسترده است که دادههای آموزشی متنوعی برای ارتقای تواناییهای رباتها تولید کنند. به گفتهی پژوهشگران، ترکیب هوش مصنوعی مولد، یادگیری تقویتی و مدلسازی سهبعدی میتواند آیندهی آموزش رباتها را متحول کند و مرزهای یادگیری ماشینی را گسترش دهد.
منبع خبر: aibusiness
پاسخ :