
مؤسسه غیرانتفاعی هوش مصنوعی Allen Institute for AI (Ai2) نسل جدید مدلهای Olmo 3 را منتشر کرده است؛ مجموعهای کاملاً متنباز که شامل مدلهای Base، Instruct، Think و RLZero میشود. اهمیت این انتشار در زمانی است که تقاضا برای مدلهای کاملاً متنباز، بهویژه برای سازمانهایی که قصد شخصیسازی و فاینتیون مدلها را دارند، بهطور چشمگیری افزایش یافته است. Ai2 با ارائه نسخههای کامل مدلها، شامل وزنها و تمام چکپوینتهای مراحل مختلف آموزش، یک استاندارد جدید از «باز بودن واقعی» ارائه کرده است؛ تفاوتی که آن را از مدلهای بهظاهر متنباز مانند خانواده Llama متمایز میکند.
مدلهای Olmo 3 در چند نسخه عرضه شدهاند. Olmo 3-Base که در دو اندازه 7 میلیارد و 32 میلیارد پارامتر ارائه میشود، برای وظایف عمومی مانند پردازش متن، کدنویسی و مسائل ریاضی طراحی شده است. نسخه Instruct یک مدل 7 میلیارد پارامتری است که برای تعاملات مکالمهای، پاسخدهی دقیق و استفاده از ابزارهای مختلف بهینه شده است و میتواند برای ساخت چتباتها و سیستمهای تعاملی بهکار رود.

یکی از جذابترین نسخهها، مدل Olmo 3-Think است که نخستین مدل تفکری متنباز Ai2 محسوب میشود. این مدل با هدف نمایش «فرایند تفکر» خود طراحی شده است؛ یعنی توضیح میدهد که چگونه به یک جواب رسیده است. این ویژگی برای پژوهشگران، استادان دانشگاه و تیمهایی که روی شفافیت، ارزیابی امنیتی و تحلیل رفتاری مدلها کار میکنند، اهمیت زیادی دارد. این نسخه نیز مانند Base در اندازههای 7B و 32B عرضه شده است.
نسخه دیگر Olmo 3-RLZero است که برای یادگیری تقویتی و بهبود رفتارهای استدلالی پیچیده توسعه یافته است. این نسخه بهطور خاص برای وظایفی طراحی شده که به تصمیمگیری چندمرحلهای، منطق عمیقتر و حل مسائل دشوار نیاز دارند. Ai2 میگوید که این مدل بازتاب تلاش این مؤسسه برای پیشبرد تحقیق در حوزه استدلال هوش مصنوعی است.

یکی از نکات مهم درباره Olmo 3 این است که Ai2 تمام چکپوینتها را ارائه داده است؛ از مدل خام قبل از آموزش گرفته تا میانه آموزش و نسخه نهایی. این اقدام بسیار نادر است و دسترسی پژوهشگران را به روند کامل شکلگیری مدل فراهم میکند. به گفته مارک بکیو، تحلیلگر مؤسسه Omdia، Ai2 همچنان یکی از وفادارترین بازیگران حوزه متنباز است و هر بار استاندارد جدیدی برای «باز بودن واقعی» معرفی میکند. او معتقد است روند صنعت به سمت مدلهایی میرود که قابلیت استدلال قویتر داشته باشند؛ زیرا ظهور هوش مصنوعی عاملی و عاملها (AI Agents) نیازمند چنین مهارتی است.
با این حال، Olmo 3 در رقابت با مدلهای بزرگتر مثل Llama 3.1-405B از نظر اندازه کوچکتر است و این مسئله باعث شده که هنوز در میان شرکتهای تجاری، بهاندازه رقبای خود شناختهشده نباشد. همچنین Meta در اطراف Llama ابزارهای گسترده، اکوسیستم کامل و زیرساخت کاربردی ارائه کرده است؛ در حالی که Ai2 به دلیل منابع محدود فاقد چنین اکوسیستمی است. با وجود این محدودیتها، کارشناسان میگویند Ai2 بهخاطر شفافیت، کنترل بیشتر و امنیت بهتر مدلهای متنباز، همچنان انتخاب ارزشمندی برای شرکتها و محققان است. Ai2 بهجای رقابت تجاری، قصد دارد استانداردهای اخلاقی، پژوهشی و فنی هوش مصنوعی را ارتقا دهد و توسعه سالمتر این فناوری را ترویج کند.
منبع خبر: aibusiness

شاهین آقامعلی


پاسخ :