Ai2 مدل‌های متن‌باز Olmo 3 را منتشر کرد

...

مؤسسه غیرانتفاعی هوش مصنوعی Allen Institute for AI (Ai2) نسل جدید مدل‌های Olmo 3 را منتشر کرده است؛ مجموعه‌ای کاملاً متن‌باز که شامل مدل‌های Base، Instruct، Think و RLZero می‌شود. اهمیت این انتشار در زمانی است که تقاضا برای مدل‌های کاملاً متن‌باز، به‌ویژه برای سازمان‌هایی که قصد شخصی‌سازی و فاین‌تیون مدل‌ها را دارند، به‌طور چشمگیری افزایش یافته است. Ai2 با ارائه نسخه‌های کامل مدل‌ها، شامل وزن‌ها و تمام چک‌پوینت‌های مراحل مختلف آموزش، یک استاندارد جدید از «باز بودن واقعی» ارائه کرده است؛ تفاوتی که آن را از مدل‌های به‌ظاهر متن‌باز مانند خانواده Llama متمایز می‌کند.

مدل‌های Olmo 3 در چند نسخه عرضه شده‌اند. Olmo 3-Base که در دو اندازه 7 میلیارد و 32 میلیارد پارامتر ارائه می‌شود، برای وظایف عمومی مانند پردازش متن، کدنویسی و مسائل ریاضی طراحی شده است. نسخه Instruct یک مدل 7 میلیارد پارامتری است که برای تعاملات مکالمه‌ای، پاسخ‌دهی دقیق و استفاده از ابزارهای مختلف بهینه شده است و می‌تواند برای ساخت چت‌بات‌ها و سیستم‌های تعاملی به‌کار رود.

 

مد هوش مصنوعی Olmo3

 

یکی از جذاب‌ترین نسخه‌ها، مدل Olmo 3-Think است که نخستین مدل تفکری متن‌باز Ai2 محسوب می‌شود. این مدل با هدف نمایش «فرایند تفکر» خود طراحی شده است؛ یعنی توضیح می‌دهد که چگونه به یک جواب رسیده است. این ویژگی برای پژوهشگران، استادان دانشگاه و تیم‌هایی که روی شفافیت، ارزیابی امنیتی و تحلیل رفتاری مدل‌ها کار می‌کنند، اهمیت زیادی دارد. این نسخه نیز مانند Base در اندازه‌های 7B و 32B عرضه شده است.

نسخه دیگر Olmo 3-RLZero است که برای یادگیری تقویتی و بهبود رفتارهای استدلالی پیچیده توسعه یافته است. این نسخه به‌طور خاص برای وظایفی طراحی شده که به تصمیم‌گیری چندمرحله‌ای، منطق عمیق‌تر و حل مسائل دشوار نیاز دارند. Ai2 می‌گوید که این مدل بازتاب تلاش این مؤسسه برای پیشبرد تحقیق در حوزه استدلال هوش مصنوعی است.

 

مد هوش مصنوعی Olmo3

 

یکی از نکات مهم درباره Olmo 3 این است که Ai2 تمام چک‌پوینت‌ها را ارائه داده است؛ از مدل خام قبل از آموزش گرفته تا میانه آموزش و نسخه نهایی. این اقدام بسیار نادر است و دسترسی پژوهشگران را به روند کامل شکل‌گیری مدل فراهم می‌کند. به گفته مارک بکیو، تحلیل‌گر مؤسسه Omdia، Ai2 همچنان یکی از وفادارترین بازیگران حوزه متن‌باز است و هر بار استاندارد جدیدی برای «باز بودن واقعی» معرفی می‌کند. او معتقد است روند صنعت به سمت مدل‌هایی می‌رود که قابلیت استدلال قوی‌تر داشته باشند؛ زیرا ظهور هوش مصنوعی عاملی و عامل‌ها (AI Agents) نیازمند چنین مهارتی است.

با این حال، Olmo 3 در رقابت با مدل‌های بزرگ‌تر مثل Llama 3.1-405B از نظر اندازه کوچک‌تر است و این مسئله باعث شده که هنوز در میان شرکت‌های تجاری، به‌اندازه رقبای خود شناخته‌شده نباشد. همچنین Meta در اطراف Llama ابزارهای گسترده، اکوسیستم کامل و زیرساخت کاربردی ارائه کرده است؛ در حالی که Ai2 به دلیل منابع محدود فاقد چنین اکوسیستمی است. با وجود این محدودیت‌ها، کارشناسان می‌گویند Ai2 به‌خاطر شفافیت، کنترل بیشتر و امنیت بهتر مدل‌های متن‌باز، همچنان انتخاب ارزشمندی برای شرکت‌ها و محققان است. Ai2 به‌جای رقابت تجاری، قصد دارد استانداردهای اخلاقی، پژوهشی و فنی هوش مصنوعی را ارتقا دهد و توسعه سالم‌تر این فناوری را ترویج کند.

منبع خبر: aibusiness

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟