متا از هوش مصنوعی Llama 4 رونمایی کرد

...

متا (Meta) در روز شنبه مجموعه‌ای جدید از مدل‌های هوش مصنوعی خود با نام Llama 4 را معرفی کرد. این مجموعه شامل چهار مدل به نام‌های Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth است (مدل چهارم هنوز به‌طور رسمی معرفی نشده). این مدل‌ها با استفاده از حجم عظیمی از داده‌های متنی، تصویری و ویدیویی آموزش دیده‌اند تا توانایی درک چندرسانه‌ای داشته باشند. مدل‌های Scout و Maverick به‌صورت متن‌باز از طریق سایت Llama.com و پلتفرم‌هایی مانند Hugging Face در دسترس هستند، در حالی که Behemoth هنوز در حال آموزش است. به‌روزرسانی‌هایی نیز برای دستیار هوش مصنوعی متا (Meta AI) در اپلیکیشن‌هایی مانند واتساپ، مسنجر و اینستاگرام انجام شده است. البته قابلیت‌های چندرسانه‌ای فعلاً فقط در ایالات متحده و به زبان انگلیسی فعال هستند.

 

LIama

 

معماری این مدل‌ها از نوع Mixture of Experts (MoE) است که باعث افزایش کارایی در پردازش داده‌ها می‌شود. در این روش، وظایف به بخش‌های کوچکتر تقسیم و توسط مدل‌های "متخصص" پردازش می‌شوند. برای مثال، Maverick دارای ۴۰۰ میلیارد پارامتر کلی است اما فقط ۱۷ میلیارد پارامتر آن در هر زمان فعال است. Scout نیز ۱۰۹ میلیارد پارامتر کلی دارد با ۱۷ میلیارد پارامتر فعال و توانایی پردازش متن تا سقف ۱۰ میلیون توکن را داراست. Scout بر روی یک کارت گرافیک Nvidia H100 اجرا می‌شود، در حالی که Maverick نیاز به سخت‌افزار قوی‌تری مانند Nvidia H100 DGX دارد. مدل Behemoth بزرگ‌ترین عضو این خانواده است با ۲ تریلیون پارامتر کلی و ۲۸۸ میلیارد پارامتر فعال و در آزمایش‌های متا عملکردی بالاتر از مدل‌هایی چون GPT-4.5 و Claude 3.7 Sonnet داشته، هرچند هنوز از Gemini 2.5 Pro عقب‌تر است.

 

LIama

 

از نظر کاربرد، Maverick برای استفاده عمومی و گفتگوهای خلاقانه طراحی شده، در حالی که Scout در خلاصه‌سازی اسناد و تحلیل کدهای بزرگ عملکرد بهتری دارد. متا مدعی است که Maverick از GPT-4o و Gemini 2.0 در برخی بنچمارک‌ها بهتر عمل کرده، اما هنوز به سطح مدل‌های پیشرفته‌تر جدید نرسیده است. یکی از تغییرات مهم Llama 4 نسبت به نسخه‌های قبلی، پاسخ‌دهی بیشتر به پرسش‌های "بحث‌برانگیز" است. این مدل‌ها کمتر از قبل از پاسخ دادن به موضوعات سیاسی یا اجتماعی امتناع می‌ورزند و به گفته متا، تلاش شده تا دیدگاه‌های مختلف را متعادل‌تر نمایش دهند. با این حال، استفاده از Llama 4 محدودیت‌هایی دارد. شرکت‌ها یا کاربران مقیم اتحادیه اروپا نمی‌توانند از این مدل‌ها استفاده کنند یا آن‌ها را توزیع نمایند؛ احتمالاً به دلیل قوانین سخت‌گیرانه حریم خصوصی و هوش مصنوعی در اروپا. همچنین شرکت‌هایی با بیش از ۷۰۰ میلیون کاربر فعال ماهانه باید مجوز خاصی از متا دریافت کنند. در نهایت، متا تأکید کرده که Llama 4 آغازگر عصری جدید برای این خانواده از مدل‌هاست و توسعه‌های بیشتری در راه است.

منبع خبر: techcrunch

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟