
متا (Meta) در روز شنبه مجموعهای جدید از مدلهای هوش مصنوعی خود با نام Llama 4 را معرفی کرد. این مجموعه شامل چهار مدل به نامهای Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth است (مدل چهارم هنوز بهطور رسمی معرفی نشده). این مدلها با استفاده از حجم عظیمی از دادههای متنی، تصویری و ویدیویی آموزش دیدهاند تا توانایی درک چندرسانهای داشته باشند. مدلهای Scout و Maverick بهصورت متنباز از طریق سایت Llama.com و پلتفرمهایی مانند Hugging Face در دسترس هستند، در حالی که Behemoth هنوز در حال آموزش است. بهروزرسانیهایی نیز برای دستیار هوش مصنوعی متا (Meta AI) در اپلیکیشنهایی مانند واتساپ، مسنجر و اینستاگرام انجام شده است. البته قابلیتهای چندرسانهای فعلاً فقط در ایالات متحده و به زبان انگلیسی فعال هستند.
معماری این مدلها از نوع Mixture of Experts (MoE) است که باعث افزایش کارایی در پردازش دادهها میشود. در این روش، وظایف به بخشهای کوچکتر تقسیم و توسط مدلهای "متخصص" پردازش میشوند. برای مثال، Maverick دارای ۴۰۰ میلیارد پارامتر کلی است اما فقط ۱۷ میلیارد پارامتر آن در هر زمان فعال است. Scout نیز ۱۰۹ میلیارد پارامتر کلی دارد با ۱۷ میلیارد پارامتر فعال و توانایی پردازش متن تا سقف ۱۰ میلیون توکن را داراست. Scout بر روی یک کارت گرافیک Nvidia H100 اجرا میشود، در حالی که Maverick نیاز به سختافزار قویتری مانند Nvidia H100 DGX دارد. مدل Behemoth بزرگترین عضو این خانواده است با ۲ تریلیون پارامتر کلی و ۲۸۸ میلیارد پارامتر فعال و در آزمایشهای متا عملکردی بالاتر از مدلهایی چون GPT-4.5 و Claude 3.7 Sonnet داشته، هرچند هنوز از Gemini 2.5 Pro عقبتر است.
از نظر کاربرد، Maverick برای استفاده عمومی و گفتگوهای خلاقانه طراحی شده، در حالی که Scout در خلاصهسازی اسناد و تحلیل کدهای بزرگ عملکرد بهتری دارد. متا مدعی است که Maverick از GPT-4o و Gemini 2.0 در برخی بنچمارکها بهتر عمل کرده، اما هنوز به سطح مدلهای پیشرفتهتر جدید نرسیده است. یکی از تغییرات مهم Llama 4 نسبت به نسخههای قبلی، پاسخدهی بیشتر به پرسشهای "بحثبرانگیز" است. این مدلها کمتر از قبل از پاسخ دادن به موضوعات سیاسی یا اجتماعی امتناع میورزند و به گفته متا، تلاش شده تا دیدگاههای مختلف را متعادلتر نمایش دهند. با این حال، استفاده از Llama 4 محدودیتهایی دارد. شرکتها یا کاربران مقیم اتحادیه اروپا نمیتوانند از این مدلها استفاده کنند یا آنها را توزیع نمایند؛ احتمالاً به دلیل قوانین سختگیرانه حریم خصوصی و هوش مصنوعی در اروپا. همچنین شرکتهایی با بیش از ۷۰۰ میلیون کاربر فعال ماهانه باید مجوز خاصی از متا دریافت کنند. در نهایت، متا تأکید کرده که Llama 4 آغازگر عصری جدید برای این خانواده از مدلهاست و توسعههای بیشتری در راه است.
منبع خبر: techcrunch
پاسخ :