متا از Llama 3، قدرتمندترین مدل منبع باز خود رونمایی کرد

...

متا از مدل منبع باز Llama 3 خود رونمایی کرد. نسل بعدی مدل زبان منبع باز خود که عملکرد ارتقا یافته‌ای را در استدلال، تولید کد و پیروی از دستورالعمل‌ها ارائه می‌کند. این شرکت از Llama 3 به عنوان تواناترین مدل زبان بزرگ در دسترس تا به امروز نام می‌برد و توانسته است از رقبایی مانند گوگل و آنتروپیک در مقیاس‌های مشابه پیشی بگیرد. سری مدل‌های زبان بزرگ Llama یکی از مهم‌ترین مدل‌ها در فضای هوش مصنوعی است که به بسیاری از برنامه‌های کاربردی وابسته به این مدل است و اساس مدل‌هایی را تشکیل می‌دهد که توسعه‌دهندگان بر اساس آن‌ها سرویس‌های هوش مصنوعی از جمله Vicuna و Alpaca را ساخته‌اند. طبق اعلام متا، نسل بعدی از Llama عملکردی پیشرفته‌ای را در طیف گسترده‌ای از معیارهای صنعتی و قابلیت‌های جدیدی از جمله استدلال بهبود یافته را ارائه می‌کند. مدل‌های جدید تفاوت‌های ظریف زبان را درک می‌کنند و می‌توانند کارهای پیچیده‌ای مانند ترجمه و تولید گفتگو را انجام دهند. متا مقیاس پذیری و عملکرد مدل را افزایش داد و به Llama 3 قدرت انجام وظایف چندمرحله‌ای را داد.Llama 3  همچنین نسبت به نسخه‌های قبلی نرخ تأخیر پایین‌تری دارد، زیرا مهندسان هوش مصنوعی متا فرایندی را پس از آموزش مدل اتخاذ کرده‌اند که تنوع پاسخ‌های مدل را افزایش داد.Llama 3  در دو اندازه عرضه می‌شود، هشت میلیارد پارامتر که آن را کمی بزرگ‌تر از کوچک‌ترین مدل قبلی Llama می‌کند و یک نسخه 70 میلیارد پارامتری. هر دو نسخه دارای طول زمینه 8k هستند، به این معنی که می‌توانند ورودی‌های حدود 6000 کلمه متن را مدیریت کنند.

LIama 3

کسب و کارها هم اکنون می‌توانند از Llama 3 استفاده کنند. این مدل منبع باز برای دانلود از وب سایت متا در دسترس است. همچنین در سرویس‌های ابری از جمله AWS از طریق Amazon SageMaker JumpStart قابل دسترسی است. مدل‌های Llama 3 همچنین در Databricks، Google Cloud، Hugging Face، IBM watsonX، Nvidia Nim و Microsoft Azure نیز عرضه خواهند شد. این مدل از سخت افزارهای مختلف ارائه دهندگان از جمله AMD، AWS، Dell، Intel، Nvidia و Qualcomm پشتیبانی می‌کند. 

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟