
• اکنون میتوانید به API هوش مصنوعی Gemini Pro، اولین نسخه از جدیدترین مدل زبان بزرگ Google، بهصورت رایگان دسترسی داشته باشید.
گوگل از طریق API خود اولین فرصت برای استفاده از قدرتمندترین مدل زبان بزرگ خود، جمینی را به کسب و کارها و توسعه دهندگان میدهد. این مدل در سه نسخه Ultra، Pro و Nano ارائه میشود.
از امروز، Gemini Pro API از طریق ابزار توسعه دهنده رایگان مبتنی بر وب گوگل به نام AI Studio در دسترس توسعه دهندگان قرار میگیرد. Gemini Pro همچنین از طریق پلتفرم Google Cloud’s Vertex AI برای شرکتها در دسترس است. شرکتها میتوانند از امروز برای ساخت برنامههای کاربردی از Gemini استفاده کنند. گوگل اعلام کرد که قصد دارد این مدل را در هفتههای آینده بر اساس بازخورد کاربران تنظیم کند. نسخه اولیه Gemini دارای یک ورودی متن 32000 توکن است به این معنی که میتواند دستورات ورودی تا 5333 کلمه را دریافت کند. در مقابل، GPT-4 Turbo، جدیدترین مدل OpenAI، میتواند تا 128000 توکن را مدیریت کند. با این حال، گوگل گفت که نسخههای بعدی Gemini Pro دارای طول ورودی بسیار بیشتری خواهند بود. از دیگر ویژگیهای Gemini Pro میتوان به پشتیبانی از ۳۸ زبان، فراخوانی تابع، بازیابی معنایی و پایهگذاری دانش سفارشی اشاره کرد. در حال حاضر Gemini فقط متن را به عنوان ورودی میپذیرد و و به عنوان خروجی هم متن تولید میکند و خبری از کار با صوت یا تصویر نیست. با این حال، احتمال اضافه شدن قابلیت چندوجهی اختصاصی به Gemini Pro Vision وجود دارد که هم متن و هم تصاویر و ویدئو را به عنوان ورودی بپذیرد. استفاده از API Gemini Pro در حال حاضر رایگان است اما محدودیت حداکثر 60 درخواست در دقیقه را دارد. انتظار میرود که به زودی نسخه پولی این مدل هوش مصنوعی با قیمتی رقابتی با ChatGPT در دسترس قرار گیرد که محدودیت کمتری دارد. گوگل قبلاً قیمت Gemini Pro را منتشر کرده است: 0.00025 دلار به ازای هر هزار کاراکتر یا 0.0025 دلار برای هر تصویر. هزینه خروجی 0.0005 دلار در هر هزار کاراکتر است. شرکت اعتراف کرد که ورودیها و خروجیهای به دست آمده از نسخه رایگان Google Pro API توسط Google برای بهبود محصولاتش استفاده میشود، اما نسخه پولی این کار را نمیکند.
Imagen 2 و مدل های دیگر:
در کنار جمینی پرو، گوگل از مدلهای دیگری نیز رونمایی کرد؛ از جمله Imagen 2، آخرین مدل تولید تصویر هوش مصنوعی این شرکت که با استفاده از قدرتمندترین مدل انتشار متن به تصویر ساخته شده توسط Google DeepMind توسعه داده شده. Imagen 2 میتواند تصاویر با کیفیت بالا تولید کند و حتی میتواند برای ایجاد آرم و یا لوگوهای واقعی برای مشاغل استفاده شود. این مدل همچنین میتواند متن را به چندین زبان ارائه دهد. همچنین MedLM یکی دیگر از مدلهای این شرکت بود که معرفی شد. MedLM خانوادهای از مدلهای پایه میباشد که برای صنعت مراقبتهای بهداشتی تنظیم شده است. MedLM که بر اساس مدل پایه Med-PaLM 2 ساخته شده است، برای تقویت موارد استفاده از مراقبتهای بهداشتی از جمله یادداشت برداری پزشکی و پرسش و پاسخ پزشکی طراحی شده است. در حال حاضر، MedLM فقط برای کاربران Vertex مستقر در ایالات متحده در دسترس است و برنامههایی برای گسترش آن به در هفتههای آینده از طرف گوگل وجود دارد. گوگل همچنین قصد دارد به زودی مدلهای مبتنی بر Gemini را به مجموعه MedLM اضافه کند. Duet AI for Developers هم اکنون به طور کلی در دسترس است. Duet AI که برای کمک به توسعهدهندگان در ساخت برنامهها طراحی شده است، یک ابزار همکاری است که میتواند در رابطهای Google Cloud برای کمک به تولید کد و کمک چت برای برنامه نویسان تعبیه شود.
پاسخ :