رونمایی از Llama 3.3: مدلی چندزبانه برای آینده‌ای هوشمندتر

متا به‌تازگی از مدل Llama 3.3 رونمایی کرده است. این مدل زبان بزرگ چندزبانه، برای پشتیبانی از کاربردهای مختلف هوش مصنوعی در حوزه‌های تحقیقاتی و صنعتی طراحی شده است. با بهره‌مندی از پنجره متنی ۱۲۸ هزار توکنی و معماری بهینه‌شده، Llama 3.3 عملکردی قدرتمند در وظایف استدلال، برنامه‌نویسی و پردازش چندزبانه ارائه می‌دهد. این مدل تحت یک مجوز عمومی در Hugging Face منتشر شده است.

بهبودهای کلیدی در Llama 3.3

Llama 3.3 نسبت به نسخه‌های قبلی خود پیشرفت‌های قابل‌توجهی داشته است. مهم‌ترین ویژگی‌های این مدل شامل موارد زیر است:

پنجره متنی بلندتر: پشتیبانی از ورودی‌های طولانی‌تر تا ۱۲۸ هزار توکن.
معماری بهینه‌شده: استفاده از مکانیزم “توجه گروهی پرسشی” (GQA) برای افزایش کارایی و مقیاس‌پذیری.
آموزش ترکیبی: مدل با استفاده از یادگیری نظارت‌شده و یادگیری تقویتی مبتنی بر بازخورد انسانی، برای حفظ کیفیت، ایمنی و مفید بودن بهینه‌سازی شده است.

عملکرد برتر در ارزیابی‌ها

Llama 3.3 در معیارهای مختلف عملکرد بالایی نشان داده است.

استدلال و دانش: این مدل در ارزیابی GPQA، به دقت ۵۰.۵ درصد دست یافته که از نسخه قبلی خود بهتر عمل کرده است.
تولید کد: در معیار HumanEval، مدل با دقت ۸۸.۴ درصد عملکردی مثال‌زدنی در تولید کد ارائه کرده است.
چندزبانگی: در آزمون MGSM، امتیاز ۹۱.۱ درصد در “Exact Match” را کسب کرده است.

این قابلیت‌ها، Llama 3.3 را به گزینه‌ای مناسب برای توسعه دستیارهای هوش مصنوعی، تولید محتوا، و نرم‌افزار تبدیل کرده است. همچنین این مدل از ادغام با ابزارهای ثالث پشتیبانی می‌کند، که امکان انجام وظایفی مانند بازیابی داده، محاسبات و تولید داده‌های مصنوعی را فراهم می‌سازد.

ایمنی و کاربردپذیری

متا در توسعه این مدل به امنیت توجه ویژه‌ای داشته است. Llama 3.3 به استراتژی‌های قوی برای پاسخگویی به ورودی‌های مضر مجهز شده و در پاسخ‌ها لحنی متعادل حفظ می‌کند. توسعه‌دهندگان می‌توانند این مدل را در سیستم‌هایی با ابزارهای ایمنی مانند Prompt Guard و Code Shield پیاده‌سازی کنند.

بازخورد مثبت از جامعه کاربران

رونمایی از این مدل واکنش‌های مثبت بسیاری را از جامعه کاربران به همراه داشته است. میهائیل شاهوف، مدیرعامل Bulcode، درباره اهمیت مدل‌های کوچک‌تر مانند Llama 3.3 گفت:

«مدل‌های کوچکی مانند Llama 3.3 در کاربردهای سازمانی به‌سرعت در حال محبوب شدن هستند. این مدل‌ها به دلیل کارایی، هزینه کمتر و قابلیت استقرار سریع، برای وظایفی مانند خدمات مشتریان، شخصی‌سازی و تحلیل‌های سبک، بسیار مناسب هستند. آینده شامل ترکیبی از مدل‌های کوچک برای کارهای روزمره و مدل‌های بزرگ برای چالش‌های پیچیده خواهد بود.»

همچنین، روا‌ثیپاتی نامبالا، مدیرعامل CloudAngles، اعلام کرد که سازمان آن‌ها قصد دارد به‌زودی Llama 3.3 را در سیستم‌های خود پیاده‌سازی کند:

«ما قبلاً مدل Llama 3.2 را با پلتفرم mlangles خود ادغام کرده‌ایم و آماده‌ایم نسخه ۳.۳ را نیز برای بهره‌مندی مشتریان‌مان پیاده‌سازی کنیم. از تیم متا بابت این پیشرفت‌ها سپاسگزاریم.»

دسترسی و آینده مدل

Llama 3.3 تحت مجوز جامعه منتشر شده و از طریق Hugging Face در دسترس است. توسعه‌دهندگان می‌توانند این مدل را با ابزارهایی مانند Transformers اجرا کرده و نسخه‌های کم‌حجم‌تر آن را برای کاهش نیازهای سخت‌افزاری استفاده کنند. متا از جامعه کاربران دعوت کرده تا بازخورد خود را ارائه دهند و در بهبود نسخه‌های آینده و ارتقای استانداردهای ایمنی هوش مصنوعی همکاری کنند.

رونمایی از Llama 3.3: مدلی چندزبانه برای آینده‌ای هوشمندتر

بهبودهای کلیدی در Llama 3.3

عملکرد برتر در ارزیابی‌ها

ایمنی و کاربردپذیری

بازخورد مثبت از جامعه کاربران

دسترسی و آینده مدل

پنتاگون در پی استفاده از هوش مصنوعی برای شناسایی نقاط ضعف زیرساخت‌های چین

از دل تاریک‌ترین روزها

دولت کره جنوبی برای مقابله با تبلیغات گمراه‌کننده وارد میدان شد

آمریکا به TSMC مجوز سالانه صادرات تجهیزات ساخت تراشه به چین داد

xAI سومین ساختمان خود را برای گسترش زیرساخت هوش مصنوعی خرید

انقلاب هوش مصنوعی در آفریقا: مسیر یک تریلیون دلاری برای رشد اقتصادی تا ۲۰۳۵

جدید‌ترین هوش مصنوعی‌ها

مرورگر ChatGPT Atlas

GLM 4.5

KIMI

GlobeScribe.ai

Lovable

Codex

Felo AI

Hailou

Hunyuan

Chance AI

openAI.fm

n8n

chatbot Arena

Tripo AI

Reve

wan

Manus AI

Make.com

Le Chat

OmniHuman

Janus Pro

Kinetix

DragGan

openrouter.ai

operator

Storm

Pika Art

Openmagic

Mokker AI

DeepSeek

Buffer AI

Mapify

Gravitywrite

NotebookLM

zipwp

writi.io

Vidalgo

ChatBA

Levels.fyi

مشاور هوشمند اینوآپ

Lensgo

Learn About AI

PDF.ai

Magai

Remini

BetterPic

OpenArt

Maestra

Heights AI

Deciphr