معرفی chatbot Arena

چت بات آرنا (Chatbot Arena) یک پلتفرم برای ارزیابی و امتیازدهی به مدل‌های هوش مصنوعی است. در این ابزار، کاربران از بین پاسخ‌های ناشناس توسط مدل‌های هوش مصنوعی به انتخاب بهترین مدل می‌پردازند.

chatbot Arena را دوست داشتید؟ به اشتراک بگذارید

ابزارهای پرطرفدار هوش مصنوعی

Hailou

(هایلو)

Tripo AI

(تریپو)

Le Chat

(لو شت)

Janus Pro

(جی نس)

لوگو دیپ سیک

DeepSeek

(دیپ سیک)

هوش مصنوعی Dream machine

Dream machine

(دریم ماشین)

هوش مصنوعی ایلان ماسک

Grok

(گروک)

Monica

Monica

(مانیکا)

ای آی استودیو منتشر شد

LLama

(لاما)

Microsoft Copilot

(کوپایلوت)

هوش مصنوعی جمینی

Gemini AI

(جمینی)

Claude AI

(کلود)

چت جی پی تی

Chat GPT

(چت جی‌پی‌تی)

Microsoft Designer

(مایکروسافت دیزاینر)

Canva AI

(کانوا)

Krea AI

(کریا)

Adobe Firefly

(ادوب فایرفلای)

Kaiber AI

(کایبر)

Runway ML

(ران وی ام ال)

DALL·E 3

(دال-ای سه)

هر روز، روایت‌هایی از جهان هوش مصنوعی را به صورت خلاصه بشنوید

سرویس‌های مشابه chatbot Arena
هوش مصنوعی Codex
هوش مصنوعی Codex، عامل هوش مصنوعی جدید شرکت OpenAI را می‌توان به عنوان پیشرفته‌ترین ابزار هوش مصنوعی برای برنامه نویسی در نظر گرفت.
هوش مصنوعی Felo
هوش مصنوعی Felo یک موتور جستجوی هوشمند ژاپنی است که به شما امکان می‌دهد با تکیه بر منابع معتبر به هر زبانی، پاسخ سوالات خود را پیدا کنید.

||

رایگان

معرفی هوش مصنوعی Hailuo
Hailuo یک هوش مصنوعی ساخت ویدئو از متن و تصویر است. این هوش مصنوعی چینی عملکرد و کیفیت قابل توجهی از خود نشان داده است و دسترسی و استفاده ساده، بر محبوبیت آن افزوده است.

||

رایگان و پولی (فریمیوم)

هوش مصنوعی Hunyuan
Hunyuan مجموعه‌ای از مدل‌های هوش مصنوعی توسعه‌یافته توسط شرکت Tencent است که حوزه‌هایی مانند زبان، ویدئو و مدل‌سازی سه‌بعدی را پوشش می‌دهد. این مدل‌ها با بهره‌گیری از معماری‌های نوآورانه، عملکرد بالایی در تولید محتوا و تحلیل داده‌ها ارائه می‌کنند.

||

رایگان

جدید‌ترین هوش مصنوعی‌ها

Codex

Felo AI

Hailou

Hunyuan

Chance AI

openAI.fm

n8n

chatbot Arena

Tripo AI

Reve

لوگو هوش مصنوعی Wan

wan

Manus AI

Make.com

Le Chat

OmniHuman

امروزه صدها مدل هوش مصنوعی وجود دارد. احتمالا اگر شما یک کاربر معمولی در دنیای هوش مصنوعی باشید، تا به حال با چند ده مدل هوش مصنوعی کار کرده‌اید. اما کدام یک از این مدل‌ها از بقیه بهتر هستند؟ این سوالی است که Chatbot Arena پاسخ آن را به شما می‌دهد.

بنچمارک‌های مختلفی برای بررسی مدل‌های هوش مصنوعی وجود دارد. مثلا بنچمارک Humanities Last Exam یکی از سخت‌ترین آن‌هاست. در این بنچمارک‌ها، کامپیوتر است که مدل‌ها را مورد آزمایش قرار می‌دهد، اما چت بات آرنا از انسان برای رتبه بندی و امتیاز دهی به مدل‌های هوش مصنوعی استفاده می‌کند. از همین رو، نتیجه‌ای که Chatbot Arena به ما می‌دهد، به سادگی قابل درک است و یک نظر جمعی انسانی است. در این مقاله به بررسی پلتفرم Chatbot Arena می‌پردازیم.

Chatbot Arena چیست؟

همانطور که از Chatbot Arena می‌توان فهمید، این پلتفرم میدان نبرد است. میدانی که مدل‌های هوش مصنوعی با هم می‌جنگند. چت بات آرنا یک پلتفرم آنلاین است که به شما امکان می‌دهد پاسخ‌های مدل‌های زبان بزرگ را به‌صورت بی‌طرفانه و هم‌زمان مقایسه کنید.

تیم LMSYS دانشگاه برکلی در آوریل ۲۰۲۳ این پلتفرم را راه‌اندازی کرد. در چت بات آرنا شما ابتدا سؤال خود را وارد می‌کنید. سپس دو پاسخ ناشناس از مدل‌های مختلف دریافت می‌کنید و پاسخ برتر را انتخاب می‌کنید. سیستم رتبه‌بندی ELO به هر رأی امتیاز می‌دهد. در پایان، امتیازها کیفیت واقعی مدل‌ها را براساس اولویت کاربران نشان می‌دهد. این پلتفرم از زمان راه‌اندازی تاکنون بیش از دو میلیون رأی جمع‌آوری کرده و اکنون بیش از ۱۷۰ مدل را در فهرست خود جای داده است.

 

تفاوت چت بات آرنا با بنچمارک‌ها چیست؟

چت بات آرنا ارزیابی را بر پایه مقایسه بلادرنگ و رأی‌گیری کاربران انجام می‌دهد، اما بنچمارک‌ها از مجموعه دادهٔ از پیش تعریف‌شده و معیارهای خودکار برای سنجش عملکرد مدل‌ها استفاده می‌کنند. در بنچمارک‌ها پاسخ‌ها به‌صورت انبوه و با معیارهایی مثل دقت یا F1 امتیازدهی می‌شوند، اما در چت بات آرنا کاربران دو پاسخ ناشناس را می‌بینند و بهترین را انتخاب می‌کنند. این روش کاربرمحور بازخوردی طبیعی و پویا ارائه می‌کند، در حالی که بنچمارک‌ها به ارزیابی از نظر عددی و استاندارد تکیه دارند.

 

آمار و ارقامی از Chatbot Arena

تا کنون کاربران بیش از ۲٫۸ میلیون رأی در «چت بات آرنا» ثبت کرده‌اند و بیش از ۲۲۹ مدل  در این پلتفرم ارزیابی می‌شوند. پرسش‌ها در دسته‌های کدنویسی، ریاضیات، پرسش‌های دشوار، گفتگوهای چندمرحله‌ای و دستورالعمل‌محور گسترش یافته‌اند تا توانمندی مدل‌ها در سناریوهای مختلف سنجیده شود.

آموزش مشارکت در ChatBot Arena

محیط کاربری ChatBot Arena

اگر شما هم تمایل دارید که در چت بات آرنا مشارکت کنید، می‌توانید به سادگی به استفاده از مراحل زیر این کار را انجام دهید:

  1. به سایت رسمی چت بات آرنا به آدرس lmarena.ai بروید.

  2. در این صفحه( کمی به پایین اسکرول کنید)، سوال خود را بپرسید.

  3. دو پاسخ برای شما تولید می‌شود.
  4. شما می‌توانید از بین این دو پاسخ انتخاب کنید که کدام بهتر است ( یا حتی مساوی)

البته خبر خوب این است که نسخه بتا چت بات آرنا منتشر شده است. در نسخه بتا رابط کاربری بسیار بهبود یافته است و به سادگی می‌توانید در Chatbot Arena مشارکت کنید.

 

نسخه بتا چت بات آرنا

 

بهترین مدل‌ها در حال حاضر بر اساس چت بات آرنا کدام اند؟

تا به امروز ( زمان نگارش این مقاله) ۲ میلیون و ۸۰۰ هزار رای در Chatbot Arena ثبت شده است و ۲۲۹ مدل هوش مصنوعی به هم مقایسه شده‌اند.

مدل Gemini-2.5-pro به عنوان بهترین مدل انتخاب شده است و پس از آن مدل O3 قرار دارد. برای مشاهده تمامی مدل‌ها و امتیازات آن‌ها می‌توانید به صفحه اختصاصی چت بات آرنا در هاگینگ فیس مراجعه کنید.

Chatbot Arena در یک نگاه

در پایان، «چت بات آرنا» با ارائه بستری بی‌طرفانه و مبتنی بر رأی‌گیری کاربران توانسته ارزیابی مدل‌های زبان بزرگ را از حالت عددی و خشک به تجربه‌ای تعاملی تبدیل کند. این پلتفرم با مقایسه بلادرنگ پاسخ‌ها و سیستم رتبه‌بندی ELO، تصویری واقعی‌تر از برتری مدل‌ها در سناریوهای متنوع به ما می‌دهد. حضور بیش از ۲۲۹ مدل و ثبت میلیون‌ها رأی نشان‌دهنده اعتماد و مشارکت گسترده جامعه کاربران است. با شرکت در «چت بات آرنا» می‌توانید نقش فعالی در بهبود و توسعه هوش مصنوعی ایفا کنید.

 

 

 

سوالات پرتکرار در مورد chatbot Arena

چت بات آرنا پلتفرمی برای مقایسه مدل‌های زبانی بر اساس نظر کاربران است. کاربران به صورت ناشناس، پاسخ مدل‌ها را انتخاب می‌کنند.
خیر، Chatbot Arena با وجود این که یک رتبه‌بندی برای مدل‌های هوش مصنوعی است، اما با بنچمارک‌ها متفاوت است، زیرا به جای سوالات مشخص، توسط نظر کاربران امتیاز دهی می‌شود.
سامانه رتبه‌بندی «اِلُو» (ELO) روشی برای سنجش قدرت رقبا است که ابتدا برای شطرنج طراحی شد و بعدها در زمینه‌های دیگر هم به کار رفت. در این سیستم هر بازیکن یا مدل یک امتیاز عددی دارد و پس از هر رقابت، بسته به نتیجه مسابقه و اختلاف امتیاز قبلی، امتیاز او تغییر می‌کند. اگر بازیکن ضعیف‌تر پیروز شود، امتیاز بیشتری می‌گیرد و اگر بازیکن قوی‌تر ببازد، امتیاز بیشتری از دست می‌دهد. این روش باعث می‌شود رتبه هر مدل یا بازیکن به‌طور پویا و براساس عملکرد واقعی تغییر کند.
بله، شما به راحتی می‌توانید در چت بات ارنا و انتخاب مدل برتر مشارکت کنید. کافیست که به وبسایت آن مراجعه کنید.

chatbot Arena را دوست داشتید؟ به اشتراک بگذارید

نظرات و دیدگاه‌ها

دیدگاهتان را بنویسید

دیدگاهتان را بنویسید

ابزارهای پرطرفدار هوش مصنوعی

Hailou

(هایلو)

Tripo AI

(تریپو)

Le Chat

(لو شت)

Janus Pro

(جی نس)

لوگو دیپ سیک

DeepSeek

(دیپ سیک)

هوش مصنوعی Dream machine

Dream machine

(دریم ماشین)

هوش مصنوعی ایلان ماسک

Grok

(گروک)

Monica

Monica

(مانیکا)

ای آی استودیو منتشر شد

LLama

(لاما)

Microsoft Copilot

(کوپایلوت)

هوش مصنوعی جمینی

Gemini AI

(جمینی)

Claude AI

(کلود)

چت جی پی تی

Chat GPT

(چت جی‌پی‌تی)

Microsoft Designer

(مایکروسافت دیزاینر)

Canva AI

(کانوا)

Krea AI

(کریا)

Adobe Firefly

(ادوب فایرفلای)

Kaiber AI

(کایبر)

Runway ML

(ران وی ام ال)

DALL·E 3

(دال-ای سه)

سرویس‌های مشابه chatbot Arena
هوش مصنوعی Codex
هوش مصنوعی Codex، عامل هوش مصنوعی جدید شرکت OpenAI را می‌توان به عنوان پیشرفته‌ترین ابزار هوش مصنوعی برای برنامه نویسی در نظر گرفت.
هوش مصنوعی Felo
هوش مصنوعی Felo یک موتور جستجوی هوشمند ژاپنی است که به شما امکان می‌دهد با تکیه بر منابع معتبر به هر زبانی، پاسخ سوالات خود را پیدا کنید.

||

رایگان

معرفی هوش مصنوعی Hailuo
Hailuo یک هوش مصنوعی ساخت ویدئو از متن و تصویر است. این هوش مصنوعی چینی عملکرد و کیفیت قابل توجهی از خود نشان داده است و دسترسی و استفاده ساده، بر محبوبیت آن افزوده است.

||

رایگان و پولی (فریمیوم)

هوش مصنوعی Hunyuan
Hunyuan مجموعه‌ای از مدل‌های هوش مصنوعی توسعه‌یافته توسط شرکت Tencent است که حوزه‌هایی مانند زبان، ویدئو و مدل‌سازی سه‌بعدی را پوشش می‌دهد. این مدل‌ها با بهره‌گیری از معماری‌های نوآورانه، عملکرد بالایی در تولید محتوا و تحلیل داده‌ها ارائه می‌کنند.

||

رایگان

به نظر شما، اگر یک پادکست فارسی کاملا با هوش مصنوعی درست بشه، چجوری میشه؟

پادکست فارسی نکست مایند

پادکست فارسی نکست مایند

هر روز، با هوش مصنوعی، از هوش مصنوعی به شما می‌گه

تصور کن که هر روز یک اپیزود کوتاه چند دقیقه‌ای، جدیدترین های دنیای هوش مصنوعی رو بهت بگه