هوش مصنوعی جدید شرکت دیپ سیک رونمایی شد
در حالی که کمپانی چینی Deepseek با مدل R1 همچنان اصلیترین خبر دنیای هوش مصنوعی است، این شرکت از مدل چند وجهی جدید خود با نام Janus Pro رونمایی کرد. هوش مصنوعی Janus Pro یک مدل هوش مصنوعی است که هم میتواند تصاویر را دریافت کند و به سوالات شما در مورد آنها پاسخ دهد و هم میتوانید از متن تصویر جدید تولید کند.
جی نس پرو در بنچ مارکهای معتبر درخشیده است و به رقابت با مدلهای مطرحی مثل مدل DALL-E 3 از شرکت OpenAI و مدل Stable Diffusion برخواسته است. در این مقاله به بررسی هوش مصنوعی Janus pro میپردازیم
هوش مصنوعی Janus Pro چیست؟
هوش مصنوعی Janus Pro یک مدل چندوجهی از شرکت DeepSeek است که برای پردازش همزمان متن و تصویر طراحی شده است. جینس پرو، نسبت به نسخه اولیه خود پیشرفتهای قابلتوجهی داشته و از استراتژیهای آموزشی بهینهتر، مجموعه دادههای گستردهتر و معماری مقیاسپذیرتر بهره میبرد. این مدل در دو نسخه ۱ میلیاردی و ۷ میلیاردی پارامتری ارائه شده است.
مقاله پیشنهادی : منظور از پارامتر در مدلهای هوش مصنوعی چیست؟
به زبان ساده، یک مدل چند وجهی مدلی است که علاوه بر متن، میتواند تصاویر را نیز دریافت کند و آنها را بررسی و تفسیر کند. در واقع این مدلها میتوانند میان متن و تصویر ارتباط برقرار کنند. مثلا شما میتوانید تصویر را آپلود کنید و از این مدل درباره اشیا داخل آن سوال کنید. این قابلیت در ChatGPT وجود دارد، شما میتوانید تصویر آپلود کنید اما در مدل Deepseek R1 این قابلیت وجود ندارد، حالا این مدل برای پر کردن این شکاف خالی به میان آمده است.
قابلیتهای هوش مصنوعی Janus Pro
همانطور که گفتیم، مدل هوش مصنوعی جی نس پرو، یک مدل چند وجهی است، یعنی هم تصویر را دریافت میکند، هم میتواند تصویر بسازد.
با استفاده از Janus Pro، شما میتوانید تصاویر خود را آپلود کنید و در مورد آنها با هوش مصنوعی گفتگو کنید. این قابلیت برای تحلیل نمودارها، تحلیل دادههای تصویری و … بسیار کاربردی است. DALL-E 3 که بر روی چت جیپیتی فعال است، یکی از قویترین مدلهای چند وجهی جهان به شما میآید.
همچنین شبیه بسیاری از ابزارهای هوش مصنوعی ساخت تصویر در جهان، janus pro میتواند از متن شما، برای شما تصاویر بسیار جذاب بسازد.
جی نس پرو به صورت متن باز منتشر شد
شرکت دیپ سیک، هوش مصنوعی جی نس پرو را نیز همانند مدل Deepseek R1 به صورت اوپن سورس منتشرکرده است. این مدل در دو نسخه ۱ و ۷ میلیارد پارامتری منتشر شده است. هم اکنون میتوانید از طریق هاگینگ فیس و گیتهاب، به مدل Janus pro دسترسی داشته باشید. انتشار اوپن سور janus pro تحولی مهم در صنعت هوش مصنوعی ایجاد کرده و جایگاه شرکت deepseek را به سرعت به عنوان یکی از قدرتمندترین بازیگران تثبیت کرده است.
لینک: صفحه Deepseek در هاگینگ فیس
آموزش استفاده از هوش مصنوعی Janus pro
همانطور که گفته شد، هوش مصنوعی Janus pro یک مدل متن باز است. یعنی شما میتوانید آن را به صورت آزادانه بر روی سیستمهای خود استفاده کنید، البته به شرط داشتن یک سیستم مناسب
در حال حاضر برای استفاده از هوش مصنوعی janus pro میتوانید به اسپیس این هوش مصنوعی در هاگینگ فیس بروید(اینجا کلیک کنید).
در این اسپیس شما میتوانید تصاویر را آپلود کنید تا جینس پرو برای شما تصویر را تحلیل کند یا به سوالات شما پاسخ دهد
همانطور که در تصویر بالا مشاهده میکنید، در این بخش شما باید یک تصویر آپلود کنید و سپس در بخش Question سوال خود را بپرسید و در نهایت بر روی گزینه Chat بزنید تا پاسخ خود را دریافت کنید. جینس پرو به خوبی میتوانید فرمولها و تصاویر و نمودارها را درک کند و سوالات شما را پاسخ دهد. اما به زبان انگلیسی. این مدل عملکرد مناسبی با زبان فارسی ندارد و تقریبا جواب درستی به شما نمیدهد.
همچنین میتوانید از مدل janus pro برای ساخت تصویر از متن استفاده کنید. در همین اسپیس، در کمی پایینتر، میتوانید پرامپت خود را بنویسید تا این مدل هوش مصنوعی چینی، تصاویر واقعا جذابی برای شما بسازد.
Janus pro در پنچمارکها
عملکرد هوش مصنوعی جی نس پرو در بنچمارکها نشاندهنده پیشرفت قابل توجه آن نسبت به نسخه قبلی و سایر مدلهای مشابه است. در بنچمارکهای درک چندوجهی مانند POPE، MME-Perception، GQA و MMMU، Janus-Pro-7B عملکرد بسیار بهتری نسبت به Janus-Pro-1B و مدلهای دیگری مانند LLaVA-v1.5-7B و VILA-U از خود نشان داده است.
این مدل در بنچمارکهای GenEval و DPG-Bench عملکرد خوبی داشته است. Janus-Pro در GenEval امتیاز ۸۰٪ و در DPG-Bench امتیاز ۸۴.۲٪ را کسب کرده است. این نتایج نشان میدهد که مدل در پیروی از دستورات و تولید تصاویر با کیفیت، از DALL-E 3 و سایر مدلها بهتر عمل کرده است.
این دستاوردها به خوبی نشان میدهد که پس از موفقیت مدل R1 حالا باید منتظر رقابت جذاب این مدل با DALL-E 3 باشیم.
هوش مصنوعی Janus Pro در یک نگاه
تا مدتی پیش اگر نام شرکت دیپ سیک را میشنیدیم، چندان اهمیتی نداشت، اما حالا همین که میدانیم مدل Janus Pro یکی از مدلهای این شرکت است، میدانیم که با یک مدل هیجان انگیز و قدرتمند مواجه هستیم. مدل جینس پرو یک مدل چند وجهی است. این مدل چند وجهی میتواند بین تصویر و متن ارتباط برقرار کند و از متن برای شما تصویر بسازد و یا تصاویر شما را تحلیل کند.
این شرکت چینی، مدل Janus را صورت اوپن سورس منتشر شده کرده است. احتمالا به زودی شاهد ادغام این مدل در بسیاری از پلتفرمها و ابزارهای هوش مصنوعی در جهان خواهیم بود.