در یک سال گذشته، به ویژه پس از انتشار هوش مصنوعی دیپ سیک، چین به شکل حیرت آوری در عرصه هوش مصنوعی درخشید. شرکت تنسنت، یکی از غولهای فناوری چینی نیز حالا با انتشار مجموعه مدلهای هوش مصنوعی Hunyuan به این رقابت وارد شده است. احتمالا شما هوش مصنوعی هونیان را با مدل قدرتمند ساخت ویدئو آن بشناسید اما شرکت تنست، با برند Hunyuan، مدلهای مختلفی را منتشر کرده است. از مدلهای ساخت ویدئو و عکس گرفته، تا مدل زبانی بزرگ. در این مقاله به صورت کامل به معرفی مجموعه مدلهای هوش مصنوعی Hunyaun میپردازیم.
آشنایی با هوش منصوعی Hunyaun
هوش مصنوعی Hunyuan برندی است که شرکت چینی Tencent با آن وارد دنیای هوش مصنوعی شده است. این شرکت در طی یک سال گذشته انواع مختلفی از مدلهای زبانی، مدلهای ساخت عکس و ویدئو را منتشر کرده است. در این میان، هوش مصنوعی ساخت ویدئو هونیان و مدل زبان بزرگ، از همه معروفتر هستند.
ساخت ویدئو از متن با هوش مصنوعی Hunyuan Video
مدل هوش مصنوعی HunyuanVideo یک مدل پیشرفته تولید ویدیو از متن است که بهصورت متنباز منتشر شده است. این مدل با بیش از ۱۳ میلیارد پارامتر، بزرگترین مدل متنباز در حوزه تولید ویدیو محسوب میشود. HunyuanVideo قابلیت تولید ویدیوهای با کیفیت بالا از توصیفات متنی یا همان پرامپت را داراست و در ارزیابیهای انسانی حرفهای، عملکردی برتر از مدلهای پیشرفتهای مانند Runway Gen-3 و Luma 1.6 نشان داده است.
ساخت ویدئو از عکس با هوش مصنوعی HunyuanVideo-I2V
هوش مصنوهی HunyuanVideo-I2V نیز یکی دیگر از مدلهای شرکت Tencent برای ساخت ویدئو است، اما با این تفاوت که اینبار به جای متن، از تصویر برای شما ویدئو میسازد. ویدئوهایی با کیفیت و به مدت ۵ ثانیه از هر عکسی که به آن بدهید.
چگونه با هوش مصنوعی Hunyuan ویدئو بسازیم
از آنجایی که مدل هوش مصنوعی ساخت ویدئو Hunyuan به صورت متن باز منتشر شده است، در پلتفرمهای مختلفی میتوانید به آن دسترسی داشته باشید. البته اگر خودتان یک سیستم قدرتمند پردازش گرافیکی داشته باشید، میتوانید آن را به صورت لوکال نیز اجرا کنید.
یکی از سادهترین راههایی که میتوانید با هوش مصنوعی Hunyuan ویدئو بسازید، سایت Krea است. کریا مدلهای مختلف ساخت ویدئو را به صورت یکجا به شما ارائه میدهد و هوش مصنوعی هونیوان نیز یکی از اینهاست. در این وبسایت شما میتوانید به صورت محدود از این مدل استفاده کنید.
ساخت مدل سه بعدی با هوش مصنوعی Hunyuan
بله، با هوش مصنوعی هونیوان، شما میتوانید تصاویر خود را نیز به مدلهای سه بعدی تبدیل کنید. مدلهای Hunyuan3D برای همین هدف توسعه داده شدهاند.
هوش مصنوعی ساخت مدل سهبعدی از عکس، با استفاده از فناوریهای پیشرفته مانند مدلهای انتشار و بازسازی پیشرو، قادر است تصاویر دو بعدی را به مدلهای سهبعدی تبدیل کند. این مدلها معمولاً از تصاویر چندنما یا تصاویر متنی به عنوان ورودی استفاده میکنند تا جزئیات ساختار سهبعدی را از زوایای مختلف استخراج کرده و سپس با استفاده از الگوریتمهای بازسازی، مدل سهبعدی را با دقت و جزئیات بالا تولید کنند. یکی از مهمترین دستاوردهای این فناوری، افزایش سرعت و کیفیت در تولید مدلهای سهبعدی است، به طوری که مدلهای هوش مصنوعی جدید میتوانند این فرایند را در مدت زمان کوتاهتری انجام دهند و نتایج متنوع و باکیفیتی را ارائه دهند.
مدلهای زبان بزرگ Hunyuan
هونیوان تنها به مدلهای تصویری و ویدئویی ختم نمیشود، شرکت تنسنت چندین مدل زبانی نیز توسعه داده است.
مدل Hunyuan-Large
مدل Hunyuan-Large یک مدل هوش مصنوعی قدرتمند و بازمتن است که برای درک و تولید زبان طراحی شده. این مدل بر پایه معماری «ترکیب کارشناسان» یا همان Mixture of Experts (MoE) ساخته شده و در مجموع ۳۸۹ میلیارد پارامتر دارد که ۵۲ میلیارد از آنها در زمان اجرا فعال هستند.
هدف از ساخت این مدل، ارائه عملکرد بالا در کنار مصرف کمتر منابع سختافزاری بوده است. برای رسیدن به این هدف، از تکنیکهایی مثل استفاده از دادههای مصنوعی باکیفیت، کاهش حافظه مصرفی، و تعیین نرخ یادگیری متفاوت برای هر بخش از مدل استفاده شده. همچنین این مدل میتواند متنهای بسیار طولانی (تا ۲۵۶ هزار توکن) را پردازش کند.
در آزمایشهای مختلف، Hunyuan-Large نتایج بسیار خوبی داشته و حتی بهتر از بسیاری از مدلهای معروف مثل Llama 3 و Mistral عمل کرده است. بهطور خاص در کارهایی مثل درک متنهای پیچیده، پاسخ به پرسشهای منطقی، مسائل ریاضی و برنامهنویسی، دقت بالایی نشان داده.
مدل Hunyuan-T1
مدل Hunyuan-T1 یکی از جدیدترین مدلهای تنسنت است که برای حل مسائل پیچیده و انجام تحلیلهای عمیق طراحی شده است، مخصوصاً در زبان چینی. این مدل با استفاده از معماری پیشرفته و ترکیب چند “کارشناس” هوشمند، میتواند بهطور هوشمند تصمیم بگیرد که کدام بخش از مغز مصنوعیاش را فعال کند.
Hunyuan-T1 روی حجم بسیار زیادی از دادهها آموزش دیده و میتواند متنهایی به اندازه یک رمان بلند را در یکبار پردازش کند. سرعت بالا، دقت زیاد و توانایی استدلال از ویژگیهای مهم آن است. البته زیاد خوشحال نوشید، فعلاً فقط کاربران چینی میتوانند از آن استفاده کنند و ثبتنام در آن نیاز به شماره موبایل چین دارد که ما نداریم.
Hunyuan در یک نگاه
مدلهای هوش مصنوعی Hunyuan مجموعهای پیشرفته از ابزارهای زبانی، تصویری و ویدئویی هستند که توسط شرکت چینی Tencent توسعه یافتهاند. این مجموعه شامل مدلهایی برای تولید ویدئو از متن یا تصویر، ساخت مدلهای سهبعدی و مدلهای زبانی قدرتمند مانند Hunyuan-T1 و Hunyuan-Large است. Hunyuan با بهرهگیری از معماریهای نوین و دادههای گسترده، عملکردی چشمگیر در درک زبان، استدلال منطقی و تولید محتوای چندرسانهای ارائه میدهد. اگرچه دسترسی جهانی به این مدلها هنوز محدود است، اما کیفیت و نوآوری آنها Hunyuan را به یکی از جدیترین بازیگران هوش مصنوعی در جهان تبدیل کرده است.