هوش مصنوعی Wan حالا با انتشار نسخه Wan 2.1 به رقابت با بزرگان برخواسته است. این ابزار ساخت ویدئو با استفاده از هوش مصنوعی با کیفیت قابل توجه و استفاده ساده توجهات بسیاری را به خود جلب کرده است. در این مقاله به صورت کامل به معرفی هوش مصنوعی Wan میپردازیم و ویژگیهای آن را بررسی میکنیم و استفاده از آن را آموزش میدهیم.
هوش مصنوعی Wan، ابزاری برای ساخت ویدئو و عکس
هوش مصنوعی Wan ابزاری است که هم عکس و هم ویدئو برای شما میسازد. این هوش مصنوعی که متعلق به شرکت Alibaba است، در نسخه Wan 2.1 موفق شده است توجهات بسیاری را به خود جلب کند. این مدل به صورت متن باز یا Open source منتشر شده است و هم در هاگینگ فیس و هم در سایت رسمی آن در دسترس است.
مدل هوش مصنوعی Wan 2.1
مدل هوش مصنوعی Wan 2.1، در نسخههای مختلفی ارائه شده است. جدول زیر این مدلها را به صورت مختصر معرفی میکند.
نسخه | نوع | تعداد پارامترها | وضوح خروجی | ویژگیها | نیازمندیهای VRAM | عملکرد |
---|---|---|---|---|---|---|
Wan2.1-I2V-14B-480P | تصویر به ویدئو | ۱۴ میلیارد | ۴۸۰P | تولید صحنههای بصری پیچیده و الگوهای حرکتی بر اساس متن و تصاویر ورودی | بالا | عملکرد بهتر نسبت به مدلهای بسته و متنباز موجود |
Wan2.1-I2V-14B-720P | تصویر به ویدئو | ۱۴ میلیارد | ۷۲۰P | مشابه نسخه ۴۸۰P با وضوح بالاتر | بسیار بالا | دستیابی به عملکرد پیشرفته (SOTA) |
Wan2.1-T2V-14B | متن به ویدئو | ۱۴ میلیارد | ۴۸۰P و ۷۲۰P | تنها مدل ویدئویی قادر به تولید متن به هر دو زبان چینی و انگلیسی | بالا | تعیین استاندارد جدید در عملکرد بین مدلهای متنباز و بسته |
Wan2.1-T2V-1.3B | متن به ویدئو | ۱٫۳ میلیارد | ۴۸۰P | طراحی شده برای GPUهای مصرفی، عملکرد بهتر نسبت به مدلهای متنباز بزرگتر | ۸٫۱۹ گیگابایت | تولید ویدئوی ۵ ثانیهای ۴۸۰P در ۴ دقیقه با RTX 4090 |
ساخت عکس با هوش مصنوعی Wan
مدل Wan 2.1 که در سایت Wan نیز در دسترس است، عملکرد بسیار خوبی در ساخت عکس با هوش مصنوعی از خود نشان داده است.
برای مقایسه، دو تصویر زیر با هوش مصنوعی Wan 2,1 و هوش مصنوعی Flux با یک پرامپت ساخته شدهاند.
ویژگی جالب تصویر ساخته شده با هوش مصنوعی Wan 2.1، نور طبیعی است. که باعث شده است تصویر شبیه تصاویر خبری از میادین جنگ شود. در حالی که تصویر Flux به صورت پیشفرص در حالت سینمایی ساخته شده است. با این وجود، جزئیات در تصویر Flux بهتر است. به عنوان نمونه، در تصویر ساخته شده با Wan 2.1، در حالی که دستکش در دست سرباز است، اما انگشت او مشخص است.
ساخت ویدئو با هوش مصنوعی Wan
با هوش مصنوعی Wan میتوانید هم از متن و هم از تصویر، ویدئوهای جذاب بسازید. برای استفاده کافیست به سایت Wan سر بزنید و متن خود را بنوسید و ویدئو بسازید. نکته منفی در مورد این هوش مصنوعی، سرعت پایین آن در ساخت ویدئو است. در بررسیهای اولیه ما، زمان ساخت ویدئو ۹ ساعت تخمین زده شد. عددی که اصلا قابل پذیرش نیست. ابزارهایی نظیر Runway یا Krea به خوبی و در سرعت بسیار بالاتری میتوانند برای شما ویدئو بسازند.
آموزش کار با هوش مصنوعی Wan
اگر میخواهید هوش مصنوعی Wan 2.1 را امتحان کنید، میتوانید از طریق سایت رسمی wan و همچنین پلتفرم هاگینگ فیس و مدل اسکوپ اقدام کنید.
برای استفاده از طریق سایت رسمی، کافیست به آدرس Wan.video بروید و حساب کاربری خود را به رایگان بسازید. از منو سمت چپ، گزینههای ساخت تصور و ساخت ویدئو به راحتی در دسترس است که میتوانید در هر کدام از آنها، با نوشتن پرامپت خود، عکس یا ویدئو خود را بسازید.
قیمت و هزینه
مدل هوش مصنوعی Wan به صورت رایگان و اوپن سورس منتشر شده است. اما طبیعی است که نیاز به پردازش سنگین برای شرکتها، این امکان را نمیدهد که آن را به رایگان در اختیار کاربران قرار دهند.
در سایت رسمی Wan به آدرس Wan.video، شما میتوانید به صورت محدود در روز این این هوش مصنوعی استفاده کنید و به ازای هر استفاده، میزان مشخصصی از کردیت یا اعتبار شما کاسته میشود.
هوش مصنوعی Wan در یک نگاه
هوش مصنوعی شرکت علی بابا کیفیت خوبی را از خود نشان داده است. در ساخت تصویر شاید نتوانند رقبا را پشت سر بگذارد اما میتواند با برخی از آنها رقابت کند. در ساخت ویدئو نیز کیفیت نسبتا مناسبی دارد، به ویژه اگر جلوههای صوتی را نیز همراه ویدئو بخواهید، اما باید برای ساخته شدن ویدئو حسابی صبر کنید.
با توجه به رقبای بهتر نظیر Krea (مدلهای مختلفی که در کریا وجود دارند) و رانوی، هوش مصنوعی Wan گزینه جذابی برای استفاده حرفه ای به حساب نمیآید.