نسخه Veo 3.1 از راه رسید؛ ابزاری سریع‌تر و بهتر نسبت به Sora 2

نسخه جدید Veo 3.1 از سوی گوگل رسماً عرضه شد و حالا ممکن است دوباره اپلیکیشن Gemini را به صدر فهرست محبوب‌ترین ابزارهای هوش مصنوعی بازگرداند. در این به‌روزرسانی، مولد ویدیوی هوش مصنوعی گوگل از قابلیت‌هایی چون ویرایش در سطح اشیا، کنترل چند تصویری صحنه، انتقال نرم بین فریم اول و آخر و صدای پس‌زمینه باکیفیت‌تر پشتیبانی می‌کند. این ویژگی‌ها کنترل خلاقانه‌ی بیشتری را در اختیار کاربران قرار می‌دهند و نتیجه نهایی، ویدیوهایی با کیفیتی سینمایی در هر درخواست است.

به زبان ساده، اگر Sora 2 را بتوان «تیک‌تاکِ دنیای هوش مصنوعی» نامید، Veo 3.1 بدون تردید «نتفلیکسِ هوش مصنوعی» است و شاید کاربردی‌ترین مولد ویدیوی مبتنی بر هوش مصنوعی که تاکنون عرضه شده است.

Veo 3.1 سریع‌تر و هوشمندتر از همیشه است

در حالی که در Sora 2 فقط همان چیزی را دریافت می‌کنید که سیستم تولید می‌کند، در Veo 3.1 شما می‌توانید دقیقاً آنچه می‌خواهید ببینید را شکل دهید، تنظیم کنید و تغییر دهید. گوگل در واقع قدرت فیلم‌سازی را در دستان کاربران قرار داده، با وضوح بالاتر، سرعت بیشتر و کنترل کامل‌تر.

ابزارهای جدید شامل موارد زیر است:

افزودن یا حذف اشیا از هر صحنه (مشابه قابلیت Content-Aware Fill در ویدیو).
گسترش ویدیو فراتر از پایان اصلی آن با حفظ صدای محیطی (مثل صدای موج دریا) برای تداوم طبیعی.
ایجاد انتقال میان دو تصویر ثابت و تبدیل آن‌ها به مقدمه یا پایان‌بندی سینمایی.
کنترل سبک و حس کلی صحنه با چند تصویر مرجع، از کاراکترها و اشیا تا حال‌وهوا.

ویرایش در سطح اشیا

یکی از جذاب‌ترین قابلیت‌های تازه، ویرایش دقیق در سطح شیء است که به کاربر اجازه می‌دهد با افزودن یا حذف افراد، مناظر یا اشیا داستان را تغییر دهد. قابلیت Insert Object هم‌اکنون فعال است و ویژگی Remove Object نیز به‌زودی در دسترس قرار می‌گیرد. به‌واسطه‌ی این ابزارها، می‌توانید مانند یک تدوینگر واقعی، با حداقل تلاش، صحنه را مطابق میل خود ویرایش کنید.

برای مثال، می‌توانید در یک جنگل، یک جغد و درخت اضافه کنید بدون آنکه سایر اجزا تغییر کنند یا اگر داستانتان به سمت علمی‌تخیلی می‌رود، ماشین را با سفینه جایگزین کنید. همچنین می‌توانید هر عنصر نامطلوبی را تنها با اشاره و دستور از صحنه حذف کنید. Veo 3.1 نورپردازی و سایه‌ها را به طور خودکار تنظیم می‌کند تا ویرایش‌ها طبیعی و یک‌دست به نظر برسند.

چهار ابزاری که Sora ندارد

تفاوت اصلی Veo در ابزارهای ماژولار و حرفه‌ای آن است که هوش مصنوعی را به بخشی واقعی از فرایند ساخت ویدیو تبدیل می‌کند:

Ingredients to Video: چند تصویر مرجع به Veo بدهید و سیستم آن‌ها را به یک صحنه‌ی منسجم تبدیل می‌کند. شما سبک، اشیا و شخصیت‌ها را تعیین می‌کنید و Veo تصویر ذهنی‌تان را می‌سازد.

First & Last Frame: با دو تصویر ثابت، یک ویدیو انتقالی میان آن‌ها بسازید، مناسب برای تغییر فضا، ورود دراماتیک یا جابه‌جایی ناگهانی.

Scene Extension: ادامه‌ی ویدیوی موجود شما را با همان سبک بصری و صدای پس‌زمینه تولید می‌کند.

Insert/Remove Object: ابزارهای کلیدی که امکان ساخت جهان و روایت دقیق را فراهم می‌کنند، چه برای پاک‌سازی صحنه و چه افزودن عناصر تازه.

صدای واقع‌گرایانه‌تر برای روایت بهتر

به‌جز کیفیت بالاتر تصویر، Veo 3.1 صدای پس‌زمینه را نیز بهبود داده است. مدل جدید از درک بهتر روایت برخوردار است و ساختار سینمایی را طبیعی‌تر دنبال می‌کند. صحنه‌ها اکنون دارای حس، ریتم و تنالیته‌ی مشخص‌اند.

در حالی که Sora هنوز در هماهنگی صدا و ریتم مشکل دارد، Veo 3.1 با درک زمینه و مفهوم، به کاربر کمک می‌کند صحنه‌ای بسازد که مانند یک دستیار کارگردان واقعی طراحی شده است.

چگونه Veo 3.1 را امتحان کنیم

می‌توانید نسخه‌ی Veo 3.1 و Veo 3.1 Fast را از طریق چند پلتفرم گوگل تجربه کنید:

Flow
Vertex AI
Gemini API
Gemini App
Google Vids

در حال حاضر قابلیت Insert Object در Flow، Vertex AI و Gemini API فعال است و ویژگی Remove Object نیز به‌زودی منتشر می‌شود.

سخن پایانی

اگر از ساخت ویدیوهای تولیدشده با هوش مصنوعی لذت می‌برید، Veo 3.1 را حتماً امتحان کنید. این به‌روزرسانی نشان می‌دهد کنترل، تداوم و خلاقیت تا چه اندازه می‌تواند در دست کاربر باشد و شاید گوگل با این نسخه، آینده‌ی تولید ویدیوهای هوش مصنوعی را دوباره تعریف کرده باشد.