نسخه جدید Veo 3.1 از سوی گوگل رسماً عرضه شد و حالا ممکن است دوباره اپلیکیشن Gemini را به صدر فهرست محبوبترین ابزارهای هوش مصنوعی بازگرداند. در این بهروزرسانی، مولد ویدیوی هوش مصنوعی گوگل از قابلیتهایی چون ویرایش در سطح اشیا، کنترل چند تصویری صحنه، انتقال نرم بین فریم اول و آخر و صدای پسزمینه باکیفیتتر پشتیبانی میکند. این ویژگیها کنترل خلاقانهی بیشتری را در اختیار کاربران قرار میدهند و نتیجه نهایی، ویدیوهایی با کیفیتی سینمایی در هر درخواست است.
به زبان ساده، اگر Sora 2 را بتوان «تیکتاکِ دنیای هوش مصنوعی» نامید، Veo 3.1 بدون تردید «نتفلیکسِ هوش مصنوعی» است و شاید کاربردیترین مولد ویدیوی مبتنی بر هوش مصنوعی که تاکنون عرضه شده است.
Veo 3.1 سریعتر و هوشمندتر از همیشه است
در حالی که در Sora 2 فقط همان چیزی را دریافت میکنید که سیستم تولید میکند، در Veo 3.1 شما میتوانید دقیقاً آنچه میخواهید ببینید را شکل دهید، تنظیم کنید و تغییر دهید. گوگل در واقع قدرت فیلمسازی را در دستان کاربران قرار داده، با وضوح بالاتر، سرعت بیشتر و کنترل کاملتر.
ابزارهای جدید شامل موارد زیر است:
- افزودن یا حذف اشیا از هر صحنه (مشابه قابلیت Content-Aware Fill در ویدیو).
- گسترش ویدیو فراتر از پایان اصلی آن با حفظ صدای محیطی (مثل صدای موج دریا) برای تداوم طبیعی.
- ایجاد انتقال میان دو تصویر ثابت و تبدیل آنها به مقدمه یا پایانبندی سینمایی.
- کنترل سبک و حس کلی صحنه با چند تصویر مرجع، از کاراکترها و اشیا تا حالوهوا.
ویرایش در سطح اشیا
یکی از جذابترین قابلیتهای تازه، ویرایش دقیق در سطح شیء است که به کاربر اجازه میدهد با افزودن یا حذف افراد، مناظر یا اشیا داستان را تغییر دهد. قابلیت Insert Object هماکنون فعال است و ویژگی Remove Object نیز بهزودی در دسترس قرار میگیرد. بهواسطهی این ابزارها، میتوانید مانند یک تدوینگر واقعی، با حداقل تلاش، صحنه را مطابق میل خود ویرایش کنید.
برای مثال، میتوانید در یک جنگل، یک جغد و درخت اضافه کنید بدون آنکه سایر اجزا تغییر کنند یا اگر داستانتان به سمت علمیتخیلی میرود، ماشین را با سفینه جایگزین کنید. همچنین میتوانید هر عنصر نامطلوبی را تنها با اشاره و دستور از صحنه حذف کنید. Veo 3.1 نورپردازی و سایهها را به طور خودکار تنظیم میکند تا ویرایشها طبیعی و یکدست به نظر برسند.
چهار ابزاری که Sora ندارد
تفاوت اصلی Veo در ابزارهای ماژولار و حرفهای آن است که هوش مصنوعی را به بخشی واقعی از فرایند ساخت ویدیو تبدیل میکند:
Ingredients to Video: چند تصویر مرجع به Veo بدهید و سیستم آنها را به یک صحنهی منسجم تبدیل میکند. شما سبک، اشیا و شخصیتها را تعیین میکنید و Veo تصویر ذهنیتان را میسازد.
First & Last Frame: با دو تصویر ثابت، یک ویدیو انتقالی میان آنها بسازید، مناسب برای تغییر فضا، ورود دراماتیک یا جابهجایی ناگهانی.
Scene Extension: ادامهی ویدیوی موجود شما را با همان سبک بصری و صدای پسزمینه تولید میکند.
Insert/Remove Object: ابزارهای کلیدی که امکان ساخت جهان و روایت دقیق را فراهم میکنند، چه برای پاکسازی صحنه و چه افزودن عناصر تازه.
صدای واقعگرایانهتر برای روایت بهتر
بهجز کیفیت بالاتر تصویر، Veo 3.1 صدای پسزمینه را نیز بهبود داده است. مدل جدید از درک بهتر روایت برخوردار است و ساختار سینمایی را طبیعیتر دنبال میکند. صحنهها اکنون دارای حس، ریتم و تنالیتهی مشخصاند.
در حالی که Sora هنوز در هماهنگی صدا و ریتم مشکل دارد، Veo 3.1 با درک زمینه و مفهوم، به کاربر کمک میکند صحنهای بسازد که مانند یک دستیار کارگردان واقعی طراحی شده است.
چگونه Veo 3.1 را امتحان کنیم
میتوانید نسخهی Veo 3.1 و Veo 3.1 Fast را از طریق چند پلتفرم گوگل تجربه کنید:
- Flow
- Vertex AI
- Gemini API
- Gemini App
- Google Vids
در حال حاضر قابلیت Insert Object در Flow، Vertex AI و Gemini API فعال است و ویژگی Remove Object نیز بهزودی منتشر میشود.
سخن پایانی
اگر از ساخت ویدیوهای تولیدشده با هوش مصنوعی لذت میبرید، Veo 3.1 را حتماً امتحان کنید. این بهروزرسانی نشان میدهد کنترل، تداوم و خلاقیت تا چه اندازه میتواند در دست کاربر باشد و شاید گوگل با این نسخه، آیندهی تولید ویدیوهای هوش مصنوعی را دوباره تعریف کرده باشد.