میدجرنی (Midjourney) که یکی از محبوبترین استارتاپهای تولید تصویر با هوش مصنوعی است، به تازگی از عرضه مدل پر انتظار تولید ویدیو با هوش مصنوعی خود با نام V1 خبر داد. مدل هوش مصنوعی V1 یک مدل تصویر به ویدیو است که در آن کاربران میتوانند یک تصویر بارگذاری کنند یا تصویری را که با یکی از مدلهای دیگر میدجرنی تولید شده، انتخاب کنند و سپس، V1 بر اساس آن، مجموعهای از چهار ویدیوی پنجثانیهای تولید میکند. درست مانند مدلهای تصویر میدجرنی، مدل V1 نیز تنها از طریق دیسکورد در دسترس است و در زمان عرضه فقط از طریق وب قابل استفاده خواهد بود.
میدجرنی در همین رابطه گفته: «مدل ویدیویی V1، یک ابزار سرگرمکننده، آسان و زیباست. با هزینه ۱۰ دلار در ماه، نخستین مدل ویدیویی برای همه است و هماکنون در دسترس قرار دارد.»
عرضه مدل تولید ویدیو V1، میدجرنی را وارد رقابت با دیگر مدلهای تولید ویدیو با هوش مصنوعی کرده است، از جمله مدل Sora از شرکت OpenAI، مدل Gen 4 از شرکت Runway، مدل Firefly از شرکت Adobe و همچنین مدل Veo 3 از شرکت Google. در حالی که بسیاری از شرکتها تمرکز خود را بر توسعه مدلهای قابلکنترل برای کاربردهای تجاری گذاشتهاند، میدجرنی همواره به خاطر مدلهای تصویر منحصربهفرد خود که مخاطبان خلاق را هدف قرار میدهد، شناخته شده است.
میدجرنی میگوید اهداف بلندتری برای مدلهای ویدیویی خود دارد و هدف آن فراتر از تولید ویدیوهای B-roll برای فیلمهای هالیوودی یا تبلیغات تجاری است. دیوید هولتز، مدیرعامل میدجرنی، در یک پست وبلاگی گفته که مدل ویدیویی این شرکت گام بعدی در مسیر نهایی آن است: ساخت مدلهایی با قابلیت «شبیهسازی جهان باز بهصورت بلادرنگ».
پس از مدلهای ویدیویی با هوش مصنوعی، میدجرنی قصد دارد مدلهایی برای تولید رندرهای سهبعدی و همچنین مدلهای بلادرنگ توسعه دهد. عرضه مدل V1 تنها یک هفته پس از آن صورت میگیرد که این استارتاپ با شکایت دو استودیوی مشهور هالیوودی یعنی دیزنی و یونیورسال مواجه شد. در این شکایت آمده است که تصاویر تولید شده توسط مدلهای تصویر هوش مصنوعی میدجرنی شخصیتهای دارای کپیرایت این استودیوها، مانند هومر سیمپسون و دارث ویدر را به تصویر میکشند.
استودیوهای هالیوودی مدتهاست که با افزایش محبوبیت مدلهای تولید تصویر و ویدیو با هوش مصنوعی، مانند مدلهای میدجرنی، دستوپنجه نرم میکنند. نگرانی فزایندهای وجود دارد مبنی بر اینکه این ابزارها میتوانند جایگزین خلاقان انسانی شده یا ارزش کار آنها را کاهش دهند. چندین شرکت رسانهای نیز ادعا کردهاند که این مدلها با استفاده از آثار دارای حق کپیرایت آنها آموزش دیدهاند.
در حالی که میدجرنی تلاش کرده خود را متفاوت از دیگر استارتاپهای تولید تصویر و ویدیو معرفی کند، آن هم با تمرکز بیشتر بر خلاقیت تا کاربردهای فوری تجاری اما این شرکت نیز نتوانسته از این اتهامات در امان بماند. میدجرنی اعلام کرده است که هزینه تولید ویدیو با V1 هشت برابر تولید یک تصویر معمولی خواهد بود، به این معنی که مشترکان سهمیه ماهانه خود را بسیار سریعتر هنگام ساخت ویدیو مصرف میکنند.
در زمان عرضه، ارزانترین راه برای تجربه V1، اشتراک در طرح پایه ۱۰ دلاری میدجرنی در ماه است. مشترکان طرح Pro به مبلغ ۶۰ دلار در ماه و طرح Mega به مبلغ ۱۲۰ دلار در ماه میتوانند بهصورت نامحدود ویدیو تولید کنند، البته تنها در حالت کندتر موسوم به Relax. میدجرنی اعلام کرده که طی یک ماه آینده، قیمتگذاری مدل ویدیویی خود را بازنگری خواهد کرد.
مدل V1 چند گزینه سفارشیسازی دارد که به کاربران اجازه میدهد خروجی ویدیو را کنترل کنند. کاربران میتوانند تنظیم انیمیشن خودکار را انتخاب کنند تا تصویر به طور تصادفی حرکت کند، یا حالت دستی را برگزینند که به آنها اجازه میدهد با نوشتن متن، نوع خاصی از انیمیشن را به ویدیوی خود اضافه کنند. همچنین کاربران میتوانند میزان حرکت دوربین و سوژه را با انتخاب گزینههای «حرکت کم» یا «حرکت زیاد» تنظیم کنند.
اگرچه ویدیوهای تولیدشده با V1 تنها پنج ثانیه طول دارند، کاربران میتوانند آنها را تا چهار بار و هر بار بهاندازه چهار ثانیه افزایش دهند؛ بنابراین طول یک ویدیو میتواند به حداکثر ۲۱ ثانیه برسد. درست مانند مدلهای تصویر هوش مصنوعی میدجرنی، دموهای اولیه V1 نیز جلوهای فراواقعگرایانه دارند و نه واقعگرایانه. واکنش اولیه به V1 مثبت بوده، گرچه هنوز مشخص نیست این مدل تا چه اندازه در برابر دیگر مدلهای پیشرفته ویدیو با هوش مصنوعی که ماهها یا حتی سالهاست در بازار حضور دارند، رقابتپذیر است.