مایکروسافت بهتازگی مدل جدید تولید تصویر خود با نام MAI-Image-1 را معرفی کرده است؛ نخستین مدل تولید تصویر کاملاً داخلی شرکت که اکنون در رتبهبندی سایت مستقل LMArena در کنار برترین مدلهای جهان مانند Gemini’s Imagen و ChatGPT قرار گرفته است.
برای کسانی که با LMArena آشنا نیستند، این پلتفرم مانند جدول بیلبورد برای موسیقی است، با این تفاوت که بهجای آهنگها، کیفیت مدلهای تولید تصویر هوش مصنوعی را رتبهبندی میکند. شرکتها و پروژههای متنباز مدلهای خود را ارسال میکنند و کاربران واقعی از طریق مقایسهی دو تصویر در کنار هم رأی میدهند که کدام بهتر است. مدلی که رأی بیشتری بگیرد، در رتبهبندی بالا میرود.
مایکروسافت اعلام کرده MAI-Image-1 در نخستین حضور خود در میان ۱۰ مدل برتر جهان قرار گرفته است؛ یعنی در آزمایشهای مقایسهای کور، عملکردی بهتر از بسیاری از رقبا داشته و حالا یکی از بهترین مولدهای تصویر بر اساس بازخورد عمومی محسوب میشود.
چگونه از MAI-Image-1 استفاده کنیم
شروع کار بسیار ساده است و به هیچ اشتراکی نیاز ندارد، تنها با ورود به حساب کاربری مایکروسافت میتوانید تصاویر خود را دنبال کنید.
- وارد com/images/create شوید (یا در اپلیکیشن Copilot به بخش Image Creator بروید).
- متن موردنظر خود (prompt) را وارد کنید.
- روی Create کلیک کنید و چند ثانیه صبر کنید تا ۳ یا ۴ نسخه متفاوت تولید شود.
- تصویر دلخواه را دانلود یا ویرایش کنید.
این مدل همچنین در ابزارهای Microsoft Designer و PowerPoint ادغام شده است تا بتوانید از طریق فرمانهای زبانی ساده، تصاویر مناسب برای ارائهها، شبکههای اجتماعی یا تخته بوردهای مفهومی ایجاد کنید.
ویژگیهای کلیدی MAI-Image-1
مایکروسافت میگوید در توسعهی این مدل، انتخاب دادهها و ارزیابی کیفی با تمرکز بر کاربردهای واقعی در اولویت بوده است:
واقعگرایی بصری: بهبود نورپردازی، بازتابها و مناظر طبیعی.
سرعت و کیفیت: چرخهی تولید سریعتر از مدلهای بزرگتر و کندتر.
آموزش خلاقانه: استفاده از بازخورد متخصصان صنایع خلاق بهجای صرفاً دادههای عمومی.
کاربران میتوانند از این ابزار برای نمونهسازی ایدهها، طراحیهای گرافیکی و خلق محتوای بصری استفاده کنند. پس از انتخاب بهترین تصویر، امکان ویرایش آن در نرمافزارهایی مانند Photoshop، Figma یا Illustrator نیز وجود دارد.
پنج دستور برای امتحان در MAI-Image-1
۱. سازهها
پرامپت:
«یک تصویر فوتو رئالیستی از خط افق شهری آیندهنگر در غروب، با ساختمانهای شیشهای و خودروهای پرنده بر فراز شهر، در سبک سینمایی و زاویهی دید باز ایجاد کن.»
این دستور میزان خلاقیت و توانایی مدل در ایجاد جزئیات نوری و عناصر تخیلی را میسنجد و نتایج MAI-Image-1 در این زمینه در حد بهترین مدلهای بازار است.
۲. آثار آشپزی
پرامپت:
«تصویر نزدیک از یک غذای گیاهی لوکس روی بشقاب سرامیکی مشکی، با نور طبیعی از کنار، پسزمینه مینیمال و وضوح بالا تولید کن.»
نتیجه: زاویهها و چیدمانهای مختلف غذا به شکل طبیعی و دقیق نمایش داده شدند.
۳. تصاویر بازاریابی
پرامپت:
«تصویری با کنتراست بالا برای کمپین تبلیغاتی یک استارتاپ فناوری بساز: چهار نفر از تیم متنوع در حال طوفان فکری دور یک نمایشگر هولوگرافیک با نورپردازی نئون.»
تصویر اولیه کمی تاریک بود، اما با تغییر جزئی در پرامپت، میتوان وضوح و روشنایی بیشتری به دست آورد.
۴. حیوانات و طبیعت
پرامپت:
«صحنهای آرام از حیات وحش تصویر کن: یک روباه قرمز در حال عبور از جنگلی مهآلود در سپیدهدم، با نور طلایی ساعت جادویی، بافت موی بسیار دقیق و عمق میدان کم.»
تصویر حاصل بهقدری طبیعی است که تشخیص واقعگرایی آن دشوار است، عملکردی در حد ChatGPT و Midjourney.
۵. طراحی استوریبورد
Prompt:
«یک استوری بورد سهقسمتی بساز که تحول فرایند ویرایش را از دفترچههای کاغذی به لپتاپ و سپس دستیار هوش مصنوعی هولوگرافیک نشان دهد؛ در سبک شرکتی تمیز و مدرن.»
نتیجهی نهایی نقطهی شروع خوبی دارد و با ترکیب MAI-Image-1 با ابزارهایی مانند Mixboard میتوان خروجی را به محصولی حرفهایتر تبدیل کرد.
چشمانداز MAI-Image-1
مدل جدید مایکروسافت گامی مهم در حوزهی هوش مصنوعی تصویری است؛ سریع، در دسترس و سازگار با نیازهای واقعی طراحان. هرچند هنوز نمیتوان گفت از رقبایی مانند Nano Banana برتر است، اما نتایج اولیه بسیار امیدوارکنندهاند. اگر با هوش مصنوعی محتوا تولید میکنید، MAI-Image-1 میتواند ابزار ارزشمندی در جعبهابزار شما باشد.




