مدلهای هنری هوش مصنوعی مانند Midjourney و Nano Banana میتوانند با تصاویر عجیب، خلاقانه و چشمگیر ما را شگفتزده کنند. اما یک مطالعه تازه نشان میدهد آنچه «خلاقیت» این مدلها نامیده میشود، چیزی جز ریاضیات نیست و اگر نویسنده، طراح یا موزیسین باشید، این خبر میتواند مایه آرامش باشد.
من باز هم تأکید میکنم: هوش مصنوعی خلاق نیست. درست است که میتواند تصاویر شگفتانگیز خلق کند یا حتی داستانی هوشمندانه کنار هم بگذارد، اما چیزی که ندارد همان جوهره انسانی درک و تخیل است. چیزی که خلاقیت را فراتر از «تولید محتوا» میبرد. اینترنت پر شده از محتوای ترکیبی که بخش زیادی از آن بهوسیله هوش مصنوعی تولید شده است.
در هفتههای اخیر Nano Banana به یک ترند جهانی تبدیل شد. هر بار که به آن دستوری میدهید، چیزی عجیب، بامزه و اغلب حیرتانگیز تولید میکند. اما تحقیقات جدید نشان میدهد خلاقیتی که در مدلهایی مانند Nano Banana، Midjourney و سایر تولیدکنندههای تصویر دیده میشود، در واقع محصول یک ریاضیات ساده است. به زبان دیگر، چیزی که ما آن را «خلاقیت» مینامیم، تنها یک فرایند فنی است.
خلاقیت مصنوعی چگونه کار میکند؟
دانشمندان با بررسی ساختار این مدلها دریافتند که ظاهر خلاقانه آنها به دو عامل کلیدی برمیگردد:
ناحیهای (Locality): هوش مصنوعی کل تصویر را یکجا نمیبیند. وقتی میگویید «گربهای با عینک آفتابی روی اسکیت برد»، مدل بخش به بخش تصویر را میسازد، مثل کسی که اول یک گوشه از پازل را میچیند و بعد به عقب برمیگردد تا کل تصویر دیده شود.
همتغییری (Equivariance): به معنای ثبات و هم حرکتی است. اگر بخشی از ورودی جابهجا شود، خروجی هم با همان حرکت جابهجا میشود؛ مثل کشیدن یک شابلون روی کاغذ.
این دو ویژگی باعث میشود مدل بارها و بارها قطعات کوچک را با هم ترکیب کند تا در نهایت تصویری تازه ظاهر شود. جالب آنکه محققان حتی یک نسخه ساده و بدون داده آموزشی ساختند که باز هم تصاویری شبیه نمونههای بزرگ تولید کرد.
یک هشدار برای خلاقان واقعی
برای نویسندگان، طراحان، موسیقیدانها و دیگر هنرمندان، نتایج این تحقیق چندان عجیب نیست. چیزی که همیشه میدانستیم حالا علمیتر ثابت شد: هوش مصنوعی قابل پیشبینی است، حتی بیشتر از آنچه فکر میکردیم.
مدلها همیشه در مرزهایی مشخص، مانند سبک یا ژانر، فعالیت میکنند. اما انسانها میتوانند تصمیم بگیرند این قواعد را بشکنند، از سبک فاصله بگیرند یا جرقهای سرکش را وارد اثر کنند. این همان بخشی است که هنوز در انحصار ماست.
هرچند به نظر میرسد ماشینها در حال نزدیک شدن به تواناییهای ما هستند، این مطالعه یادآور میشود که «تخیل» آنها همیشه مکانیکی خواهد بود. آنها فقط تکهها را بازترکیب میکنند، نه اینکه چیزی نو بیافرینند.
اهمیت مطالعه روی هوش مصنوعی
این نخستین تحقیق از نوع خود است که بررسی میکند چرا مدلهای تولید تصویر هوش مصنوعی میتوانند به نظر «خلاق» برسند. نتیجه آن کمک میکند تا درک بهتری از نحوه هدایت، کنترل و ارزیابی این فناوری برای تنوع و امنیت داشته باشیم. این یافتهها به ما پایهای قوی میدهد تا بتوانیم مدلها را بهتر مدیریت کنیم، چه در مقیاس و چه در روش ترکیب اجزاء و مرزهای آنها را بشناسیم.
سخن پایانی
این مطالعه خبر خوبی برای فعالان هنر است: چیزی که اثر شما را متمایز میکند، همچنان در خطر خودکارسازی نیست. ماشینها فقط در مرزها بازی میکنند؛ انسانها هستند که تصمیم میگیرند چه زمانی قوانین را بشکنند، کش بدهند یا حتی کاملاً دور بیندازند. در پایان باید گفت که جرقه واقعی خلاقیت، شجاعت برای شکستن قواعد و خلق چیزی که هرگز وجود نداشته، هنوز در اختیار ماست.