چهارشنبه, ۲۲ مرداد ۱۴۰۴
  • EN
  • تبلیغات
  • تماس با ما
  • درباره ما
فوت و فن
  • دانش و فن
    • موبایل و تبلت
    • هوش مصنوعی
    • اپراتورها و وب
    • برنامه و نرم افزار
    • دنیای بازی
    • گوناگون
      • تلویزیون
      • سخت افزار
  • اقتصاد
    • اقتصاد بین الملل
    • بازارها
    • بانکداری و تجارت الکترونیک
    • خودرو
    • وبگردی
    • رپورتاژ
  • ورزش
    • فوتبال
    • موتوری
  • سبک زندگی
    • سلامت
    • تغذیه
    • طبیعت
    • حیوانات
    • آشپزی
    • خلاقیت
  • گردشگری
    • گردشگری
  • فرهنگ و هنر
    • فیلم و سریال
    • کتاب و مجله
    • آثار باستانی
    • صنایع دستی
  • چند رسانه‌ای
    • عکس
    • ویدیو
    • خودمونی
    • همیاری
هوش مصنوعی

عملکرد واقعی GPT-5؛ چرا مدل جدید OpenAI همه را شگفت‌زده نکرد؟

شهاب الدین حدیدی 22 مرداد 1404
A+A-
Reset
GPT-5
1

معرفی GPT-5 با وعده‌های بزرگ

شرکت OpenAI هفته گذشته با هیجان فراوان از مدل جدید هوش مصنوعی خود، GPT-5، رونمایی کرد. مدیرعامل این شرکت، سم آلتمن، این مدل را «قوی‌ترین، سریع‌ترین و قابل‌اعتمادترین» مدلی که تاکنون توسعه داده‌اند توصیف کرد. او همچنین وعده داد که مشکل رایج در سیستم‌های هوش مصنوعی موسوم به «توهم» یا اطلاعات ساختگی در این نسخه به حداقل خواهد رسید.

شکاف بین وعده‌ها و واقعیت

با وجود این ادعاها، گزارش‌های اولیه کاربران و نتایج تست‌های مستقل که توسط وب‌سایت آمریکایی Axios منتشر شد، نشان داد که عملکرد GPT-5 به اندازه‌ای که انتظار می‌رفت چشمگیر نبوده است.

آلتمن اعلام کرده بود که حتی کاربران رایگان هم «سطح هوش در حد دکترا» را تجربه خواهند کرد. اما مشکلات فنی در روزهای ابتدایی عرضه، این تصویر را خدشه‌دار کرد. کاربران ChatGPT، اشتباهات مدل در پاسخ به پرسش‌های ساده ریاضی و جغرافیا را در شبکه‌های اجتماعی منتشر کرده و واکنش نشان دادند.

علت فنی مشکلات اولیه

به گفته آلتمن، دلیل این اتفاق این بود که درخواست‌های برخی کاربران به اشتباه به مدل‌های ضعیف‌تر هدایت شده و نسخه «استدلال پیشرفته» که از قدرت پردازشی بالاتری برخوردار است، فعال نشده بود. او اعلام کرد که این مشکل رفع شده و سیستم هدایت مدل (Model Routing) بهبود یافته است.

عملکرد GPT-5 در تست‌های توهم (Halüsinasyon)

نتایج مقایسه‌ای

پلتفرم Vectara که دقت پاسخ‌های هوش مصنوعی را ارزیابی می‌کند، عملکرد GPT-5 را با مدل‌های دیگر مقایسه کرده است:

  • GPT-4: نرخ توهم ۱٫۸٪
  • GPT-5: نرخ توهم ۱٫۴٪
  • GPT-4o: نرخ توهم ۱٫۳۱٪
  • o3-mini (High Reasoning): کمترین نرخ خطا با ۰٫۷۹۵٪

با اینکه GPT-5 نسبت به GPT-4 پیشرفت داشته، اختلاف آن محدود است. جالب اینجاست که مدل کوچک‌تر اما با توانایی استدلال بالاتر یعنی o3-mini High Reasoning دقیق‌ترین عملکرد را در بین همه مدل‌ها نشان داده است.

تردید در روند رشد هوش مصنوعی با مقیاس

دیدگاه منتقدان

تا پیش از این، باور غالب این بود که «هر چه مقیاس مدل بزرگ‌تر شود، هوش آن نیز افزایش می‌یابد». اما عرضه GPT-5 باعث شده برخی کارشناسان این فرضیه را زیر سؤال ببرند.

به عنوان مثال، گری مارکوس، منتقد حوزه هوش مصنوعی و نویسنده روزنامه The Guardian، گفته است:

«اگر هنوز کسی باور دارد که تنها با بزرگ‌تر کردن مدل می‌توان به AGI (هوش مصنوعی عمومی) رسید، بعد از این اتفاق باید دوباره فکر کند.»

برنامه‌های بعدی OpenAI

اقدامات اعلام‌شده

OpenAI برای رفع نواقص و بهبود تجربه کاربران اقدامات زیر را انجام داده است:

  • بازگشایی دسترسی به مدل‌های قدیمی‌تر مانند GPT-4o
  • افزایش تعداد کاربران دارای دسترسی به حالت استدلال پیشرفته
  • اضافه کردن قابلیت نمایش نام مدل استفاده‌شده در رابط کاربری ChatGPT
  • بازطراحی سیستم هدایت خودکار مدل (Auto-switcher)

نگرانی درباره پیوند عاطفی با هوش مصنوعی

آلتمن همچنین اشاره کرد که برخی کاربران با مدل‌های هوش مصنوعی ارتباط عاطفی برقرار می‌کنند. او گفت این موضوع را به‌طور جدی بررسی می‌کنند تا اطمینان حاصل شود که این وابستگی، سلامت روان کاربران را تهدید نکند.

نتیجه‌گیری

مدل GPT-5 گرچه پیشرفتی نسبی نسبت به نسل قبل داشته، اما آن جهش چشمگیری که بسیاری انتظار داشتند را ارائه نکرده است. رقابت در حوزه هوش مصنوعی همچنان داغ است و به نظر می‌رسد آینده بیشتر از آنکه به «بزرگ‌تر کردن مدل‌ها» وابسته باشد، به بهینه‌سازی استدلال و کاهش خطاها بستگی دارد.

GPT-5OpenAIتست توهمسم آلتمنمدل زبانیهوش مصنوعی
0 نظر FacebookTwitterPinterestLinkedinTumblrVKThreadsBlueskyEmail
شهاب الدین حدیدی

شهاب الدین حدیدی هستم، سردبیر فوت و فن. زندگی آنلاین یکی از تفریحات من در زمانیست که از ترافیک و شلوغی و هیاهو در فرار هستم.

مطلب قبلی
چرا Credential Manager در ویندوز انتخاب خوبی برای مدیریت رمزها نیست؟

شما هم نظر دهید Cancel Reply

برای دفعه بعد که نظر می‌دهم نام و ایمیل من را در این مرورگر ذخیره کنید.

* با استفاده از این فرم، با ذخیره و مدیریت داده‌های خود توسط این وب سایت موافقت می‌کنم.

مطالب مرتبط

  • از تحقیق تا تولید محتوا با هوش مصنوعی؛...

    21 مرداد 1404
  • ۴ دلیل که چرا نباید از چت‌بات‌ها به‌جای...

    20 مرداد 1404
  • آیا هوش مصنوعی می‌تواند بشریت را نابود کند؟

    18 مرداد 1404
  • رشد ۴ برابری ChatGPT در یک سال |...

    17 مرداد 1404
  • هوش مصنوعی در خطوط هوایی: آغاز مرحله «سوءاستفاده»...

    15 مرداد 1404
  • هوش مصنوعی Awesome Intelligence چیست و چه تفاوتی...

    13 مرداد 1404
  • موسیقی هوش مصنوعی احساسی‌تر از آهنگ‌های انسانی است؟

    11 مرداد 1404
  • هوش مصنوعی و موج پنهان اخراج کارکنان در...

    9 مرداد 1404
  • بوت‌کمپ هوش مصنوعی دانش‌آموزی آکادمی ایرانسل برگزار می‌شود

    6 مرداد 1404
  • چگونه صدای تولید شده با هوش مصنوعی را...

    5 مرداد 1404
  • کشف انقلابی: پروتئینی که باکتری E. coli را...

    4 مرداد 1404
  • چین چگونه به ابرقدرت هوش مصنوعی تبدیل می‌شود؟

    4 مرداد 1404
  • هر آنچه باید درباره GPT-5 بدانید

    4 مرداد 1404

درباره فوت و فن

درباره فوت و فن

با ما تجربه‌ای جذاب از دنیای اطراف را داشته باشید.

در «فوت و فن»، ما به دنبال راه‌های ساده و کاربردی برای بهبود زندگی هستیم. واژهٔ «فن» در فارسی به معنای «شگرد» و «ترفند» است. ما تلاش می‌کنیم این ترفندها را در زندگی روزمره خود به کار ببریم و مطالبی شگفت‌انگیز و مفید را با شما به اشتراک بگذاریم. هدف ما این است که با به اشتراک گذاشتن تجربیات و آموخته‌های خود، به شما کمک کنیم تا روش‌های جدید و ایده‌های تازه‌ای را در زندگی خود بکار ببرید. با ما همراه باشید تا زندگی را با کمک «فوت و فن»، به یک تجربهٔ خلاقانه و لذت‌بخش تبدیل کنیم.

لینک‌های مفید

تماس با ما

 

تبلیغات در فوت و فن

 

درباره ما

Facebook Twitter Instagram Linkedin Tumblr Youtube Email

حامیان

2010-2025@ - All Right Reserved. Designed and Developed by FOOTOFAN

فوت و فن
  • دانش و فن
    • موبایل و تبلت
    • هوش مصنوعی
    • اپراتورها و وب
    • برنامه و نرم افزار
    • دنیای بازی
    • گوناگون
      • سخت افزار
      • تلویزیون
  • اقتصاد
    • اقتصاد بین الملل
    • بازارها
    • بانکداری و تجارت الکترونیک
    • خودرو
    • وبگردی
    • رپورتاژ
  • ورزش
    • فوتبال
    • موتوری
    • تنیس
  • سبک زندگی
    • سلامت
    • تغذیه
    • طبیعت
    • حیوانات
    • خلاقیت
    • آشپزی
  • گردشگری
    • گردشگری
  • فرهنگ و هنر
    • فیلم و سریال
    • کتاب و مجله
    • آثار باستانی
    • صنایع دستی
  • چند رسانه‌ای
    • عکس
    • ویدیو
    • خودمونی
    • همیاری
  • English