نمرهدهی به تکالیف دانشآموزان بهویژه زمانی که نیاز به تفکر عمیق، ارائه توضیح یا مدلسازی علمی دارند، میتواند ساعتها از وقت معلمان را بگیرد. اما یک مطالعه جدید نشان میدهد که هوش مصنوعی (AI) میتواند این بار را سبکتر کند—البته تنها در صورتی که با دقت استفاده شده، و در کنار نظارت انسانی باشد.
تحقیقی درباره توانایی هوش مصنوعی در نمرهدهی
رهبری تحقیق توسط دانشگاه جورجیا
این پژوهش توسط «شیائومینگ ژای»، استاد دانشگاه جورجیا و مدیر مرکز آموزش AI4STEM انجام شده است. هدف اصلی آن بررسی توانایی مدلهای زبانی بزرگ (LLMs) در نمرهدهی به پاسخهای دانشآموزان، در مقایسه با معلمان انسانی بود.
ژای میگوید: «وقتی از دانشآموزان میخواهیم مدلی ترسیم کنند، توضیحی بنویسند یا بحث کنند، اینها وظایف پیچیدهای هستند. معلمان اغلب زمان کافی برای بررسی پاسخهای همه دانشآموزان ندارند، و این یعنی دانشآموزان بازخورد بهموقع دریافت نمیکنند.»
مقایسه هوش مصنوعی و قضاوت انسانی
پاسخ به سوالات علمی پایه
مطالعه بر روی پاسخهای دانشآموزان مقطع راهنمایی به سوالات علمی منطبق با استانداردهای جدید آموزش علوم انجام شد. یکی از سوالات از دانشآموز میخواست مدلی بسازد که نشان دهد مولکولها هنگام افزایش گرما چگونه رفتار میکنند.
پاسخ صحیح باید توضیح دهد که مولکولها در گرما سریعتر و در سرما کندتر حرکت میکنند. تیم تحقیقاتی پاسخهای دانشآموزان را به مدل LLM به نام Mixtral داد تا نمرهگذاری کند.
مدل بدون آموزش مستقیم انسانی
برخلاف بیشتر مطالعات مشابه که هوش مصنوعی را با نمونههای نمرهگذاری شده توسط انسان آموزش میدهند، این مطالعه از روش متفاوتی استفاده کرد:
مدل باید خودش معیار نمرهدهی را تولید کرده، و آن را روی پاسخها اعمال میکرد.
تجارت سرعت با دقت
سرعت بالا، دقت پایین
محققان دریافتند که Mixtral با سرعت بسیار بالایی نمره میدهد، اما بیشتر بر روی کلیدواژهها تمرکز میکند تا فهم واقعی مفاهیم توسط دانشآموز.
ژای توضیح میدهد: «دانشآموز ممکن است فقط به افزایش دما اشاره کند، و مدل زبانی بزرگ تصور کند که دانشآموز فهمیده ذرات در دمای بالا سریعتر حرکت میکنند. اما از روی متن نوشته شده، به عنوان یک انسان نمیتوانیم مطمئن شویم که واقعاً چنین درکی دارد.»
به عبارتی، هوش مصنوعی ممکن است صرفاً به خاطر ذکر یک واژه تخصصی نمره بدهد، حتی اگر دلیل یا منطق پشت آن غلط یا ناقص باشد.
افزایش دقت هوش مصنوعی با کمک انسان
اهمیت رهنمودها و معیارهای مشخص
مطالعه نشان داد که مدلهای زبانی در صورتی عملکرد بهتری دارند که از دستورالعملها و جداول نمرهدهی دقیق استفاده کنند، همانهایی که معمولاً توسط معلمان تنظیم میشود.
بدون این جداول، دقت نمرهدهی Mixtral فقط ۳۳.۵٪ بود. اما با استفاده از معیارهای انسانی، این رقم به بیش از ۵۰٪ رسید.
ژای میگوید: «قطار هوش مصنوعی حرکت خودش را شروع کرده، اما هنوز ابتدای مسیر است. یعنی هنوز مسیر زیادی در پیش داریم، و باید بدانیم به کدام سو میرویم.»
اهمیت تفکر انسانی در ارزیابی پاسخها
مشکلات مدلهای زبانی در تحلیل استدلال
یک تفاوت کلیدی بین معلمان و LLMها، در نحوه برخورد با پاسخهای ناقص یا پیچیده است.
مدلهای زبانی معمولاً اگر کلیدواژهای را ببینند، فرض میکنند دانشآموز مفهوم را درک کرده است. این پدیده بهنام «بیشتفسیر» شناخته میشود.
اما معلمان به دنبال شواهدی از تفکر منطقی، استدلال دقیق و انسجام ذهنی میگردند. LLMها چنین تواناییای ندارند مگر اینکه ساختار نمرهدهی واضحی در اختیار داشته باشند.
هوش مصنوعی؛ دستیار معلم، نه جایگزین او
آیا معلمان از هوش مصنوعی استقبال میکنند؟
با وجود محدودیتها، بسیاری از معلمان از استفاده از ابزارهای هوش مصنوعی برای نمرهدهی استقبال کردهاند.
ژای میگوید: «خیلی از معلمان به من گفتند: مجبور بودم آخر هفتهها بازخورد بدهم، اما با نمرهدهی خودکار این زمان را صرف کارهای مهمتر و با معنا کردم. این برای من بسیار دلگرمکننده است.»
توصیه پژوهشگران: همکاری انسان و ماشین
محققان پیشنهاد میکنند که سیستمهای هوش مصنوعی نباید جایگزین کامل معلمان شوند، بلکه باید بهعنوان دستیار عمل کنند. این کار باعث میشود معلمان وقت بیشتری برای وظایف خلاقانه و ارتباطی داشته باشند.
آینده نمرهدهی با هوش مصنوعی
نقاط قوت و ضعف سیستمهای فعلی
این تحقیق هم امیدواریها و هم چالشهای موجود در استفاده از هوش مصنوعی در آموزش را نشان میدهد. LLMها میتوانند حجم زیادی از پاسخها را بهسرعت پردازش کنند، اما هنوز نیاز به راهنمایی انسانی، اصلاح مستمر و دقت در طراحی دارند.
نقش کلیدی معلمان در آینده
معلمان همچنان نقش مهمی در تعریف انتظارات، کنترل عملکرد ابزارها، و تضمین عدالت آموزشی خواهند داشت.
در نهایت، امید است که مدلهای آینده بتوانند نه فقط واژهها، بلکه کیفیت استدلال و تفکر دانشآموزان را نیز بهتر درک کنند.
جمعبندی: همکاری انسان و هوش مصنوعی برای آموزش بهتر
در صورتی که طراحی ابزارهای هوش مصنوعی با دقت انجام شده، و با نظارت انسانی همراه باشد، این فناوریها میتوانند به معلمان در بهبود یادگیری دانشآموزان کمک کنند—بدون اینکه نیاز باشد آخر هفتههای خود را صرف کوهی از برگههای نمرهنداده کنند.
این مطالعه در نشریه Technology, Knowledge and Learning منتشر شده است.