MIT تطوّر أسلوبًا متقاطعًا للكشف عن نماذج الذكاء الاصطناعي الواثقة بإجابات خاطئة
أعلن باحثو معهد ماساتشوستس للتكنولوجيا (MIT) في التاسع عشر من مارس 2026 عن طريقة جديدة للكشف عن إجابات نماذج اللغة الكبيرة التي تبدو واثقة لكنها خاطئة — وهو إشكالٌ يُشكّل مخاطر جسيمة في التطبيقات عالية الحساسية كالتشخيص الطبي والتحليل المالي. قُبل البحث للعرض في مؤتمر تمثيلات التعلم الدولي (ICLR 2026) المقرر في ريو دي جانيرو خلال الفترة 23-27 أبريل 2026، ويُعالج أحد أبرز تحديات موثوقية أنظمة الذكاء الاصطناعي المنشورة: نزعة نماذج اللغة الرائدة إلى التعبير عن ثقة عالية في إجابات خاطئة دون تقديم أي إشارة تحذيرية للمستخدمين أو الأنظمة المتصلة.
يقيس فريق MIT ما يُعرف بـ'عدم اليقين الإبستيمي' — الناجم عن فجوات في معرفة النموذج لا من غموض السؤال ذاته — من خلال مقارنة ردود النموذج المستهدف بمجموعة صغيرة من نماذج اللغة ذات الحجم والبنية المتشابهين. حين تنحرف إجابة نموذج ما بشكل ملحوظ عن إجابات النماذج المماثلة، يُعدّ هذا الانحراف مؤشرًا موثوقًا على عدم اليقين الحقيقي، حتى حين يُوحي النموذج بثقة عالية. دمج الباحثون هذا المقياس المتقاطع بين النماذج مع أسلوب الاتساق الذاتي التقليدي للخروج بمقياس مركّب لعدم اليقين تفوّق على جميع الأساليب الموجودة عند اختباره على عشر مهام واقعية شملت الإجابة على الأسئلة والاستدلال الرياضي.
تتجاوز الأهمية العملية لهذا البحث حدود المعايير الأكاديمية. فالردود المفرطة في الثقة باتت مرتبطة بعدد متزايد من إخفاقات الذكاء الاصطناعي المؤسسي: فرق قانونية اعتمدت على تحليلات مُولَّدة بالذكاء الاصطناعي احتوت على استشهادات مخترعة، ونماذج مالية أنتجت توقعات دقيقة لكنها مُعيبة هيكليًا، وأدوات دعم القرار الطبي اقترحت بروتوكولات علاجية مبنية على أدلة سريرية مُسنَدة بشكل خاطئ. القاسم المشترك في هذه الحوادث هو أن النظام أبدى ثقة عالية في اللحظة الحرجة التي كان يجب فيها الإشارة إلى عدم اليقين.
بالنسبة لممارسي الذكاء الاصطناعي في الإمارات ومنطقة الخليج — حيث تتسارع وتيرة التبني المؤسسي في قطاعات الرعاية الصحية والخدمات القانونية والاستشارات المالية والتحليلات الحكومية — يُقدّم بحث MIT إطارًا تشخيصيًا ومبدأً تصميميًا في آنٍ واحد. وقد اشترط التعميم الرقابي للمصرف المركزي الإماراتي الصادر مطلع 2026 صراحةً أن تتضمن أنظمة دعم القرار المدعومة بالذكاء الاصطناعي آليات للإشارة إلى عدم اليقين وتنبيه متخذي القرار البشريين قبل الاعتماد على المخرجات ذات الثقة المنخفضة.
تعمل منصة DivergeInsight من Diverge، التي تعالج البيانات المنظمة وغير المنظمة لاستخراج ذكاء قابل للتنفيذ للعملاء المؤسسيين والحكوميين، في المجالات عالية المخاطر ذاتها التي يكون فيها الكشف عن الإفراط في الثقة أكثر إلحاحًا. ويُوفّر بحث MIT تقدمًا ملموسًا في الأدوات المتاحة لمطوري الذكاء الاصطناعي الساعين إلى بناء موثوقية مؤسسية في الأنظمة اللغوية الكبيرة المنشورة.
يُشير هذا البحث إلى تحول أعمق في طريقة تفكير صناعة الذكاء الاصطناعي في الموثوقية. خلال السنوات الثلاث الأولى من انتشار نماذج اللغة الرائدة، هيمنت معايير الدقة على مشهد التقييم؛ أما المعايرة — مدى توافق الثقة المُعبَّر عنها مع الدقة الفعلية — فقد نالت اهتمامًا أقل بكثير. ويشير قبول ورقة MIT في مؤتمر ICLR 2026، إلى أن الميدان يدخل مرحلة نضج يُصبح فيها الموثوقية والتفسيرية والمعايرة أهدافًا هندسية أساسية جنبًا إلى جنب مع الأداء الخام.
المصدر: MIT News