MIT تُضاعف سرعة تدريب نماذج اللغة الكبيرة عبر توظيف طاقة المعالج الخاملة
نشر باحثو معهد ماساتشوستس للتكنولوجيا (MIT) ومؤسسات شريكة في السادس والعشرين من فبراير 2026 تقدماً بارزاً في كفاءة تدريب نماذج اللغة الكبيرة. يُعالج نهجهم المسمى Taming the Long Tail (TLT) اختناقاً حاداً في مرحلة التعلم المعزز لتدريب نماذج اللغة الاستنتاجية، إذ كانت هذه المرحلة تستأثر بما يصل إلى 85 بالمئة من إجمالي وقت التنفيذ. ومن المرتقب تقديم هذا البحث في المؤتمر الدولي لـACM حول دعم البنى البرمجية وأنظمة التشغيل.
يعمل نظام TLT عبر مكوّنَين متكاملَين: Adaptive Drafter Trainer الذي يستغل دورات المعالج الخاملة لتدريب نموذج مرافق أخف وزناً، وAdaptive Rollout Engine الذي يختار استراتيجيات الفك المُخمَّن الأمثل في الوقت الفعلي. وفي الاختبارات التي أُجريت على نماذج استنتاجية متعددة، حقّق الأسلوب تسريعاً في سرعة التدريب يتراوح بين 70 و210 بالمئة مع الحفاظ الكامل على دقة النموذج. ووصف الباحث الرئيسي Qinghao Hu هذه النتيجة بأنها 'حل بلا خسائر' يُتيح 'تسريعات ذات تأثير حقيقي وملموس في التطبيق العملي'.
يتزامن هذا الاختراق مع تحوّل أشمل تشهده الصناعة؛ إذ باتت المؤسسات والمعامل البحثية تعتمد في 2026 بشكل متزايد على نماذج اللغة الاستنتاجية في تطبيقات تمتد من توليد الأكواد البرمجية إلى الاكتشاف العلمي. غير أن تدريب هذه النماذج ظل باهظ التكلفة ومستنزفاً للوقت، مما حصر إمكانية الوصول إليها في المؤسسات ذات التمويل الضخم. ويُتيح نهج TLT القائم على استعادة الطاقة الحسابية الخاملة تخفيض هذه التكاليف دون الحاجة إلى استثمارات إضافية في الأجهزة.
بالنسبة للإمارات التي وضعت أهدافاً طموحة لتطوير نماذج ذكاء اصطناعي وطنية — كسلسلة نماذج Falcon الصادرة عن G42 — تحمل أبحاث من قبيل TLT دلالات بالغة الأهمية. فالبنية التحتية الحسابية المتنامية في المنطقة، التي تتجسد في مشاريع كـStargate الإماراتي، ستستفيد من أساليب التدريب التي تُعظّم الاستفادة من الطاقة القائمة. وفي ظل هذه الإمكانات، يمكن لتقنيات التدريب الفعّالة أن تُعجّل بتطوير نماذج أساسية مُكيَّفة للغة العربية وسياقات الخليج.
في Diverge، يعتمد تطوير القدرات اللغوية المتخصصة في منتجات مثل DivergeGPT — المُدرَّبة على سياقات الأعمال والقانون والحوكمة في منطقة الخليج — بشكل مباشر على التقدم في كفاءة التدريب. فالأساليب التي تُقلّص الوقت والتكلفة اللازمَين للضبط الدقيق والتعلم المعزز المُوجَّه تُقرّب من متناول المؤسسات المتوسطة والجهات الحكومية إمكانية امتلاك أنظمة ذكاء اصطناعي متطورة ومُعيَّرة محلياً.
تمتد تداعيات هذا البحث إلى ما هو أبعد من مجرد تسريع التدريب؛ إذ يمكن توظيف النموذج المرافق الأخف في الاستدلال وقت الإنتاج، مما يمنح الأسلوب فائدة مزدوجة: تسريع دورات التطوير وتخفيف الحمل الحسابي في النشر الحي. ومع تحوّل نماذج اللغة الاستنتاجية إلى عنصر أساسي في البنية التحتية للذكاء الاصطناعي المؤسسي، ستكون الأساليب التي تُخفّض عتبة تشغيلها بين أكثر الإسهامات أثراً في بحوث الذكاء الاصطناعي التطبيقي هذا العام.
المصدر: أخبار MIT