جارتنر: تكاليف تشغيل نماذج اللغة الكبيرة ستنخفض 90% بحلول 2030—لكن إجمالي فواتير الذكاء الاصطناعي سيرتفع
نشرت شركة جارتنر في الخامس والعشرين من مارس 2026 توقعات تكلفة بارزة، تُشير إلى أن سعر تشغيل الاستدلال على نموذج لغوي كبير يضم تريليون معامل سينخفض بأكثر من 90 بالمئة بين عامَي 2025 و2030. وذهبت الشركة أبعد من ذلك: إذا قيست الكفاءة بالمقارنة مع أوائل النماذج المتطورة من حقبة 2022، فستكون نماذج اللغة الكبيرة بنهاية العقد أكثر كفاءة في استهلاك الموارد بمقدار مئة ضعف—وهو انكماش في اقتصاديات الحوسبة الذكية لا مثيل له في تاريخ صناعة تقنية المعلومات.
تقف وراء هذا الانخفاض قوى متعددة تتقاطع بوتيرة تفوق تقديرات كثير من المحللين. تتقدم الرقائق الإلكترونية في خفض تكاليف الطاقة والصيليكون اللازمة للاستدلال على النماذج الكبيرة، فيما تحلّ شرائح الذكاء الاصطناعي المخصصة للاستدلال—المصممة تحديداً لعمليات المصفوفات التي تتطلبها هذه النماذج—محل وحدات معالجة الرسوميات متعددة الأغراض في مراكز بيانات المؤسسات. وتُسهم معدلات استخدام أعلى للرقائق، جراء تحسّن خوارزميات الجدولة، في خفض تكاليف الطاقة غير المستخدمة. وتضاف إلى ذلك ابتكارات بنيوية في تصميم النماذج تُحقق جودة استدلالية مماثلة بمعاملات أقل، فضلاً عن نقل أعباء استدلال ملائمة إلى الأجهزة الطرفية مما يُخفف العبء على مراكز البيانات.
بيد أن التحذير الجوهري الذي أورده جارتنر قد يكون أكثر أهمية استراتيجية من الخفض المُعلَن في العناوين الرئيسية: فانخفاض تكلفة كل رمز لن يُفضي إلى انخفاض فواتير المؤسسات الإجمالية. تتوقع الشركة أن يرتفع الطلب الكلي على الاستدلال بوتيرة أسرع من تراجع التكاليف الوحدوية. والمحرك الرئيسي هو ظهور أنظمة الذكاء الاصطناعي الوكيلة—عوامل مستقلة تربط بين استدعاءات نماذج متعددة وعمليات أدوات وسلاسل استدلال متعددة الخطوات لإنجاز مهمة واحدة. وفي حين يعالج روبوت المحادثة المعياري استعلاماً واحداً بردّ محدود ومباشر، قد يستدعي مسار الذكاء الاصطناعي الوكيل نموذجاً لغوياً عشرات المرات لإتمام مهمة بعينها. وتقدير جارتنر صارم: تتطلب الأنظمة الوكيلة ما بين خمسة وثلاثين ضعفاً من الرموز مقارنة بنظيراتها غير الوكيلة.
بالنسبة لمسؤولي التقنية في دول مجلس التعاون الخليجي، تحمل هذه التوقعات أهمية مباشرة لقرارات البنية التحتية الجارية حالياً. حرم ستارغيت للذكاء الاصطناعي في أبوظبي—شراكة بقيمة 30 مليار دولار بين G42 وOpenAI وNVIDIA وOracle على مساحة عشرة أميال مربعة—يمثّل واحداً من التزامات بنية تحتية على مدى عقود في المنطقة. ويُثبّت توقع جارتنر بتحوّل تكلفة الاستدلال إلى مستوى السلع الأساسية بحلول 2030 المبررات الاستثمارية بعيدة المدى لهذه المشاريع. لكن تحذير ارتفاع الطلب بالغ الأهمية بالقدر ذاته: يجب أن تُبنى حوكمة الرموز وإسناد الاستخدام وإدارة التكلفة الذكية كمتطلبات بنية تحتية أساسية—لا إضافات لاحقة—إن أريد لهذه الاستثمارات التوسع باستدامة مع تكاثر أعباء العمل الوكيلة.
تُشكّل الديناميكيات الاقتصادية التي يصفها جارتنر ركيزةً محورية في الخيارات المعمارية لمنتجات Diverge المؤسسية. صُمّمت منصة DivergeInsight بكفاءة الرموز بوصفها قيداً هندسياً من الدرجة الأولى، إذ توظّف التخزين المؤقت الذكي للقضاء على استدعاءات النماذج المتكررة، وتوجيه النماذج الانتقائي لمطابقة تعقيد المهمة مع المستوى النموذجي الملائم، وتحسين الطلبات للحد من الطول غير الضروري للسياق. في عالم تنخفض فيه تكاليف كل رمز لكن يرتفع استهلاك الرموز لكل مهمة، تكتسب الأنظمة الحاكمة لطريقة استهلاك الرموز قيمة أكبر—ليس أقل—مع نمو الطلب.
بحلول عام 2030، سيكون الاستدلال بتكلفة معقولة متطلباً أساسياً لا ميزة تنافسية. وستنتمي الأفضلية للمؤسسات التي استثمرت الفترة السابقة لتلك اللحظة الفارقة في بناء أُطر حوكمة وأنظمة إسناد تكلفة وبنية تحتية لتنسيق قادرة على إدارة الطلب المتصاعد بصورة أسية دون نمو تكلفة مماثل. توقعات جارتنر الصادرة في مارس 2026 لا تُقرأ بوصفها طمأنينة بأن الذكاء الاصطناعي يزداد رخصاً، بل بوصفها توصيفاً دقيقاً لتحدي الحوكمة الذي يجب على قادة الذكاء الاصطناعي المؤسسي حله الآن.
المصدر: Gartner