تقديم ADeLe: منهجية جديدة لتقييم نماذج الذكاء الاصطناعي

أطلق باحثون من مايكروسوفت وجامعة برينستون منهجية ADeLe لتقييم نماذج الذكاء الاصطناعي، والتي تقيم 18 قدرة أساسية. هذه المنهجية تتنبأ بأداء النماذج على مهام جديدة بدقة تصل إلى 88%، بما في ذلك نماذج مثل GPT-4o و Llama-3.1. تعمل ADeLe على بناء ملفات تعريف للقدرات، مما يساعد في تحديد نقاط القوة والضعف للنماذج. من خلال ربط النتائج بمتطلبات المهام، توضح ADeLe كيف يتغير الأداء مع زيادة تعقيد المهام، مما يوفر رؤى أعمق حول أداء النماذج. تعتبر هذه المنهجية خطوة مهمة نحو تحسين تقييم النماذج، حيث تتجاوز الدرجات التقليدية وتقدم تحليلاً أكثر تفصيلاً. من المتوقع أن تؤثر ADeLe بشكل كبير على كيفية تقييم النماذج في المستقبل، مما يسهل فهم قدراتها الحقيقية.

تابع هذه المواضيع

سجّل دخولك لمتابعة المواضيع التي تهمك

تسجيل الدخول للمتابعة

يُنتج هذا الملخص باستخدام تقنيات الذكاء الاصطناعي مع مراجعة تحريرية دورية، ويرجى الرجوع إلى المصدر الأصلي للتفاصيل الكاملة.

نماذج

تابع هذه المواضيع

سجّل دخولك لمتابعة المواضيع التي تهمك

تسجيل الدخول للمتابعة