الأخبار
ملخص بالذكاء الاصطناعي
١٣ شوال ١٤٤٧ هـ١ أبريل ٢٠٢٦
تقديم ADeLe: منهجية جديدة لتقييم نماذج الذكاء الاصطناعي

تقديم ADeLe: منهجية جديدة لتقييم نماذج الذكاء الاصطناعي

أطلق باحثون من مايكروسوفت وجامعة برينستون منهجية ADeLe لتقييم نماذج الذكاء الاصطناعي، والتي تقيم 18 قدرة أساسية. هذه المنهجية تتنبأ بأداء النماذج على مهام جديدة بدقة تصل إلى 88%، بما في ذلك نماذج مثل GPT-4o و Llama-3.1. تعمل ADeLe على بناء ملفات تعريف للقدرات، مما يساعد في تحديد نقاط القوة والضعف للنماذج. من خلال ربط النتائج بمتطلبات المهام، توضح ADeLe كيف يتغير الأداء مع زيادة تعقيد المهام، مما يوفر رؤى أعمق حول أداء النماذج. تعتبر هذه المنهجية خطوة مهمة نحو تحسين تقييم النماذج، حيث تتجاوز الدرجات التقليدية وتقدم تحليلاً أكثر تفصيلاً. من المتوقع أن تؤثر ADeLe بشكل كبير على كيفية تقييم النماذج في المستقبل، مما يسهل فهم قدراتها الحقيقية.

تابع هذه المواضيع

سجّل دخولك لمتابعة المواضيع التي تهمك

تسجيل الدخول للمتابعة

يُنتج هذا الملخص باستخدام تقنيات الذكاء الاصطناعي مع مراجعة تحريرية دورية، ويرجى الرجوع إلى المصدر الأصلي للتفاصيل الكاملة.

0
0 يقرأون الآن

تقييم الخبر

سيظهر متوسط التقييم بعد 3 تقييمات.

سجل الدخول للتفاعل والتقييم والحفظ. تسجيل الدخول
مقالات ذات صلة

مقالات ذات صلة

مزيج خفيف من الوسوم والموضوعات القريبة والزخم الحديث.

إطلاق نموذج Leanstral 1.5 من Mistral AI للتحقق الرسمي
الأبحاثنماذج

إطلاق نموذج Leanstral 1.5 من Mistral AI للتحقق الرسمي

أعلنت شركة Mistral AI عن إطلاق نموذج Leanstral 1.5، وهو نموذج مفتوح المصدر للتحقق الرسمي باستخدام Lean 4. خلال فحص 57 مستودع...

تلائم لغتك الحالية

اقرأ الرؤية
نموذج مفتوح الوزن يتفوق على أقوى نماذج الذكاء الاصطناعي في المالية
الأبحاثنماذج

نموذج مفتوح الوزن يتفوق على أقوى نماذج الذكاء الاصطناعي في المالية

أفاد صندوق التحوط بريدج ووتر ومختبر التفكير أن نموذجًا مفتوح الوزن تم ضبطه بدقة يتفوق على أقوى نماذج الذكاء الاصطناعي في تقي...

تلائم لغتك الحالية

اقرأ الرؤية
الشركات الصينية تتبنى تقنية التكديس الثلاثي لتعزيز أداء الشرائح
الأبحاثالبنية التحتية

الشركات الصينية تتبنى تقنية التكديس الثلاثي لتعزيز أداء الشرائح

تتجه الشركات الصينية المصنعة للشرائح الذكية نحو تقنية التكديس الثلاثي كبديل استراتيجي لترقيات العقد المتقدمة، بسبب القيود ال...

تلائم لغتك الحالية

اقرأ الرؤية
تقرير الأمم المتحدة: الذكاء الاصطناعي يحمل فوائد ومخاطر جسيمة
الأبحاثالحوكمة

تقرير الأمم المتحدة: الذكاء الاصطناعي يحمل فوائد ومخاطر جسيمة

خلص التقرير الأول للجنة العلمية المستقلة التابعة للأمم المتحدة إلى أن الذكاء الاصطناعي يحمل إمكانات هائلة، لكنه ينطوي على مخ...

تلائم لغتك الحالية

اقرأ الرؤية
نموذج Skill-MAS: تصميم أنظمة متعددة الوكلاء بذكاء اصطناعي متطور
الأبحاثنماذج

نموذج Skill-MAS: تصميم أنظمة متعددة الوكلاء بذكاء اصطناعي متطور

تقدم مجموعة Ant وجامعة هونغ كونغ للعلوم والتكنولوجيا نموذج Skill-MAS لتصميم أنظمة متعددة الوكلاء. يعتمد هذا النموذج على مهار...

تلائم لغتك الحالية

اقرأ الرؤية