أخبار الذكاء الاصطناعي
هل ينفع نقيس ذكاء نماذج الذكاء الاصطناعي مثل البشر؟
منصة AI IQ تحاول تحويل أداء نماذج Frontier AI إلى رقم قريب من مقياس IQ البشري. الفكرة جذابة، لكنها تفتح أسئلة مهمة عن معنى الذكاء نفسه.
بقى عندنا موقع جديد اسمه AI IQ بيحاول يعمل حاجة مثيرة للجدل: يدي نماذج الذكاء الاصطناعي درجة ذكاء على نفس مقياس IQ البشري.
الفكرة في ظاهرها بسيطة: بدل ما نقول النموذج قوي أو ضعيف بشكل عام، نحاول نضعه على رقم واضح. لكن هنا تبدأ المشكلة، لأن ذكاء الإنسان نفسه مش رقم واحد، وذكاء النموذج كمان بيتغير حسب نوع الاختبار، طريقة السؤال، والمهارة المطلوبة.
ليه الموضوع مهم؟
- لأنه يحاول تبسيط مقارنة النماذج للمستخدم العادي.
- لأنه يوضح أن سباق نماذج AI لم يعد فقط عن السرعة أو السعر، بل عن القدرة على التفكير وحل المشكلات.
- لأنه يفتح سؤالا أكبر: هل نحن نقيس الذكاء فعلا، أم نقيس قدرة النموذج على اجتياز اختبارات مصممة بطريقة معينة؟
أنا شايفة أن هذه المقاييس مفيدة كبداية، لكنها لا تصلح وحدها للحكم على نموذج. النموذج قد يحصل على رقم مرتفع في اختبار، لكنه يفشل في مهمة عملية بسيطة داخل شغل حقيقي. وفي المقابل، نموذج أقل في الترتيب قد يكون أفضل لك لأنه أسرع، أرخص، أو أكثر ثباتا في استخدامك اليومي.
الخلاصة
استخدموا الأرقام كمؤشر، وليس كحقيقة نهائية. السؤال الأهم ليس: ما هو أذكى نموذج؟ السؤال الأهم: ما هو النموذج الأنسب للمهمة التي تريد إنجازها؟