من هو أقوى نموذج ذكاء اصطناعي في العالم؟ معركة جيمي نايتري ضد جروك 4.1 و GPT-5.1… والنتيجة صادمة!
السلام عليكم ورحمة الله وبركاته.
قبل يومين فقط، اهتزّ عالم الذكاء الاصطناعي بإعلان Google عن النموذج المرعب “جيمي نايتري” Gemini N-3، الذي وصفه الكثيرون بأنّه أقوى نموذج ذكاء اصطناعي تم تطويره حتى الآن. ووسط هذه الضجة الكبيرة، لم يمضِ الوقت طويلًا حتى ظهر منافسه العنيد: جروك 4.1 من شركة xAI التابعة لإيلون ماسك، ليعلن البعض أنه تفوّق على جيمي نايتري نفسه.
لكن السؤال الذي يطرح نفسه: هل تستحق هذه النماذج كل هذه الضجة؟
هل هي فعلًا أقوى ما وصل إليه الذكاء الاصطناعي أم أنّ هناك مبالغات إعلامية؟
الأهم: من هو أفضل نموذج في العالم اليوم؟
✔ جيمي نايتري (Gemini N-3)
✔ جروك 4.1 (Grok 4.1)
✔ GPT-5.1 من OpenAI
يا لها من فوضى… ويا لها من معركة!
في هذه التدوينة، سنخوض مقارنة فعلية بين هذه النماذج الثلاثة:
وسنضع كل نموذج أمام اختبارات حقيقية على خمس جبهات نارية:
-
الرياضيات الصعبة والاستدلال العميق
-
الإدراك الفيزيائي وفهم العالم
-
البرمجة والهندسة
-
الإبداع اللغوي
-
الدقة والحقيقة والذكاء العاطفي
وفي النهاية سنكشف النتيجة الكاملة… وستتفاجأ.
الجبهة الأولى: الرياضيات الصعبة – انهيار غير متوقع
أول اختبار كان في الجبر المجرد وتحديدًا نظرية غالوا، وهو مجال يعجز كثير من البشر عن الاقتراب منه.
المعادلة كانت جديدة تمامًا وغير موجودة على الإنترنت، لضمان أن كل نموذج يعتمد على قدراته الداخلية فقط.
النتيجة:
جروك 4.1 هو سيد الرياضيات في هذه الجولة.
-
جيمي نايتري: تحليل منطقي لكنه خاطئ.
-
GPT-5.1: نفس الأمر… تحليل طويل لكن نتيجة غير صحيحة.
-
جروك 4.1: الصدمة… النموذج الوحيد الذي قدم الحل الصحيح.
أول مفاجأة:
الجبهة الثانية: الإدراك الفيزيائي – تفوق مرعب للجيمي نايتري
هذا الاختبار هو مقبرة النماذج الضعيفة، لأنه يتطلب فهمًا عميقًا للفيزياء، الزمن، الحركة، الظلال، التوازن، وكل ما يجعل المشهد “طبيعيًا”.
الاختبار الأول:
الاختبار الثاني:
جيمي نايتري يسحق الجميع في الإدراك الفيزيائي والرؤية.
إنشاء أنيميشن لكرة مرتدة بفيزياء واقعية باستخدام HTML / CSS / JS.
-
GPT-5.1 → أسوأ نتيجة.
-
جروك 4.1 → متوسط.
-
جيمي نايتري → مذهل: أنيميشن واقعي، إمكانية التحكم في الجاذبية، وتسارع الكرة!
إعادة بناء مشهد فوكسل ثلاثي الأبعاد مستوحى من صورة شلال، باستخدام three.js.
-
GPT-5.1 → فشل كامل.
-
جروك 4.1 → فشل كامل.
-
جيمي نايتري → أبدع مشهدًا ثلاثي الأبعاد مذهلًا مع أنيميشن.
النتيجة واضحة:
الجبهة الثالثة: البرمجة – من يستطيع بناء لعبة ثلاثية الأبعاد من الصفر؟
الاختبار:
إنشاء لعبة 3D كاملة:
حبار يسبح في المحيط ويطلق النار على النفايات… بدون أي صور جاهزة، فقط هندسة برمجية.
النتيجة:
-
GPT-5.1 → فشل كامل
-
جروك 4.1 → فشل كامل
-
جيمي نايتري → ليس فقط نجح… بل بنى اللعبة بالكامل وتعمل!
هذا المستوى من الهندسة مرعب فعلًا.
الكود
الجبهة الرابعة: الإبداع اللغوي – الشعر يفضح القدرات
طلبنا قصيدة عربية فصيحة من 7 أبيات في حب ورثاء السودان.
النتائج:
جيمي نايتري في القمة.
-
GPT-5.1 → مستوى متوسط.
-
جروك 4.1 → قصيدة ضعيفة جدًا.
-
جيمي نايتري → أبدع قصيدة قوية وصادقة، مليئة بالصورة الشعرية والبلاغة.
مرة أخرى…
الجبهة الخامسة: الدقة والحقيقة – معركة الهلوسة
هذا هو الامتحان الذي يكشف النماذج فعليًا.
طلبنا من كل نموذج كتابة فقرة تقنية عن نموذج “جيمي نايت 3.1”.
المفاجأة: هذا النموذج غير موجود أصلًا.
النتيجة:
أصدق نموذج في العالم → جروك 4.1
-
GPT-5.1 → تحدث بحذر، لكنه هلوس.
-
جيمي نايتري → كارثة: اخترع إنجازات خيالية بالكامل.
-
جروك 4.1 → الوحيد الذي لم يقع في الفخ. تحدث عن النسخة الموجودة فقط، وقدم معلومات دقيقة 100%.
الجبهة السادسة: الأخلاقيات والذكاء العاطفي – الثلاثة يلمعون
وهو الاختبار الذي هزّني شخصيًا.
طلبنا من النماذج كشف حقيقة نفسية خفية لا يعرفها 99% من البشر، ثم بناء معضلة أخلاقية قاسية حولها، مع إرشاد صادق ومؤثر.
كل النماذج الثلاثة كانت مؤثرة بشكل عاطفي وغير متوقع.
والحقيقة؟
لذلك حصلت جميعها على العلامة الكاملة.
النتيجة النهائية: من هو أقوى نموذج ذكاء اصطناعي اليوم؟
بعد جمع النقاط:
🥇 المركز الأول: جيمي نايتري – 12 نقطة
🥈 المركز الثاني: جروك 4.1 – 9.5 نقطة
🥉 المركز الثالث: GPT-5.1 – 5 نقاط فقط
النموذج العبقري المتفوّق في البرمجة والرؤية والإبداع.
الأذكى والأصدق، سيد الرياضيات والدقة والمعلومات.
أداء جيد… لكن لا يرقى لمستوى المنافسين في معظم الجبهات.
الخلاصة: هل عادت Google فعلاً؟ وهل تستعد OpenAI للرد؟
الحقيقة أن المشهد تغيّر بالكامل:
-
جيمي نايتري أثبت أن Google لم تعد نائمة، بل عادت بقوة خارقة.
-
جروك 4.1 ظهر مثل “حكيم” الذكاء الاصطناعي… دقيق، صادق، منطقي.
-
GPT-5.1 يبدو أنه يتراجع… وهذا غريب على OpenAI.
ويبقى السؤال الآن:
هل ستفاجئنا OpenAI قبل نهاية السنة بشيء ينقل الذكاء الاصطناعي إلى مستوى جديد؟
أم أن Google وإيلون ماسك قد سبقاها بالفعل؟
ومن يحب أن يحصل على التلقينات والأسئلة المستعملة في هذه الاختبارات، سأشاركها لكم.
اكتبوا رأيكم في التعليقات…
