جلوبال جي بي تي تي

GPT‑5.1 مقابل Claude Sonnet 4.5: اختبار عميق في الكتابة والبرمجة والأتمتة – الكشف عن الفائز المفاجئ

GPT‑5.1 مقابل Claude Sonnet 4.5

في وقت مبكر من صباح أمس،, أصدرت OpenAI GPT‑5.1. قضيت يوماً كاملاً في إجراء اختبارات عميقة وعملية عليه — وقد لا تكون النتائج كما تتوقعون.

إذا كنت ترغب في تجربة GPT‑5.1 الآن، فإن GlobalGPT قد قامت بالفعل دمج هذا النموذج الأقوى.

chatgpt 5.2 globalgpt

الخلاصة

نعم, يُظهر GPT‑5.1 تقدماً حقيقياً مقارنةً بـ GPT‑5 منذ ثلاثة أشهر. ولكن إذا كنت تأمل في تحقيق قفزة كبيرة تغير قواعد اللعبة، فقد تصاب بخيبة أمل. بصراحة: في العديد من المهام الواقعية، لا يزال يتخلف عن الركب. كلود سونيت 4.5.

هذا ليس انتقادًا — هذه نتائج الاختبارات. لقد أجريت تقييمات متوازية عبر سيناريوهات متعددة: الكتابة الطويلة، والتأليف الأدبي، وتطوير الواجهة الأمامية، والمزيد. كانت بعض النتائج مفاجئة حقًا.

ما الذي تغير في GPT‑5.1

OpenAI اتخذت براغماتي النهج المتبع في هذا التحديث. عندما تم إطلاق GPT‑5 قبل ثلاثة أشهر، حدثت مشاكل — أبلغ المستخدمون عن أداء أسوأ من الإصدارات القديمة، من أخطاء حسابية إلى كود غير مستقر. ألقت OpenAI باللوم على مشكلة في “نظام التوجيه”، حيث لم تكن الذكاء الاصطناعي تختار النموذج الداخلي الصحيح للردود.

في GPT‑5.1، تركز التغييرات على ثلاثة مجالات رئيسية:

  1. وضعان مزدوجان.
    الوضع الفوري للسرعة في المحادثات غير الرسمية؛; وضع التفكير للمشاكل المعقدة، مع تعديل وقت الاستدلال ديناميكيًا. يبدو واعدًا — وفي اختباراتي، إنه بالفعل أكثر مرونة من GPT‑5.
  2. تقليل الهلوسة.
    تشير الإحصائيات الرسمية إلى أن معدل الهلوسة انخفض من 4.8% إلى 2.1%. في الواقع، أصبح الناس أكثر استعدادًا للاعتراف بـ “لا أعرف” بدلاً من اختلاق الأكاذيب.
  3. أنماط مخصصة.
    ثمانية أنماط محادثة قابلة للتحديد، من الرسمية إلى المرحة. هذا مفيد حقًا — يمكنك مطابقة النمط مع السيناريو.

نتائج الاختبار: الكتابة الطويلة — خسارة واضحة

كان معياري الأول هو أن يقوم كلا النموذجين بإنتاج تقرير دراسة من 10,000 كلمة، باستخدام نفس مستودع المشروع مفتوح المصدر كمواد مصدرية.

النتائج:

  • GPT‑5.1: ~31,000 حرف
  • كلود سونيت 4.5: حوالي 51,000 حرف

كتب كلود ما يقرب من ضعف ذلك. لم يكن هذا أمراً استثنائياً — ففي العديد من التجارب، كان GPT‑5.1 يميل إلى أكثر تحفظًا. إذا كنت بحاجة إلى تقارير طويلة ومفصلة، فإن كلود يتفوق في هذا المجال.

في اختبار ثانٍ، طلبت مقالاً من حوالي 1000 كلمة لتقديم المشروع.

  • GPT‑5.1: أكثر من 1600 كلمة، تفاصيل تقنية غنية، ولكنها أكثر ملاءمة للمطورين.
  • كلود: أكثر من 1400 كلمة، أقرب إلى الطول المطلوب، سهل الفهم للمبتدئين.

قامت Gemini 2.5 Pro بتقييم GPT‑5.1 على أنه وثائق فنية و Claude على أنه علم شعبي. كلاهما له مزاياه، لكن Claude تفوق في عدد الكلمات واستهداف الجمهور.

التأليف الأدبي: فجوة ملحوظة

هذا الاختبار فاجأني حقًا. طلبت منهم كتابة قصيدة “سي” من عصر أسرة سونغ في وانغهايشاو بصيغة “الخريف يتلاشى إلى الشتاء؛ رثاء على مرور الزمن”، مع الالتزام الصارم بقواعد النغمة.

  • كلود سونيت 4.5: تم إنجازه في 50 ثانية، صور كلاسيكية (الصقيع، الأوز البري، برك اللوتس)، العاطفة في مكانها الصحيح، قواعد النغمة صحيحة في الغالب، فقط خطأ بسيط واحد في الموضوع.
  • GPT‑5.1: استغرق وقتًا أطول، وتطابق مع قواعد النبرة، ولكن تكررت الصور، وأسيء استخدام “براعم الخيزران الجديدة” (صورة ربيعية)، وبدا صلبًا.

في الشعر الكلاسيكي — حيث الصور البلاغية والأناقة مهمة — تأخر GPT‑5.1 عن كلود.

تطوير الواجهة الأمامية: مكاسب مختلطة

المهام التي تم اختبارها:

  1. رسوم متحركة SVG: قط وكلب يمشيان على العشب، وسحب وطيور في السماء.
    • حيوانات GPT‑5.1 مجردة للغاية بحيث يتعذر تمييزها؛;
    • كلود معروف بكونه قططياً/كلبياً، وأفضل الطيور.
  2. تصميم واجهة المستخدم: لوحة تحكم لإدارة خلية النحل.
    • كان تصميم كلود أنيقًا من حيث اللون والتخطيط والطباعة؛;
    • اختار GPT‑5.1 درجات اللون الأسود الداكنة، الأقل جاذبية.
  3. استعادة الصفحة من لقطة الشاشة:
    • كلاهما دقيق؛;
    • ألوان كلود أكثر تناسقًا، لون خلفية GPT‑5.1 غير متناسق قليلاً.
  4. تطوير ثلاثي الأبعاد (لعبة مكعب روبيك Three.js):
    • كلاهما فشل. عرض كلود مكعبًا ولكن زر “الخلط” لم يعمل؛ ولم يعرض GPT‑5.1 المكعب على الإطلاق.

لا تزال التطبيقات ثلاثية الأبعاد المعقدة تتجاوز كلاهما.

رسوم متحركة ببيثون: لعبة التعادل

مهمة ممتعة: تصور عملية الفرز الفقاعي باستخدام 12 بطة صغيرة بأحجام مختلفة وأم بطة واحدة تقوم بفرزها من الأصغر إلى الأكبر.

  • كلود: البط كبير/كثيف للغاية، مما يحجب التفاصيل، لكن المنطق صحيح.
  • GPT‑5.1: بطة أبسط، فرق أقل في الحجم، ومنطق صحيح أيضًا.

حداثة المعرفة: كلود ليدز

تواريخ قطع المعرفة:

  • GPT‑5.1: يونيو 2024
  • كلود سونيت 4.5: يناير 2025

هذا فارق مدته سبعة أشهر — وهو أمر مهم بالنسبة للتكنولوجيا المتطورة والأحداث الجارية.

أتمتة المتصفح: تحسين GPT‑5.1

تم اختباره في متصفح Atlas من OpenAI: قم بزيارة مدونة، واستخرج المقالة الأولى، وأعد كتابتها، واستعد لنشرها على X.

أكمل GPT‑5.1 المهمة في 1 دقيقة و 5 ثوانٍ — أسرع من GPT‑5 — وتعامل مع التدفق بسلاسة، ولم يتوقف إلا عند النشر (يتطلب مراجعة بشرية). واحدة من أوضح مزاياه مقارنة بسابقه.

الحكم النهائي: تقدم، لكن لا تتوقع الكثير

نقاط القوة:

  • تحسن حقيقي مقارنة بـ GPT‑5، خاصة في تقليل الهلوسة وأتمتة المتصفح.
  • ميزات تخصيص عملية.
  • من المحتمل أن تكون الرياضيات/البرمجة أقوى (وفقًا للبيانات الرسمية).

نقاط الضعف:

  • الكتابة الطويلة لا تزال وراء كلود.
  • الأعمال الأدبية (الشعر والنثر) أقل أناقة.
  • جماليات تصميم واجهة المستخدم أضعف.
  • لا يمكنه إدارة التطبيقات ثلاثية الأبعاد المعقدة.
  • المعرفة متخلفة عن كلود.

التوصيات:

  • تقارير طويلة → كلود
  • الكتابة بأسلوب/صور → كلود
  • تصميم واجهة المستخدم → كلود أولاً
  • الرياضيات والبرمجة والمنطق → جرب GPT‑5.1
  • أتمتة المتصفح → GPT‑5.1 جيد
  • دردشة غير رسمية/بحث سريع → كلاهما يعمل

لعبت OpenAI على المضمون — بإصلاح الأخطاء وتحسين التجربة — لكنها لم تتفوق على منافسيها. وفي بعض المجالات، لا تزال متخلفة عن الركب.

أصبحت المنافسة في مجال الذكاء الاصطناعي شديدة للغاية؛ فكل نموذج له نقاط قوة ونقاط ضعف. والخطوة الذكية هي الاختيار حسب المهمة، وليس التمسك بنموذج واحد بشكل أعمى.

نصيحتي: إذا كان لديك Plus، اشترك في كل من ChatGPT وClaude. قم بالتبديل حسب الحاجة. بالنسبة للمحترفين، جرب كلاهما لتجد الأنسب لطريقة عملك.

بعد ثلاثة أشهر من تعثر GPT-5، أصبح الإصدار 5.1 مستقرًا، ولكنه ليس مذهلًا.

هل جربت GPT‑5.1؟ شارك تجربتك في التعليقات.

بيئة الاختبار:

  • التاريخ: 14 نوفمبر 2025
  • GPT‑5.1: وضع التفكير
  • كلود سونيت 4.5: وضع التفكير
  • المهام: الكتابة الطويلة، التأليف الأدبي، تطوير الواجهة الأمامية، الرسوم المتحركة باستخدام لغة Python، أتمتة المتصفح
شارك المنشور:

منشورات ذات صلة

جلوبال جي بي تي تي
  • اعمل بذكاء أكبر مع منصة الذكاء الاصطناعي الكل في واحد #1
  • كل ما تحتاجه في مكان واحد: الدردشة بالذكاء الاصطناعي والكتابة والبحث وإنشاء صور ومقاطع فيديو مذهلة
  • وصول فوري أكثر من 100 من أفضل عارضات الأزياء والوكلاء في مجال الذكاء الاصطناعي – GPT 5.1، Gemini 3 Pro، Sora 2، Nano Banana Pro، Perplexity...