GPT‑5.1 مقابل Claude Sonnet 4.5: اختبار عميق في الكتابة والبرمجة والأتمتة – الكشف عن الفائز المفاجئ

2025-11-14
06:17
كلود ماكنزي
آخر تحديث 2026-02-12

GPT-5.1 هو آخر تحديث للاستقرار في OpenAI، حيث يقدم تحديثًا ديناميكيًا “وضع التفكير” وتقليل معدلات الهلوسة من 4.8% إلى 2.1% لإصلاح أخطاء التوجيه السابقة. ومع ذلك، تؤكد اختباراتنا أنه لا يزال يتتبع كلود سونيت 4.5 في الكتابة الطويلة والجماليات، مما يجعل من المحبط دفع اشتراك قياسي رسوم الطراز الذي لم يعد يهيمن على كل فئة.

جلوبال جي بي تي تي يزيل هذا التجزئة من خلال دمج كل نموذج من الدرجة الأولى في واجهة واحدة، مما يسمح لك باستخدام أفضل أداة للمهمة دون تبديل المنصات. يوفر وصولاً فوريًا إلى GPT-5.1، GPT-5.2, و كلود سونيت 4.5. الخطة الأساسية التي تبدأ في $5.8 فقط , ، لا تحصل على أقفال منطقة وحرية التبديل بين الطرازات على الفور، واستبدال الطرازات المكلفة عضويات منفصلة بسير عمل واحد وقوي.

جرب GPT-5.2 الآن >

الخلاصة

نعم, يُظهر GPT‑5.1 تقدماً حقيقياً مقارنةً بـ GPT‑5 من ثلاثة أشهر مضت. ولكن إذا كنت تأمل في تحقيق قفزة مهيمنة ومغيّرة لقواعد اللعبة، فقد تصاب بخيبة أمل. بعبارة صريحة: في العديد من المهام الواقعية، لا تزال مسارات سونيت كلود سونيت 4.5.

هذا ليس انتقادًا — هذه نتائج الاختبارات. لقد أجريت تقييمات متوازية عبر سيناريوهات متعددة: الكتابة الطويلة، والتأليف الأدبي، وتطوير الواجهة الأمامية، والمزيد. كانت بعض النتائج مفاجئة حقًا.

ما الذي تغير في GPT‑5.1

OpenAI اتخذت براغماتي النهج المتبع في هذا التحديث. عندما تم إطلاق GPT‑5 قبل ثلاثة أشهر، حدثت مشاكل — أبلغ المستخدمون عن أداء أسوأ من الإصدارات القديمة، من أخطاء حسابية إلى كود غير مستقر. ألقت OpenAI باللوم على مشكلة في “نظام التوجيه”، حيث لم تكن الذكاء الاصطناعي تختار النموذج الداخلي الصحيح للردود.

في GPT‑5.1، تركز التغييرات على ثلاثة مجالات رئيسية:

وضعان مزدوجان.
الوضع الفوري للسرعة في المحادثات غير الرسمية؛; وضع التفكير للمشاكل المعقدة، مع تعديل وقت الاستدلال ديناميكيًا. يبدو واعدًا — وفي اختباراتي، إنه بالفعل أكثر مرونة من GPT‑5.
تقليل الهلوسة.
تشير الإحصائيات الرسمية إلى أن معدل الهلوسة انخفض من 4.8% إلى 2.1%. في الواقع، أصبح الناس أكثر استعدادًا للاعتراف بـ “لا أعرف” بدلاً من اختلاق الأكاذيب.
أنماط مخصصة.
ثمانية أنماط محادثة قابلة للتحديد، من الرسمية إلى المرحة. هذا مفيد حقًا — يمكنك مطابقة النمط مع السيناريو.

نتائج الاختبار: الكتابة الطويلة — خسارة واضحة

كان معياري الأول هو أن يقوم كلا النموذجين بإنتاج تقرير دراسة من 10,000 كلمة، باستخدام نفس مستودع المشروع مفتوح المصدر كمواد مصدرية.

النتائج:

GPT‑5.1: ~31,000 حرف
كلود سونيت 4.5: حوالي 51,000 حرف

كتب كلود ضعف ذلك تقريبًا. لم يكن هذا لمرة واحدة - عبر تجارب متعددة، كان GPT-5.1 يميل إلى أن يكون أكثر تقييدًا. إذا كنت بحاجة إلى تقارير طويلة ومفصلة, كلود يأتي في المقدمة.

في اختبار ثانٍ، طلبت مقالاً من حوالي 1000 كلمة لتقديم المشروع.

GPT‑5.1: أكثر من 1600 كلمة، تفاصيل تقنية غنية، ولكنها أكثر ملاءمة للمطورين.
كلود: أكثر من 1400 كلمة، أقرب إلى الطول المطلوب، سهل الفهم للمبتدئين.

قامت Gemini 2.5 Pro بتقييم GPT‑5.1 على أنه وثائق فنية و Claude على أنه علم شعبي. كلاهما له مزاياه، لكن Claude تفوق في عدد الكلمات واستهداف الجمهور.

التأليف الأدبي: فجوة ملحوظة

هذا الاختبار فاجأني حقًا. طلبت منهم كتابة قصيدة “سي” من عصر أسرة سونغ في وانغهايشاو بصيغة “الخريف يتلاشى إلى الشتاء؛ رثاء على مرور الزمن”، مع الالتزام الصارم بقواعد النغمة.

كلود سونيت 4.5: تم إنجازه في 50 ثانية، صور كلاسيكية (الصقيع، الأوز البري، برك اللوتس)، العاطفة في مكانها الصحيح، قواعد النغمة صحيحة في الغالب، فقط خطأ بسيط واحد في الموضوع.
GPT‑5.1: استغرق وقتًا أطول، وتطابق مع قواعد النبرة، ولكن تكررت الصور، وأسيء استخدام “براعم الخيزران الجديدة” (صورة ربيعية)، وبدا صلبًا.

في الشعر الكلاسيكي — حيث الصور البلاغية والأناقة مهمة — تأخر GPT‑5.1 عن كلود.

تطوير الواجهة الأمامية: مكاسب مختلطة

المهام التي تم اختبارها:

رسوم متحركة SVG: قط وكلب يمشيان على العشب، وسحب وطيور في السماء.
- حيوانات GPT‑5.1 مجردة للغاية بحيث يتعذر تمييزها؛;
- كلود معروف بكونه قططياً/كلبياً، وأفضل الطيور.
تصميم واجهة المستخدم: لوحة تحكم لإدارة خلية النحل.
- كان تصميم كلود أنيقًا من حيث اللون والتخطيط والطباعة؛;
- اختار GPT‑5.1 درجات اللون الأسود الداكنة، الأقل جاذبية.
استعادة الصفحة من لقطة الشاشة:
- كلاهما دقيق؛;
- ألوان كلود أكثر تناسقًا، لون خلفية GPT‑5.1 غير متناسق قليلاً.
تطوير ثلاثي الأبعاد (لعبة مكعب روبيك Three.js):
- كلاهما فشل. عرض كلود مكعبًا ولكن زر “الخلط” لم يعمل؛ ولم يعرض GPT‑5.1 المكعب على الإطلاق.

لا تزال التطبيقات ثلاثية الأبعاد المعقدة تتجاوز كلاهما.

رسوم متحركة ببيثون: لعبة التعادل

مهمة ممتعة: تصور عملية الفرز الفقاعي باستخدام 12 بطة صغيرة بأحجام مختلفة وأم بطة واحدة تقوم بفرزها من الأصغر إلى الأكبر.

كلود: البط كبير/كثيف للغاية، مما يحجب التفاصيل، لكن المنطق صحيح.
GPT‑5.1: بطة أبسط، فرق أقل في الحجم، ومنطق صحيح أيضًا.

حداثة المعرفة: كلود ليدز

تواريخ قطع المعرفة:

GPT‑5.1: يونيو 2024
كلود سونيت 4.5: يناير 2025

هذا فارق سبعة أشهر - وهو فارق ذو صلة بالتكنولوجيا المتطورة وتقييم حالة كلود ضد ChatGPT في 2025.

أتمتة المتصفح: تحسين GPT‑5.1

تم اختباره في متصفح Atlas من OpenAI: قم بزيارة مدونة، واستخرج المقالة الأولى، وأعد كتابتها، واستعد لنشرها على X.

أكمل GPT‑5.1 المهمة في 1 دقيقة و 5 ثوانٍ — أسرع من GPT‑5 — وتعامل مع التدفق بسلاسة، ولم يتوقف إلا عند النشر (يتطلب مراجعة بشرية). واحدة من أوضح مزاياه مقارنة بسابقه.

الحكم النهائي: تقدم، لكن لا تتوقع الكثير

نقاط القوة:

تحسن حقيقي مقارنة بـ GPT‑5، خاصة في تقليل الهلوسة وأتمتة المتصفح.
ميزات تخصيص عملية.
من المحتمل أن تكون الرياضيات/البرمجة أقوى (وفقًا للبيانات الرسمية).

نقاط الضعف:

الكتابة الطويلة لا تزال وراء كلود.
الأعمال الأدبية (الشعر والنثر) أقل أناقة.
جماليات تصميم واجهة المستخدم أضعف.
لا يمكنه إدارة التطبيقات ثلاثية الأبعاد المعقدة.
المعرفة متخلفة عن كلود.

التوصيات:

تقارير طويلة → كلود
الكتابة بأسلوب/صور → كلود
تصميم واجهة المستخدم → كلود أولاً
الرياضيات والبرمجة والمنطق → جرب GPT‑5.1
أتمتة المتصفح → GPT‑5.1 جيد
دردشة غير رسمية/بحث سريع → كلاهما يعمل

لعب OpenAI بأمان - إصلاح الأخطاء، وتسهيل التجربة - لكنه لم يبتعد عن المنافسون. في بعض المناطق، لا تزال متأخرة في بعض المناطق.

أصبحت المنافسة في مجال الذكاء الاصطناعي شديدة للغاية؛ فكل نموذج له نقاط قوة ونقاط ضعف. والخطوة الذكية هي الاختيار حسب المهمة، وليس التمسك بنموذج واحد بشكل أعمى.

نصيحتي: إذا كان لديك بلس, اشترك في كل من ChatGPT و Claude. قم بالتبديل حسب الحاجة. للمحترفين, تحقق مما إذا كان هناك خيار مجاني أو تجربة كليهما للعثور على أفضل ما يناسب سير عملك.

بعد ثلاثة أشهر من تعثر GPT-5، أصبح الإصدار 5.1 مستقرًا، ولكنه ليس مذهلًا.

هل جربت GPT‑5.1؟ شارك تجربتك في التعليقات.

بيئة الاختبار:

التاريخ: 14 نوفمبر 2025
GPT‑5.1: وضع التفكير
كلود سونيت 4.5: وضع التفكير
المهام: الكتابة الطويلة، التأليف الأدبي، تطوير الواجهة الأمامية، الرسوم المتحركة باستخدام لغة Python، أتمتة المتصفح