تزداد أهمية القدرة على التنبؤ بالمستقبل كعلامة على الذكاء، وتشكل اختبارًا جيدًا لقدرات الذكاء الاصطناعي. فما مدى جودة برنامج “تشات جي بي تي” في التنبؤ؟ مؤخرًا، ظهرت إجابة على هذا السؤال المثير للاهتمام، وذلك بعد انتهاء الاقتصادي ديفيد سيف من مسابقة للتنبؤات السنوية يديرها لمجموعة سرية من الاقتصاديين ومستثمري صناديق التحوط ومتخصصي التكنولوجيا. وتعتبر هذه المسابقة بمثابة تقييم لقدرات التنبؤ، بما في ذلك التنبؤ بالذكاء الاصطناعي.

في عامها السابع، تتطلب المسابقة من المتسابقين التنبؤ بحوالي 30 حدثًا. وانطلقت النسخة الخاصة بعام 2025 في أواخر عام 2024، عندما أرسل سيف قائمة بالأحداث المطلوب التنبؤ بها في مجالات مثل السياسة والأعمال والعلوم والاقتصاد والثقافة الشعبية والرياضة.

أحد الأسئلة طلب من المتسابقين التنبؤ بما إذا كانت تايلور سويفت وترافيس كِلسي ستعلنان خطوبتهما بحلول الأول من أبريل. سؤال آخر: هل ستعتمد بلغاريا اليورو كعملة رسمية لها بحلول أو قبل الأول من يوليو؟

سام ليفيل، مدير في شركة صندوق تحوط، كان يملأ احتمالاته في ديسمبر، وفكر في شيء ما.

“عندما كنت أجيب على الأسئلة، كان لدي شاشة “تشات جي بي تي” مفتوحة. وتساءلت، ماذا سيقول ل这些 أسئلة؟” ، استذكر في مقابلة حديثة.

تشات جي بي تي كان عليه تعلم قواعد معقدة

تواصل ليفيل مع سيف ليسأله عما إذا كان بإمكان “تشات جي بي تي” المشاركة، وقال سيف: “اذهب وقم بذلك”. وهكذا، بدأ ليفيل بلصق قواعد اللعبة في “تشات جي بي تي”.

هذه قواعد معقدة، تتكون من عدة صفحات. يجب على المتسابقين تعيين نسبة مئوية بناءً على احتمالية حدوث كل حدث. مع ورود النتائج على مدار العام، يتم تسجيل هذه التنبؤات بطريقة مشابهة لنتائج الجولف. يفوز صاحب أقل نتيجة.

“تحصل على نقاط تساوي مربع الفرق بين ما وضعته والنتائج” ، قال سيف.

على سبيل المثال، إذا قمت بتعيين فرصة 90٪ لحدوث شيء ما ونجحت في ذلك، فستحصل على 10 نقاط. يتم تربيع هذا الرقم، مما ينتج عنه إجمالي 100 نقطة. عمل ممتاز.

الشيء العكسي أكثر إيلامًا. إذا لم يحدث الحدث الذي قدرت احتماليته 90٪، فستلتزم بالفرق بين 90 وصفر. يتم تربيع هذا الرقم 90 للحصول على إجمالي 8100 نقطة. يا لها من صدمة.

وهذا يمثل فقط نظام التسجيل. هناك صفحات كاملة من القواعد حول جوانب أخرى من اللعبة. قام ليفيل بلصق كل هذا في “تشات جي بي تي”.

بعد ثوانٍ قليلة، أجاب روبوت الدردشة بالذكاء الاصطناعي: “شكرًا لك على تزويدي بالقواعد التفصيلية لمسابقة التنبؤ. يرجى مشاركة القائمة النظيفة للمطالبات التي تحتاج إلى تقدير احتمالي لها، وسأقدم رقمًا واحدًا لكل منها وفقًا لإرشادات المسابقة.”

قام ليفيل بلصق جميع الأسئلة الثلاثين مرة واحدة، ورد “تشات جي بي تي” بسرعة باحتمالاته المئوية لكل حدث. أرسل ليفيل هذه الاحتمالات إلى سيف، الذي أدخل ردود “تشات جي بي تي” نيابة عنه.

حتى أثناء إعداد هذا التجربة للتنبؤ الآلي، لاحظ ليفيل شيئًا مثيرًا للاهتمام.

“بالنسبة لسؤال واحد، يتعلق بنتيجة بطاقة برية في دوري كرة القدم الأمريكية للمحترفين، قدم إجابة رياضية كانت صحيحة إحصائيًا” ، قال. “كان يقوم بعمليات حسابية بدلاً من أمور نوعية. كان هذا ملحوظًا لأن “تشات جي بي تي” لم يكن من المفترض أن يكون جيدًا في الرياضيات في ذلك الوقت.”

تشات جي بي تي يقدم تنبؤات

مع بداية عام 2025، قدم 160 متسابقًا تنبؤاتهم وبدأوا في انتظار المستقبل للكشف عن نفسه.

في هذه المرحلة، سمعت عن اللعبة لأول مرة من خلال الأصدقاء الذين شاركوا فيها. أحدهم مدير في صندوق تحوط. والاثنان الآخران هما مدير تسويق ومحامٍ.

لقد أصبحوا لا يطاقون في الحفلات، حيث يناقشون تنبؤاتهم المختلفة، إلى جانب تعقيدات نظام التسجيل والقواعد الأخرى.

إنه نوع الحديث الذي يملّني. لكن عندما ذكر أحد أصدقائي أن “تشات جي بي تي” يشارك لأول مرة، استيقظت اهتمامي.

هل يمكن للآلة أن تتفوق على 160 إنسانًا في التنبؤ بجميع هذه الأحداث؟ نماذج الذكاء الاصطناعي رائعة عندما يكون هناك بيانات موجودة. عندما يتعلق الأمر بالمستقبل، هناك قدر أقل من المعلومات للاعتماد عليها.

لقد اختبرت مؤخرًا قدرة “تشات جي بي تي” على التنبؤ بسوق الأسهم. هل يمكن أن يتفوق في هذا التحدي الأكثر تعقيدًا، أم أن البشر يتمتعون بشكل فريد بالقدرة على توقع المستقبل من خلال الخبرة والاستقراء والحدس؟

مع تقدم العام، حدثت بعض الأحداث، ولم يحدث البعض الآخر. البعض حدث متأخرًا جدًا، والبعض الآخر تطور بطرق غريبة وغير متوقعة. كما يحدث في الحياة.

في كل مرة يتم فيها حل سؤال، قام سيف بتحديث جدول بيانات مركزي وأرسل تصنيفًا لجميع المتسابقين.

لقد استولى أصدقائي على كل تحديث. من كان يفوز؟ من كان متخلفًا؟ والأهم من ذلك، ما هو ترتيب “تشات جي بي تي”؟

تماثل غريب

انتهت اللعبة في 13 نوفمبر.

“للمرة الأولى في السنوات السبع التي أجرينا فيها المسابقة، نجحت في الفوز بنفسي” ، كتب سيف في تحديثه الأخير عبر البريد الإلكتروني لمسابقة 2025.

احتل “تشات جي بي تي” المركز الثمانين، كما كتب، “وكان لدينا 160 لاعبًا”.

تماثل غريب. أرسلت رسالة نصية على الفور إلى أصدقائي: هذا يعني أن “تشات جي بي تي” ليس أفضل من الإنسان العادي! ليس مثيرًا للإعجاب للغاية.

رد أحد أصدقائي، مدير التسويق: “لا، هذا يعني أن “تشات جي بي تي” جيد مثل الإنسان العادي. لا يصدق!”

تشات جي بي تي فاته معيار

طلبت من سيف التعليق على هذا، وكان لديه طريقة مختلفة لقياس قوة “تشات جي بي تي” التنبؤية، أو عدم وجودها.

إذا كنت قد وضعت احتمال 50٪ لحدوث كل حدث، فستحصل على 75000 نقطة. هذا هو معيار سيف لمعرفة ما إذا كان المتسابقون قد أضافوا قيمة أم لا.

حصل “تشات جي بي تي” على 82925 نقطة. لذلك، فاته هذا المعيار، وأضاف قيمة سلبية بشكل أساسي، وفقًا لسيف.

عندما كانت هناك الكثير من البيانات الموجودة للمساعدة في التنبؤ وحساب الاحتمالات، كان “تشات جي بي تي” أفضل، حسب قوله.

على سبيل المثال، حلل روبوت الدردشة هذا الحدث جيدًا، معطياً إياه فرصة 70٪ للحدوث: الفريق الفائز في كأس العالم للأندية التابعة للفيفا من الاتحاد الأوروبي.

أداء “تشات جي بي تي” كان أسوأ عندما كان هناك نقص في البيانات، أو فاته معلومات جديدة غيرت احتمالية حدوث حدث ما.

على سبيل المثال، أعطى روبوت الدردشة فرصة 95٪ لحدوث هذا: شؤون رواد الفضاء سوني ويليامز وبوتش وليمور بالعودة بأمان إلى الأرض بحلول الأول من مارس.

بحلول نهاية عام 2024، أشارت الإعلانات الإخبارية إلى أن هذه المهمة الإنقاذية من غير المرجح أن تحدث بحلول الأول من مارس 2025، كما قال سيف.

“لم يكن تشات جي بي تي على اطلاع بالأخبار” ، أضاف.

ربما فاز تشات جي بي تي؟

قدم ليفيل، مدير صندوق التحوط الذي أدخل “تشات جي بي تي” في اللعبة، استنتاجات مختلفة وشارك بعض التحذيرات المهمة.

طلب من “تشات جي بي تي” تقديم هذه التنبؤات في ديسمبر 2024. تحسن روبوت الدردشة التابع لـ OpenAI منذ ذلك الحين، لذلك قد تكون قدرته على التنبؤ أفضل الآن. قد يكون التوجيه الأفضل قد ساعد “تشات جي بي تي” على الأداء بشكل أفضل أيضًا.

قال ليفيل أيضًا أن “تشات جي بي تي” استغرق بضع دقائق فقط لفهم القواعد المعقدة للعبة وتقديم 30 تنبؤًا – وهو أسرع بكثير من معظم المتسابقين البشريين.

استغرق هو نفسه ساعات عديدة، على مدى عدة أيام، لفهم الأسئلة والبحث في الأحداث، وتقديم احتمالاته الخاصة.

“لقد كان أداؤه أفضل من نصف الأشخاص، وقضى وقتًا أقل من أي شخص آخر في التحدي” ، قال لي. “إذا نظرت إلى النتائج لكل دقيقة من العمل، فربما يكون تشات جي بي تي هو الفائز؟”

بصفته مستثمرًا، فهو في مجال تقييم أكبر عدد ممكن من الاحتمالات، لذلك أصبحت أدوات الذكاء الاصطناعي مثل “تشات جي بي تي” ضرورية، على حد قوله.

“ماذا لو لم تكن بحاجة إلى التنبؤ بـ 30 حدثًا بسرعة، ولكن 30000 حدث بدلاً من ذلك؟ ماذا لو كان جيدًا بما يكفي لتقديم كل هذه التنبؤات بسرعة؟” قال ليفيل.

“لقد أصبح منتشرًا في كل ما أقوم به، في حياتي الشخصية وفي العمل” ، أضاف. “نحن نستخدمه كثيرًا. تشات جي بي تي هو الحد الأدنى المطلوب في الوقت الحالي.”

شاركها.