لا يزال مستقبل الذكاء الاصطناعي (AI) غير واضح، لكن المحلل المخضرم جيفري كاتزنبرغ يعتقد أننا سنشهد تمييزًا واضحًا بين الشركات الواعدة وتلك التي لا تقدم نتائج حقيقية بحلول عام 2026. ففي حلقة من بودكاست “Sourcery” نُشرت يوم الاثنين، صرّح الرئيس التنفيذي السابق لشركة دريم وركس، والذي تحول إلى مستثمر، بأن التقييم الحقيقي لقطاع الذكاء الاصطناعي سيظهر خلال السنوات القليلة القادمة.
وأشار كاتزنبرغ إلى أن عام 2026 سيكون بمثابة نقطة تحول، حيث سيتم الفصل بين الشركات التي تحقق بالفعل نتائج ملموسة وتلك التي لا تفعل ذلك. هذا التقييم لن يعني بالضرورة أن هناك فائزًا واحدًا فقط، بل سيحدد الشركات القادرة على الاستمرار والنجاح في هذا المجال التنافسي.
تقييم الشركات الناشئة في مجال الذكاء الاصطناعي: التركيز على الإبداع البشري
قبل أن يتولى منصبه الحالي كمستثمر، قاد كاتزنبرغ شركة والت ديزني ستوديوز لمدة عشر سنوات حتى عام 1994، ثم شارك في تأسيس دريم وركس، حيث أشرف على إنتاج أفلام ناجحة مثل “شريك” و”مدغشقر” و”كونغ فو باندا”. في عام 2016، تنحى عن منصبه، وفي عام 2017 أسس شركة “WndrCo” للاستثمار الجريء، مع سوزاي جاسوا، المدير المالي السابق لشركة Dropbox.
وتشمل استثمارات WndrCo شركات مثل Cursor و Harvey و Figma. وبيّن شريك WndrCo، تشينلي وانغ، في نفس الحلقة من البودكاست، كيف يقوم هو وكاتزنبرغ بتقييم الشركات الناشئة في عصر الذكاء الاصطناعي.
الأفراد أولاً
أكد وانغ أنهم يركزون بشكل كبير على الإبداع والقدرات الفريدة للأفراد. وقال إنهم لطالما اعتمدوا على “عبقرية” الناس وقدرتهم على الابتكار، وأنهم يبحثون عن كيفية استثمار هذه القدرات بشكل فعال. وأضاف أنهما لم يقيما أفضل المواهب لديهما بناءً على معايير محددة.
وعلى صعيد متصل بالتقييم المعتمد على المعايير، أشار وانغ إلى أن هذا النهج قد يحد من الإمكانات الحقيقية للأفراد، مستشهدًا بشكاوى الآباء منذ سنوات حول تأثير الاختبارات الموحدة على أطفالهم. ويرى أن تطبيق نفس المنطق على تقييم نماذج الذكاء الاصطناعي قد يكون خطأً، حيث أن المعايير قد لا تعكس القدرة الحقيقية على الابتكار وحل المشكلات.
انتقادات المعايير الحالية لتقييم الذكاء الاصطناعي
لا يقتصر هذا النقد على وانغ وكاتزنبرغ، بل يشاركهما فيه العديد من الباحثين في مجال الذكاء الاصطناعي. ففي منشور على مدونته في مارس، انتقد دين فالنتين، المؤسس والرئيس التنفيذي لشركة ZeroPath للأمن السيبراني المتخصصة في الذكاء الاصطناعي، التقدم الأخير في نماذج الذكاء الاصطناعي واصفًا إياه بأنه “في الغالب هراء”.
وأوضح فالنتين أن فريقه قام بتقييم أداء نماذج مختلفة زعمت تحقيق “بعض التحسينات” منذ إطلاق نموذج Anthropic 3.5 Sonnet في يونيو 2024. لكنه أكد أن أياً من هذه النماذج الجديدة لم يُحدث “فرقًا كبيرًا” في معايير الأداء الداخلية لشركته أو في قدرة المطورين على اكتشاف أخطاء جديدة.
كما خلصت دراسة أجراها باحثون في مركز الأبحاث المشترك التابع للمفوضية الأوروبية، ونُشرت في فبراير، إلى وجود “مشاكل كبيرة” في النهج الحالي لتقييم الذكاء الاصطناعي. وجدت الدراسة أن المعايير غالبًا ما تعطي الأولوية للأداء المتطور على حساب المخاوف المجتمعية الأوسع.
ويرى الخبراء أن التركيز المفرط على المعايير قد يؤدي إلى تطوير نماذج ذكاء اصطناعي تبدو جيدة في الاختبارات، ولكنها تفتقر إلى القدرة على التعامل مع التحديات الحقيقية أو قد تتسبب في آثار جانبية غير مرغوب فيها. وهذا يدعو إلى ضرورة تطوير طرق تقييم أكثر شمولية تأخذ في الاعتبار الجوانب الأخلاقية والاجتماعية لتعلم الآلة.
بالإضافة إلى ذلك، يثير تطور نماذج الذكاء الاصطناعي التوليدي تساؤلات حول كيفية قياس الإبداع والجودة في المحتوى الذي يتم إنتاجه. فالمعايير التقليدية قد لا تكون كافية لتقييم هذه الجوانب، مما يستدعي البحث عن طرق جديدة لتقييم أداء هذه النماذج.
في الختام، من المتوقع أن يشهد عام 2026 تقييمًا حقيقيًا لقدرات شركات الذكاء الاصطناعي، مع تحول التركيز نحو النتائج الملموسة والتطبيقات الفعالة. ومع استمرار الجدل حول فعالية المعايير الحالية، من المرجح أن نشهد جهودًا لتطوير طرق تقييم أكثر شمولية تأخذ في الاعتبار الجوانب الأخلاقية والاجتماعية والقدرة على الابتكار. من المهم متابعة التطورات في هذا المجال لمعرفة كيف ستؤثر على مستقبل الذكاء الاصطناعي.
