تطلق OpenAI Operator، وهو أول وكيل ذكاء اصطناعي قادر على حجز الحجوزات والسفر وشراء المنتجات

كشفت OpenAI النقاب عن Operator، وهو أول وكيل للذكاء الاصطناعي، لمشتركي ChatGPT Pro في الولايات المتحدة.
يمكنه إكمال المهام بشكل مستقل، مثل حجز الحجوزات أو شراء البقالة.
يتم تشغيل الوكيل بواسطة نموذج جديد مدمج في GPT-4o يسمى CUA.

توقع الخبراء أن يكون عام 2025 هو العام الذي يصبح فيه عملاء الذكاء الاصطناعي سائدين، وتقوم OpenAI بتنفيذ هذه التوقعات.

كشفت شركة OpenAI يوم الخميس عن Operator، وهو نظام يمكنه استخدام متصفح الويب للقيام بكل شيء بدءًا من حجز حجوزات السفر وحتى شراء المنتجات.

في حين أن روبوتات الدردشة مثل ChatGPT الشهيرة من OpenAI تستخدم الذكاء الاصطناعي التوليدي للرد على الاستفسارات، فإن المشغل هو وكيل يؤدي المهام بشكل مستقل.

سيكون المشغل متاحًا يوم الخميس في الولايات المتحدة لمستخدمي ChatGPT Pro، وهي خطة شهرية بقيمة 200 دولار تتيح للمستخدمين الوصول إلى أحدث موديلاتها، بما في ذلك o1. وفي الأشهر المقبلة، سيتم إتاحته أيضًا لمشتركي ChatGPT Plus، ومستوى الاشتراك الشهري في OpenAI بقيمة 20 دولارًا، والمستخدمين في البلدان الأخرى.

خلال البث المباشر للإعلان عن المشغل يوم الخميس، وصف سام ألتمان، الرئيس التنفيذي لشركة OpenAI، الإصدار بأنه “معاينة بحثية مبكرة”، مضيفًا أنه سيتم تحسينه خلال الأشهر المقبلة. وقال إن OpenAI سيكون لديها أيضًا المزيد من الوكلاء لإطلاقها في الأشهر المقبلة.

الواجهة مشابهة لـ ChatGPT، حيث يقوم المستخدمون ببساطة بمطالبة المشغل بطلب، مثل “حجز حجز عشاء في الساعة 7 مساءً”. يمكن للمستخدمين تحديد موقع ويب معين يريدون من خلاله معالجة الطلب، مثل OpenTable في حالة المطعم الحجز، أو ببساطة إرسال الطلب من خلال محرك بحث مثل جوجل. يلخص المشغل عملية الاستدلال الخاصة به في شريط جانبي حتى يتمكن المستخدمون من تحديد أي خطوة قد يرتكب فيها خطأ بسرعة، وهو ما تقول OpenAI أنه لا يزال عرضة للقيام به.

وقال Reiichiro Nakano، عضو الطاقم الفني للشركة، في البث المباشر، إن المشغل مدعوم من CUA، وهو نموذج جديد مبني على GPT-4o.

وقال: “لقد تم تدريبه على استخدام الكمبيوتر والتحكم فيه بنفس الطريقة التي يستطيع بها البشر، بمجرد النظر إلى الشاشة واستخدام الماوس ولوحة المفاتيح للتحكم فيها”.

وقال ناكانو إن هذا النموذج يتجاوز الحاجة إلى واجهات برمجة التطبيقات (APIs)، وهي الآليات التي تسمح لمكونات البرامج بالتواصل مع بعضها البعض، و”يفتح مجموعة جديدة كاملة من البرامج التي يمكننا استخدامها والتي لم يكن من الممكن الوصول إليها في السابق”.

وأضاف أن النموذج يزيل “عائقًا آخر في طريقنا نحو الذكاء الاصطناعي العام”.

في اختبار مقارنة كيفية تعامل وكلاء الذكاء الاصطناعي مع أنظمة التشغيل الشائعة، سجل Operator 38.1% مقارنة بـ 72.4% للبشر. وفي معيار آخر لمقارنة كيفية تنقل وكلاء الذكاء الاصطناعي في مواقع الويب الشائعة، سجل Operator 58.1% مقارنة بـ 78.2% للبشر.

What's Hot

فاراداي فيوتشر تسلّم مركبة FX Super One إلى شركتي Infinite Glory وNoorizon في دولة الإمارات، معزّزةً تكاملها مع المنظومة المحلية ومسرّعةً وتيرة تسليماتها في الشرق الأوسط

شركة بي سمارت للحلول التكنولوجية.. انطلاقة قوية في السوق الرقمي السعودي

الكتب والأفلام التي تناولت فضيحة إبستين: قراءة في المشهد الثقافي حول سلطة بلا مساءلة