كان للتأجير الجديد مهمة بسيطة. كل ما كان عليهم فعله هو تعيين الأشخاص للعمل في مشروع جديد لتطوير الويب بناءً على ميزانية العميل وتوافر الفريق. لكن الموظف سرعان ما واجه مشكلة غير متوقعة: لم يتمكنوا من رفض ملفات حظر منبثقة غير ضارة تحتوي على معلومات ذات صلة.

“هل يمكنك مساعدتي في الوصول إلى الملفات مباشرة؟” قاموا بإرسال رسالة نصية إلى تشن Xinyi ، مدير الموارد البشرية في الشركة. بتجاهل الزر “X” الواضح في الزاوية اليمنى من المنبثقة ، عرضت Xinyi توصيلها بدعم تكنولوجيا المعلومات.

“يجب أن تكون على اتصال معك قريبًا لحل مشكلات الوصول هذه” ، Xinyi رسالة نصية. لكنهم لم يتصلوا به مطلقًا ، ولم يتابع التأجير الجديد. تم ترك المهمة غير مكتملة.

لحسن الحظ ، لا يوجد أي من هؤلاء الموظفين حقيقيين. كانت جزءًا من محاكاة افتراضية مصممة لاختبار كيفية إخراج وكلاء الذكاء الاصطناعي في السيناريوهات المهنية في العالم الحقيقي. تم إنشاء المحاكاة من قبل مجموعة من باحثو جامعة كارنيجي ميلون ، محاكاة زخارف شركة برمجيات صغيرة مع مواقع ويب داخلية ، وبرنامج دردشة تشبه الركود ، وكتيب الموظف ، والروبوتات المعينة-مدير الموارد البشرية وكبير موظفي التكنولوجيا-للاتصال بطلب للمساعدة. داخل الشركة المزيفة التي تسمى TheAgentCompany ، يمكن للوكيل المستقل تصفح الويب ، وكتابة الرمز ، وتنظيم المعلومات في جداول البيانات ، والتواصل مع زملاء العمل.

برز الوكلاء كحدود رئيسية تالية من الذكاء الاصطناعى التنظيمية مثل Google و Amazon و Openai وكل سباق شركة التكنولوجيا الرئيسية الأخرى لبناءها. بدلاً من تنفيذ تعليمات لمرة واحدة مثل chatbot ، يمكن للوكلاء أن يتصرفوا بشكل مستقل نيابة عن شخص ما ، واتخاذ القرارات أثناء التنقل ، والأداء في بيئات غير مألوفة مع القليل من التدخل. إذا كان بإمكان ChatGPT اقتراح بعض عمال النظافة الفراغية للشراء ، فيمكن نظيره من الناحية النظرية اختيار واحد وشرائه لك.

وبطبيعة الحال ، فإن وعد عملاء الذكاء الاصطناعى قد أسرت المديرين التنفيذيين. في دراسة استقصائية لأكثر من 2500 من قادة المجيبين ، قال أكثر من ربع المجيبين إن منظماتهم تستكشف العوامل المستقلة إلى “حد كبير أو كبير جدًا”. في وقت سابق من هذا العام ، قال رئيس Salesforce إن المديرين التنفيذيين اليوم سيقودون آخر القوى العاملة البشرية. توقع مؤسس NVIDIA والرئيس التنفيذي Jensen Huang أن كل قسم لتكنولوجيا المعلومات في كل شركة “سيكون قريبًا” وزارة الموارد البشرية “. قال سام التمان من Openai إنه هذا العام ، سينضم وكلاء الذكاء الاصطناعى إلى “القوى العاملة”. لكن لا يزال من غير الواضح مدى قدرة هؤلاء الوكلاء على إنجاز المهام التي قد تحتاجها الشركة لهم.

لاختبار هذا ، كارنيجي ميلون طلب الباحثون نماذج الذكاء الاصطناعي من Google و Openai و Anthropic و Meta لاستكمال المهام التي قد يقوم بها الموظف الحقيقي في مجالات مثل التمويل والإدارة وهندسة البرمجيات. في واحد ، كان على الذكاء الاصطناعى التنقل عبر عدة ملفات لتحليل قواعد بيانات سلسلة المقاهي. في آخر ، طُلب من ذلك جمع التعليقات على مهندس يبلغ من العمر 36 عامًا وكتابة مراجعة أداء. تحدى بعض المهام القدرات البصرية للموديلات: تطلب واحدة من النماذج مشاهدة جولات الفيديو من مساحات المكاتب الجديدة المحتملة واختيار أفضل المرافق الصحية.

لم تكن النتائج رائعة: النموذج الأعلى الأداء ، كلود 3.5 Sonnet من الإنسان ، أنهى أقل بقليل من ربع جميع المهام. الباقي ، بما في ذلك Flash Gemini 2.0 من Google والطويلة التي تشغل chatgpt ، أكملت حوالي 10 ٪ من المهام. يقول جراهام نيوبيج ، أستاذ علوم الكمبيوتر في CMU وأحد مؤلفي الدراسة ، لم يكن هناك فئة واحدة قام بها وكلاء الذكاء الاصطناعي بإنجاز غالبية المهام. النتائج ، إلى جانب الأبحاث الناشئة الأخرى حول وكلاء الذكاء الاصطناعى ، تعقد فكرة أن القوى العاملة لوكيل الذكاء الاصطناعى هي قاب قوسين أو أدنى – هناك الكثير من العمل الذي لم يكونوا جيدًا فيه. لكن البحث يقدم لمحة عن الطرق المحددة التي يمكن أن تحدثها عوامل الذكاء الاصطناعي في مكان العمل.


قبل عامين ، أصدرت Openai دراسة تمت مناقشتها على نطاق واسع والتي من المرجح أن يتم استبدال المهن مثل المحللين الماليين والمسؤولين والباحثين. لكن الدراسة استندت إلى استنتاجاتها على ما قاله البشر ونماذج اللغة الكبيرة أنه من المحتمل أن تكون آلية – دون قياس ما إذا كان بإمكان وكلاء LLM القيام بهذه الوظائف بالفعل. أراد فريق Carnegie Mellon أن يملأ هذه الفجوة مع معيار مرتبط مباشرة بأداة العالم الحقيقي.

في العديد من السيناريوهات ، بدأ عملاء الذكاء الاصطناعى في الدراسة بشكل جيد ، ولكن عندما أصبحت المهام أكثر تعقيدًا ، واجهوا قضايا بسبب افتقارهم إلى الحس السليم أو المهارات الاجتماعية أو القدرات الفنية. على سبيل المثال ، عندما يُطلب من لصق إجاباته على الأسئلة في “الإجابة. لم تستطع إضافة إجاباتها إلى المستند. كما أساء الوكلاء بشكل روتيني تفسير المحادثات مع الزملاء أو لن يتابعوا الاتجاهات الرئيسية ، مما يميز المهمة قبل الأوان.

من السهل نسبيًا تعليمهم أن يكونوا شركاء محادثة لطيفة ؛ من الصعب تعليمهم أن يفعلوا كل ما يمكن للموظف البشري.

خلصت دراسات أخرى إلى أن الذكاء الاصطناعى لا يمكنه مواكبة الوظائف متعددة الطبقات: وجدت واحدة أن الذكاء الاصطناعى لا يمكن أن يتنقل بمرونة في البيئات المتغيرة بمرونة ، وأن العوامل التي تم العثور عليها الأخرى تكافح من أجل الأداء على المستويات البشرية عندما تغمرها الأدوات والتعليمات.

يقول نيوبيج: “على الرغم من أن الوكلاء يمكن استخدامهم لتسريع جزء من المهام التي يقوم بها العمال البشريون ، فمن المحتمل ألا يكونوا بديلاً لجميع المهام في الوقت الحالي”.

كانت دراسة كارنيجي ميلون بعيدة عن محاكاة مثالية لكيفية عمل الوكلاء في البرية. يتصور معظم مؤيدي الوكلاء أنهم يعملون جنبًا إلى جنب مع الإنسان الذي يمكن أن يساعد في التصحيح إذا واجهت الذكاء الاصطناعى حاجزًا واضحًا. إن توليد الوكلاء الذين تمت دراستهم ليس أيضًا ماهرًا في تنفيذ المهام البشرية مثل تصفح الويب. من المحتمل أن تكون الأدوات الجديدة ، مثل مشغل Openai ، أكثر مهارة في هذه المهام.

على الرغم من هذه القيود ، يقدم البحث شيئًا ذا قيمة: إنه يشير إلى ما سيحدث بعد ذلك.

يقول ستيفن كاسبر ، باحث من الذكاء الاصطناعي الذي كان جزءًا من فريق معهد ماساتشوستس للتكنولوجيا الذي طور أول قاعدة بيانات عامة للأنظمة الوكلاء المنشورة ، إن الوكلاء “متفرغون بشكل يبعث على السخرية في قدراتهم”. يقول إن السبب الرئيسي لعلماء الذكاء الاصطناعى يكافحون لإنجاز المهام في العالم الحقيقي هو أنه “من الصعب تدريبهم على القيام بذلك”. معظم أنظمة الذكاء الاصطناعي الحديثة هي عبارة عن مفاتيح دردشة لائقة لأنه من السهل نسبيًا تعليمهم أن يكونوا شركاء محادثة لطيفين ؛ من الصعب تعليمهم أن يفعلوا كل ما يمكن للموظف البشري.

في TheAgentCompany ، نجحت الذكاء الاصطناعى في أكثر من مهام تطوير البرمجيات ، على الرغم من أن هذه هي أكثر صعوبة على البشر. يفترض الباحثون أن هذا يرجع إلى وجود وفرة من بيانات التدريب المتاحة للجمهور لوظائف البرمجة ، في حين أن سير العمل للمهام الإدارية والمهام عادة ما تكون خاصة داخل الشركات. لا توجد بيانات رائعة لتدريب الذكاء الاصطناعي.

يعتقد جيف كلون ، أستاذ علوم الكمبيوتر بجامعة كولومبيا البريطانية ، ساعد في بناء وكيل لـ Openai الذي يمكنه استخدام برامج الكمبيوتر مثل الإنسان ، أن تدريب وكلاء الذكاء الاصطناعي على البيانات الملكية من الأنشطة اليومية وأنماط سير العمل قد يكون مفتاح تحسين فعاليتهم. هذا بالضبط ما بدأت به الكثير من الشركات.


Moody's هي واحدة من العديد من الشركات الكبرى التي تجرب تدريب الذكاء الاصطناعي على البيانات الداخلية. تعمل شركة الخدمات المالية البالغة من العمر 116 عامًا على أتمتة تحليل الأعمال من خلال أنظمة Agency AI ، والتي تستخلص رؤى من عقود من البحث والتقييمات والمقالات ومعلومات الاقتصاد الكلي. تم تصميم التدريب لمحاكاة كيفية تحليل فريق بشري ما ، باستخدام التعليمات المصنوعة بعناية التي تم تقسيمها إلى خطوات مستقلة من قبل الأشخاص الذين خبروا في هذا المجال.

على الرغم من أنه من السابق لأوانه معرفة مدى فعالية مقاربة Moody ، إلا أن المدير الإداري لـ AI ، Sergio Gago ، يقول إن الشركة تستكشف بنشاط أنواع العمل – مثل تحليل البيانات المالية للشركات الصغيرة – يمكن للوكلاء توليهم.

وبالمثل ، يخبر Johnson & Johnson Business Insider أنها تمكنت من خفض وقت الإنتاج للعمليات الكيميائية وراء صنع أدوية جديدة بنسبة 50 ٪ مع عوامل الذكاء الاصطناعى في المنزل التي يمكنها ضبط عوامل مثل درجة الحرارة والضغط تلقائيًا. يقول جيم سوانسون ، كبير مسؤولي المعلومات في J&J ، إن الشركة تركز على تدريب الأشخاص على التعاون مع وكلاء الذكاء الاصطناعي.

يبدو الاتجاه الذي تتجه إليه الأشياء مختلفًا عما كان يعتقده معظم الناس قبل بضع سنوات.

قام علماء Johns Hopkins بإنشاء مختبر وكيل ، والذي يعزز LLMs لأتمتة الكثير من عملية البحث ، من مراجعة الأدبيات إلى الإبلاغ عن الكتابة ، مع الأفكار والتعليقات التي يقدمها الإنسان في كل مرحلة. يقول صموئيل شميدجال ، أحد علماء جونز هوبكنز ، “أعتقد أنه لن يمر وقت طويل قبل أن نثق في منظمة العفو الدولية لاكتشاف الحكم الذاتي”. وبالمثل ، طور قسم أبحاث LG Electronics وكيل منظمة العفو الدولية أنه يمكن أن يتحقق من تراخيص مجموعات البيانات وتبعياتها أسرع 45 مرة من فريق من الخبراء والمحامين البشريين.

لا يزال من غير الواضح ما إذا كانت المنظمات يمكن أن تثق في الذكاء الاصطناعي بما يكفي لأتمتة عملياتها. في دراسات متعددة ، حاول عملاء الذكاء الاصطناعى خداعهم واختراقهم لتحقيق أهدافهم. في بعض الاختبارات مع TheAgentCompany ، عندما تم الخلط بين الوكيل بشأن الخطوات التالية ، فإنه أنشأ اختصارات غير موجودة. أثناء إحدى المهام ، لم يتمكن الوكيل من العثور على الشخص المناسب للتحدث معه على أداة الدردشة وقرر إنشاء مستخدم بنفس الاسم بدلاً من ذلك. وجد تحقيق BI من نوفمبر أن مساعد Microsoft الرائد ، CoPilot ، واجه صراعات مماثلة: 3 ٪ فقط من قادة تكنولوجيا المعلومات الذين شملهم الاستطلاع في أكتوبر / تشرين الأول ، قال Gartner الإداري إن CoPilot قدمت قيمة كبيرة لشركاتهم “.

لا تزال الشركات تشعر بالقلق إزاء كونها مسؤولة عن أخطاء وكلائها. بالإضافة إلى ذلك ، فإن حقوق الطبع والنشر وغيرها من انتهاكات الملكية الفكرية يمكن أن تثبت كابوسًا قانونيًا للمنظمات على الطريق ، كما يقول توماس دافنبورت ، أستاذ تكنولوجيا المعلومات والإدارة في كلية بابسون ومستشار كبير في Deloitte Analytics.

لكن الاتجاه الذي تتجه إليه الأشياء يبدو مختلفًا عما كان يعتقده معظم الناس قبل بضع سنوات. عندما أقلعت الذكاء الاصطناعى لأول مرة ، بدا أن الكثير من الوظائف على كتلة التقطيع. كان الصحفيون والكتاب والمسؤولون جميعهم في الجزء العلوي من القائمة. حتى الآن ، واجه عملاء الذكاء الاصطناعى وقتًا عصيبًا في التنقل في متاهة من الأدوات المعقدة – وهو أمر مهم لأي وظيفة مسؤول. ويفتقرون إلى المهارات الاجتماعية الحاسمة للصحافة أو أي شيء يتعلق بالموارد البشرية.

Neubig يأخذ سوق الترجمة كسبقة. على الرغم من أن ترجمة لغة الماكينة أصبحت متاحة ودقيقة – وضع المترجمين في الجزء العلوي من القائمة لخفض الوظائف – ظل عدد الأشخاص العاملين في الصناعة في الولايات المتحدة ثابتًا إلى حد ما. وجد تحليل “أموال الكوكب” لبيانات مكتب الإحصاء أن عدد المترجمين الفوريين والمترجمين نما بنسبة 11 ٪ بين عامي 2020 و 2023. ” إنه يعتقد أن تأثير الذكاء الاصطناعي على القطاعات الأخرى سوف يتبع مسارًا مشابهًا.

حتى الشركات التي ترى نجاحًا هائلاً مع وكلاء الذكاء الاصطناعى هي ، في الوقت الحالي ، تبقي البشر في الحلقة. كثيرون ، مثل J&J ، ليسوا مستعدين بعد للنظر في مخاطر الذكاء الاصطناعي ويركزون على تدريب الموظفين على استخدامه كأداة. يقول سوانسون: “عند استخدامها بمسؤولية ، نرى عملاء الذكاء الاصطناعي على أنهم يكملون أقوياء لشعبنا”.

بدلاً من استبدال الروبوتات ، نتحول ببطء إلى سايبورغز.


شوبهام أغاروال هو صحفي تكنولوجيا مستقل من أحمد آباد ، الهند ، الذي ظهر عمله في Wired و The Verge و Fast Company والمزيد.

توفر قصص خطاب Business Insider وجهات نظر حول أكثر القضايا إلحاحًا في اليوم ، والتي أبلغت عن طريق التحليل والإبلاغ والخبرة.