إنه سؤال بدأت الشركة أخيرًا في الإجابة عليه في مؤتمر Google IO لعام 2024 يوم الثلاثاء، حيث أطلق عملاق البحث إعلانات الذكاء الاصطناعي بالعشرات.
ومع إحراز Google وشركات الذكاء الاصطناعي الأخرى تقدمًا في كيفية استيعاب هذه الأنظمة للصور ومقاطع الفيديو والصوت والنصوص، فقد بدأنا نرى كيف تتطور هذه الأنظمة من روبوتات الدردشة الذكية إلى أدوات أكثر تطورًا يمكنها القيام بالمزيد من العمل الشاق.
إنه شيء يفكر فيه الرئيس التنفيذي لشركة Google، ساندر بيتشاي، كثيرًا في الوقت الحالي.
وقال بيتشاي في مائدة مستديرة مع الصحفيين قبل معرض المطورين هذا الأسبوع: “أعتقد أن عملاء الذكاء الاصطناعي هم أنظمة ذكية تُظهر التخطيط المنطقي والذاكرة”.
“إنهم قادرون على التفكير في عدة خطوات للأمام والعمل عبر البرامج والأنظمة كلها لإنجاز شيء ما نيابةً عنك، والأهم من ذلك، تحت إشرافك.”
باختصار: عملاء الذكاء الاصطناعي هم الأفضل في نقل هذه التكنولوجيا من “من الجيد امتلاكها” إلى “الحاجة إلى امتلاكها”.
مشروع أسترا
وقال بيتشاي إن جوجل “في الأيام الأولى” لتطوير هذا، لكنه وعد بأننا سنرى لمحات من “توجيه الوكيل” عبر منتجات جوجل في IO. وكان هناك العديد منها، ولكن المشروع الكبير الذي سيتحدث عنه الناس هو مشروع أسترا.
Astra هي رؤية لما ينبغي أن يكون عليه مساعد Google طوال الوقت. يمكنك أيضًا اعتباره إصدارًا أكثر ذكاءً من Google Lens، وهو إصدار يستخدم إمكانات رؤية الكمبيوتر في الوقت الفعلي للسماح لك بطرح أسئلة حول ما يمكنك رؤيته وسماعه من حولك.
وقال ديميس هاسابيس، رئيس جوجل ديب مايند: “لقد أردنا دائمًا بناء وكيل عالمي يكون مفيدًا في الحياة اليومية”. “تخيل وكلاء يمكنهم رؤية وسماع ما نقوم به بشكل أفضل، وفهم السياق الذي نحن فيه والاستجابة بسرعة في المحادثة مما يجعل وتيرة وجودة التفاعل تبدو أكثر طبيعية.”
عرضت Google عرضًا توضيحيًا لشخص يحمل هاتفه مع تشغيل الكاميرا ويطرح أسئلة على المساعد الصوتي AI حول ما يراه. على سبيل المثال، أشاروا به من النافذة وسألوا “في أي حي تعتقد أنني موجود؟” بشكل صحيح، تم تحديد موقع مكتب King’s Cross التابع لشركة Google في لندن.
وشدد هاسابيس على أن هذا الفيديو التجريبي تم تسجيله “في الوقت الحقيقي”. تلقت Google الكثير من ردود الفعل السلبية في ديسمبر بعد أن تبين أن العرض التوضيحي لنموذج Gemini AI قد تم تعديله، لذلك احتاجت Google إلى التأكيد على أنها تستطيع فعل ذلك بالفعل – خاصة بعد أن عرضت OpenAI عرضًا توضيحيًا مشابهًا يوم الاثنين.
إذا لم يكن هناك أي تلاعب هنا حقًا، فمن المؤكد أن Astra مثيرة للإعجاب، ومن المحتمل أن تكون أهم الوجبات الجاهزة في العرض. ولكن هناك طرق أخرى لظهور عملاء الذكاء الاصطناعي في المستقبل القريب.
أثارت شركة Google مجموعة من التحديثات التي ستجعل قريبًا برنامج Gemini AI chatbot الخاص بها أكثر قدرة واستباقية. يتم فتح بعض هذا مع استمرار Google في زيادة نافذة السياق، وهي كمية المعلومات التي يمكن لنموذج لغة كبير استيعابها في المرة الواحدة.
لنفترض أنك تريد معرفة شيء ما مدفونًا عميقًا في سلسلة من المستندات الطويلة جدًا التي لا ترغب في قضاء ساعات في التدقيق فيها. باستخدام نافذة سياق كبيرة، يمكنك مشاركة جميع المستندات مع Gemini ومن ثم طرح الأسئلة. يمكن للنموذج الإجابة بسرعة، بناءً على جميع المعلومات التي استوعبها للتو.
المخالب والخياطة
ولكن في منتجاتها القديمة تتمتع Google بميزة حقيقية عندما يتعلق الأمر بتمكين الصفات الشبيهة بالوكلاء.
بفضل مخالبها الموجودة بالفعل في العديد من جوانب حياتنا، من البريد الإلكتروني إلى البحث إلى الخرائط، تستطيع Google تجميع كل معرفتها حول المستخدمين والعالم من حولهم ليس فقط للإجابة على الاستفسارات، بل أيضًا لتصميم الاستجابات.
وقالت سيسي هسياو، رئيسة قسم الجوزاء ومساعد جوجل: “يجب أن يكون برج الجوزاء الخاص بي مختلفًا عن برج الجوزاء الخاص بك”.
في وقت لاحق من هذا العام، سيكون برج الجوزاء قادرًا على التخطيط لعطلتك بمستوى أكثر تفصيلاً من التفاصيل، وفقًا لما ذكره هسياو. الفكرة هي أنك ستكون قادرًا على تلبية جميع متطلباتك المحددة (تحب التنزه سيرًا على الأقدام، وتكره ذلك عندما يكون الجو حارًا للغاية، ولديك حساسية تجاه المحار) وسيقوم Gemini بإرجاع خط سير الرحلة التفصيلي. يمكن لروبوتات الدردشة بالفعل القيام بهذا النوع من الأشياء، ولكن، إذا سمح بذلك، سيتمكن Gemini من الوصول إلى معلومات رحلتك، وتأكيدات السفر في Gmail، وربما فندقك، ويمكنه استخدام ذلك لإبلاغ إجاباته.
قال هسياو: “يجب أن يكون مساعد الذكاء الاصطناعي قادرًا على حل المشكلات المعقدة، ويجب أن يكون قادرًا على اتخاذ الإجراءات نيابةً عنك، كما يجب أن يشعر بأنه طبيعي جدًا وسلس عند التعامل معه”.
معظم ما سيفعله الوكلاء هو إزالة الخطوات وتقصير المهام. تفكر جوجل أيضًا في هذا الأمر عندما يتعلق الأمر بالبحث، حيث تقوم الشركة بتطوير أغلى منتجاتها لتقديم الإجابات التي يتم إجراؤها باستخدام الذكاء الاصطناعي التوليدي.
إنها تطرح إصدارًا مخصصًا من Gemini تم تصميمه خصيصًا للبحث، ويجمع بين معرفته بالويب وقدرات الوسائط المتعددة لنموذج الذكاء الاصطناعي ونافذة السياق العملاقة.
عرضت ليز ريد، رئيسة قسم البحث في Google، مثالاً على استخدام Google Lens لالتقاط مقطع فيديو لمشغل الأسطوانات. يسأل المستخدم الجوزاء عن سبب عدم بقاء الذراع في مكانها. تستجيب Google بتعليمات دقيقة لهذا القرص الدوار المحدد.
كما هو الحال دائمًا، لدى Google بعض العلامات التجارية المربكة التي يجب حلها: Lens، Assistant، Gemini، Astra. في نهاية المطاف، على الرغم من ذلك، فإن الكثير من هذا يندمج معًا في النهاية. وفي يوم الثلاثاء، قدمت لنا جوجل أدلة حول الشكل الذي سيبدو عليه هذا الاستنتاج المنطقي.
أو كما قال ريد: “هذه هي الطريقة التي يستخدمها Google للبحث عنك.”