بروفيدنس ، رود آيلاند (ا ف ب) – كان صوت Alexis “Lexi” Bogan قبل الصيف الماضي مليئًا بالحيوية.
لقد أحببت أن تغني أغاني تايلور سويفت وزاك برايان في السيارة. كانت تضحك طوال الوقت، حتى عندما كانت تجتمع مع الأطفال الذين يسيئون التصرف في مرحلة ما قبل المدرسة أو تناقش السياسة مع الأصدقاء في حفرة نار في الفناء الخلفي. في المدرسة الثانوية، كانت سوبرانو في الجوقة.
ثم ذهب هذا الصوت.
وفي أغسطس/آب، أزال الأطباء ورماً يهدد حياتها كان موجوداً بالقرب من الجزء الخلفي من دماغها. عندما تم إخراج أنبوب التنفس بعد شهر، واجهت بوغان صعوبة في البلع وبذلت جهدًا كبيرًا لتقول “مرحبًا” لوالديها. وقد ساعدتها أشهر من إعادة التأهيل على التعافي، لكن قدرتها على النطق لا تزال ضعيفة. يكافح الأصدقاء والغرباء وأفراد عائلتها لفهم ما تحاول إخبارهم به.
وفي أبريل، استعادت الفتاة البالغة من العمر 21 عامًا صوتها القديم. ليست النسخة الحقيقية، ولكنها نسخة صوتية تم إنشاؤها بواسطة الذكاء الاصطناعي يمكنها استدعاؤها من تطبيق الهاتف. تم تدريبها على كبسولة زمنية مدتها 15 ثانية من صوتها المراهق – مصدرها مقطع فيديو توضيحي للطهي سجلته لمشروع مدرسة ثانوية – يمكن لصوتها الاصطناعي ولكن الذي يبدو حقيقيًا بشكل ملحوظ والذي يعمل بتقنية الذكاء الاصطناعي الآن أن يقول أي شيء تريده تقريبًا.
تقوم بكتابة بضع كلمات أو جمل على هاتفها ويقوم التطبيق بقراءتها على الفور بصوت عالٍ.
“مرحبًا، هل يمكنني الحصول على قهوة مثلجة كبيرة من السكر البني والحليب والشوفان،” قال صوت بوغان الذي يعمل بتقنية الذكاء الاصطناعي وهي تحمل الهاتف من نافذة سيارتها في أحد متاجر ستاربكس.
وقد حذر الخبراء أن تحسين تكنولوجيا استنساخ الصوت بالذكاء الاصطناعي بسرعة يمكن أن يؤدي إلى تضخيم عمليات الاحتيال عبر الهاتف وتعطيلها انتخابات ديمقراطية وانتهاك كرامة الأشخاص – الأحياء منهم والأموات – الذين لم يوافقوا أبدًا على إعادة تكوين أصواتهم ليقولوا أشياء لم يتحدثوا بها أبدًا.
لقد تم استخدامه لإنتاج مكالمات آلية عميقة التزييف للناخبين في نيو هامبشاير يقلدون الرئيس جو بايدن. في ماريلاند، اتهمت السلطات مؤخرا مدير رياضي في مدرسة ثانوية يستخدم الذكاء الاصطناعي لإنشاء مقطع صوتي مزيف لمدير المدرسة وهو يدلي بتصريحات عنصرية.
لكن بوجان وفريق من الأطباء في مجموعة مستشفيات Lifespan في رود آيلاند يعتقدون أنهم وجدوا استخدامًا يبرر المخاطر. بوغان هي واحدة من أوائل الأشخاص – وهي الوحيدة التي تعاني من حالتها – الذين تمكنوا من إعادة إنشاء صوت مفقود باستخدام محرك الصوت الجديد الخاص بـ OpenAI. وقد قام بعض مقدمي خدمات الذكاء الاصطناعي الآخرين، مثل الشركة الناشئة ElevenLabs، باختبار تكنولوجيا مماثلة للأشخاص الذين يعانون من صعوبات في النطق وفقدان القدرة على الكلام – بما في ذلك المحامية التي تستخدم الآن استنساخ صوتها في قاعة المحكمة.
وقال الدكتور رهيد علي، طبيب جراحة الأعصاب المقيم في كلية الطب بجامعة براون ومستشفى رود آيلاند: “نأمل أن يكون ليكسي رائدًا مع تطور التكنولوجيا”. وقال إن ملايين الأشخاص الذين يعانون من السكتات الدماغية المنهكة أو سرطان الحلق أو أمراض الأعصاب يمكن أن يستفيدوا منها.
وقالت الدكتورة فاطمة ميرزا، وهي مقيمة أخرى تعمل على المشروع التجريبي: “يجب أن نكون واعين للمخاطر، ولكن لا يمكننا أن ننسى المريض والصالح الاجتماعي”. “نحن قادرون على المساعدة في إعادة صوت ليكسي الحقيقي، كما أنها قادرة على التحدث بالمصطلحات الأكثر صدقًا مع نفسها.”
لفت ميرزا وعلي، المتزوجان، انتباه شركة OpenAI التي تصنع ChatGPT بسبب مشروعهما البحثي السابق في Lifespan باستخدام روبوت الدردشة المدعم بالذكاء الاصطناعي لتبسيط نماذج الموافقة الطبية للمرضى. تواصلت شركة سان فرانسيسكو أثناء بحثها في وقت سابق من هذا العام عن تطبيقات طبية واعدة لمولدها الصوتي الجديد المزود بالذكاء الاصطناعي.
كان بوجان لا يزال يتعافى ببطء من الجراحة. بدأ المرض في الصيف الماضي بصداع ورؤية ضبابية ووجه مترهل، مما أثار قلق الأطباء في مستشفى هاسبرو للأطفال في بروفيدنس. واكتشفوا وجود ورم وعائي بحجم كرة الغولف يضغط على جذع دماغها ويتشابك في الأوعية الدموية والأعصاب القحفية.
قالت طبيبة أعصاب الأطفال الدكتورة كونستانتينا سفوكوس: “لقد كانت معركة للسيطرة على النزيف وإخراج الورم”.
وقال سفوكوس إن الجراحة التي استغرقت 10 ساعات، بالإضافة إلى موقع الورم وشدته، تسببت في إتلاف عضلات لسان بوغان والحبال الصوتية، مما أعاق قدرتها على تناول الطعام والتحدث.
قال بوجان: “يبدو الأمر كما لو أن جزءًا من هويتي قد تم أخذه عندما فقدت صوتي”.
أنبوب التغذية خرج هذا العام. ويستمر علاج النطق، مما يمكّنها من التحدث بشكل واضح في غرفة هادئة ولكن بدون أي إشارة إلى أنها ستستعيد الوضوح الكامل لصوتها الطبيعي.
وقال بوغان: “في مرحلة ما، بدأت أنسى ما كنت أبدو عليه”. “لقد اعتدت على الطريقة التي أبدو بها الآن.”
كلما رن جرس الهاتف في منزل العائلة في ضاحية نورث سميثفيلد في بروفيدنس، كانت تدفعه إلى والدتها لتستقبل مكالماتها. شعرت أنها تثقل كاهل أصدقائها كلما ذهبوا إلى مطعم صاخب. وكان والدها، الذي يعاني من فقدان السمع، يكافح من أجل فهمها.
بالعودة إلى المستشفى، كان الأطباء يبحثون عن مريض تجريبي لتجربة تقنية OpenAI.
قال علي: “أول شخص خطر على ذهن الدكتور سفوكوس هو ليكسي”. “لقد تواصلنا مع ليكسي لمعرفة ما إذا كانت مهتمة أم لا، دون أن نعرف ماذا سيكون ردها. لقد كانت مستعدة لتجربتها ومعرفة كيف ستنجح.
كان على بوجان العودة بضع سنوات إلى الوراء للعثور على تسجيل مناسب لصوتها “لتدريب” نظام الذكاء الاصطناعي على كيفية تحدثها. لقد كان مقطع فيديو تشرح فيه كيفية تحضير سلطة المعكرونة.
قام أطبائها عمدًا بتغذية نظام الذكاء الاصطناعي بمقطع مدته 15 ثانية فقط. أصوات الطبخ تجعل أجزاء أخرى من الفيديو غير كاملة. وكان هذا أيضًا كل ما تحتاجه OpenAI، وهو تحسين مقارنة بالتكنولوجيا السابقة التي تتطلب عينات أطول بكثير.
لقد عرفوا أيضًا أن الحصول على شيء مفيد خلال 15 ثانية قد يكون أمرًا حيويًا لأي مريض في المستقبل ليس لديه أي أثر لأصواته على الإنترنت. قد يكون من الكافي ترك بريد صوتي قصير لأحد الأقارب.
وعندما اختبروه لأول مرة، اندهش الجميع من جودة استنساخ الصوت. وكانت الأخطاء العرضية – مثل كلمة خاطئة في النطق، أو نغمة مفقودة – غير محسوسة في الغالب. في أبريل/نيسان، قام الأطباء بتزويد بوغان بتطبيق هاتفي مصمم خصيصًا، ولا يمكنها استخدامه إلا هي.
وقالت والدتها، باميلا بوغان، والدموع في عينيها: “أشعر بالعاطفة الشديدة في كل مرة أسمع فيها صوتها”.
وأضاف ليكسي بوجان: “أعتقد أنه من الرائع أن أتمكن من الحصول على هذا الصوت مرة أخرى”، قائلاً إنه ساعد في “تعزيز ثقتي إلى حد ما حيث كانت قبل حدوث كل هذا”.
وهي تستخدم الآن التطبيق حوالي 40 مرة يوميًا وترسل تعليقات تأمل أن تساعد المرضى في المستقبل. كانت إحدى تجاربها الأولى هي التحدث إلى الأطفال في مرحلة ما قبل المدرسة حيث تعمل كمساعد تدريس. لقد كتبت “ها ها ها ها” متوقعة ردًا آليًا. لدهشتها، بدت وكأنها ضحكتها القديمة.
لقد استخدمته في Target وMarshall’s لتسأل عن مكان العثور على العناصر. لقد ساعدها ذلك على إعادة التواصل مع والدها. وقد سهّل عليها طلب الوجبات السريعة.
وقد بدأ أطباء بوغان في استنساخ أصوات مرضى رود آيلاند الراغبين في ذلك، ويأملون في جلب هذه التكنولوجيا إلى المستشفيات في جميع أنحاء العالم. وقالت شركة OpenAI إنها تتحرك بحذر في توسيع استخدام المحرك الصوتي، الذي لم يكن متاحًا للعامة بعد.
يقوم عدد من الشركات الناشئة الأصغر حجمًا في مجال الذكاء الاصطناعي ببيع خدمات استنساخ الصوت إلى استوديوهات الترفيه أو جعلها متاحة على نطاق أوسع. يقول معظم موردي خدمات توليد الصوت إنهم يحظرون انتحال الشخصية أو إساءة الاستخدام، لكنهم يختلفون في كيفية تطبيق شروط الاستخدام الخاصة بهم.
قال جيف هاريس، مدير المنتج في OpenAI: “نريد التأكد من أن كل من يتم استخدام صوته في الخدمة يحصل على موافقته بشكل مستمر”. “نريد أن نتأكد من عدم استخدامه في السياقات السياسية. لذا فقد اتخذنا نهجًا يقتصر على الأشخاص الذين نقدم لهم التكنولوجيا.
وقال هاريس إن الخطوة التالية لـ OpenAI تتضمن تطوير أداة “مصادقة صوتية” آمنة بحيث يمكن للمستخدمين نسخ أصواتهم فقط. وقال إن ذلك قد يكون “محدودًا بالنسبة لمريضة مثل ليكسي، التي فقدت فجأة قدراتها على الكلام”. “لذلك نعتقد أننا سنحتاج إلى علاقات ثقة عالية، خاصة مع مقدمي الخدمات الطبية، لمنح وصول أكبر إلى التكنولوجيا دون قيود.”
وقد أثارت بوغان إعجاب أطبائها بتركيزها على التفكير في كيفية مساعدة التكنولوجيا للآخرين الذين يعانون من عوائق النطق المماثلة أو الأكثر خطورة.
قال ميرزا: “جزء مما فعلته طوال هذه العملية برمتها هو التفكير في طرق لتعديل هذا الأمر وتغييره”. “لقد كانت مصدر إلهام كبير بالنسبة لنا.”
بينما يتعين عليها الآن العبث بهاتفها لجعل المحرك الصوتي يتحدث، تتخيل بوجان محركًا صوتيًا يعمل بالذكاء الاصطناعي يعمل على تحسين العلاجات القديمة لاستعادة الكلام – مثل الحنجرة الكهربائية ذات الصوت الآلي أو الأطراف الاصطناعية الصوتية – في الاندماج مع جسم الإنسان أو ترجمة الكلمات في الوقت الحقيقي.
إنها أقل ثقة بشأن ما سيحدث مع تقدمها في السن ويستمر صوت الذكاء الاصطناعي الخاص بها في الظهور كما كانت تفعل عندما كانت مراهقة. وقالت إنه ربما تتمكن التكنولوجيا من “تقادم” صوتها القائم على الذكاء الاصطناعي.
وقالت: “في الوقت الحالي، على الرغم من أنني لا أستعيد صوتي بالكامل، إلا أن لدي شيئًا يساعدني في العثور على صوتي مرة أخرى”.
___
وكالة أسوشيتد برس وOpenAI اتفاقية الترخيص والتكنولوجيا الذي يسمح لـ OpenAI بالوصول إلى جزء من أرشيفات النصوص الخاصة بـ AP.