من المقرر أن يعمل برنامج الذكاء الاصطناعي المبتكر الذي يتم تطويره بالتعاون السعودي مع شركة IBM مع العديد من اللهجات العربية، وفقًا لما ذكرته الشركتان.

أعلنت الهيئة السعودية للبيانات والذكاء الاصطناعي (SDAIA) أنه سيتم تضمين نموذج اللغة العربية الكبير (LLM) الخاص بها لإنشاء النصوص في منصة الذكاء الاصطناعي والبيانات الخاصة بشركة IBM، Watsonx.

من خلال الوصول إلى العديد من شهادات LLM، يتم استخدام Watsonx من قبل الشركات لإنشاء محتوى تحريري وتطوير برامج الدردشة الآلية وكتابة أكواد البرمجة.

تشمل الأمثلة على الأماكن التي يمكن استخدامها فيها البرمجة النصية لألعاب الفيديو وروبوتات الدردشة لخدمة العملاء للشركات.

يتميز برنامج LLM من SDAIA، والمعروف باسم ALLaM، بقدرته على استرداد المعلومات وتوليدها بتنسيقات صوتية ونصية بلهجات عربية متعددة، وهي القدرة التي ناضل المطورون من أجلها لسنوات.

ابق على اطلاع بالنشرات الإخبارية لموقع MEE

قم بالتسجيل للحصول على أحدث التنبيهات والأفكار والتحليلات،
بدءًا من تركيا غير المعبأة

وقال عصام الوقيت، مدير SDAIA لشراكة مؤسسته مع شركة IBM، إحدى أقدم شركات التكنولوجيا في العالم: “سيكون هذا التعاون بمثابة حافز لمزيد من التقدم التكنولوجي”.

يمكن أن يؤدي التطوير الإضافي لنموذج اللغة إلى انتشار مولدات نص GPT العربية، مثل Gemini من Google، وX’s Grok، وChatGPT من OpenAI.

ووفقا لمطوريه، فإن ALLaM “تم تدريبه على مئات الملايين من المقالات باللغتين العربية والإنجليزية”.

تحديات العمل باللغة العربية

لقد شكلت القدرة على التعامل مع اللهجات العربية تحديًا تقليديًا للمطورين الذين يعملون مع نماذج البرامج المستندة إلى اللغة العربية.

للغة العربية شكل موحد يستخدم في نشرات الأخبار والمراسلات الرسمية، والمعروف باسم اللغة العربية الفصحى الحديثة (MSA)، والتي يفهمها معظم العرب من المغرب إلى عمان.

ومع ذلك، في الاستخدام اليومي، يستخدم المتحدثون باللغة العربية لهجات إقليمية قد تختلف بشكل كبير عن بعضها البعض وعن اللغة العربية الفصحى.

اللغة العربية والذكاء الاصطناعي: لماذا تعاني تكنولوجيا التنشيط الصوتي في الشرق الأوسط؟

اقرأ أكثر ”

إحدى الصعوبات عند التعامل مع اللهجات هي أن كلمة معينة في لهجة واحدة قد يكون لها معنى مختلف في لهجة أخرى أو في اللغة العربية الفصحى.

وهذا يعني أن نموذج اللغة القائم على الذكاء الاصطناعي يجب ألا يتعرف فقط على معنى كلمة فردية، بل يجب أيضًا أن يتعرف على استخدامها في سياقات إقليمية مختلفة.

هناك صعوبة أخرى تتمثل في أن الكثير من الاستخدام العامي للغة العربية عبر الإنترنت يتم باستخدام الأحرف اللاتينية بدلاً من الحروف العربية، مما يعني أن مجموعة البيانات التي يمكن للمطورين الاتصال بها أصغر بكثير مما هي عليه بالنسبة للغات الأخرى.

سلط مقال لموقع ميدل إيست آي في عام 2019 الضوء على بعض هذه الصعوبات والطرق التي يمكن من خلالها التغلب على بعض هذه الصعوبات.

ووفقاً للباحث الفلسطيني مصطفى جرار من جامعة بيرزيت، فإن إحدى طرق التغلب على هذه الصعوبات هي زيادة كمية البيانات اللغوية المتاحة للمطورين.

كلما تمكن مطورو المدخلات من الوصول إلى نماذجهم بشكل أكبر، أصبحت نتائجهم النهائية أكثر دقة.

يأتي تطوير المملكة العربية السعودية لـ ALlaM وسط دفعة عالمية نحو دمج تقنيات الذكاء الاصطناعي في المجتمعات.

استثمرت المملكة المليارات في تطوير بدائل لاقتصادها المعتمد إلى حد كبير على الوقود الأحفوري.

وقد اتجهت الاستثمارات إلى التكنولوجيات، مثل الذكاء الاصطناعي، ومشاريع السياحة والبناء، مثل مشروع المدينة الضخمة نيوم.

شاركها.