لأول مرة.. الذكاء الاصطناعي يُترجم لهجة المغاربة المكتوبة بـ«الفرانكو آراب» (خاص)

في زمنٍ صارت فيه اللهجات تُكتب بلغات هجينة، طور باحثون نموذج ذكاء اصطناعي يفك شفرة اللهجة المغربية المكتوبة بـ"الفرانكو آراب".
واللهجة المغربية، تمثل نبض الشارع المغربي، ولم تكن يوما سهلة الترجمة أو المعالجة تقنيا، فهي تفتقر إلى قواعد كتابة موحدة، وتكتب غالبا بـ"عربيزي" أو ما يعرف بـ"الفرانكو آراب"، وهو أسلوب غير رسمي لكتابة اللغة العربية باستخدام الحروف اللاتينية.
والنموذج الجديد الذي تم الإعلان عنه في دورية "إنترناشونال جورنال أوف إنفورميشن مانجمنت داتا إنسايتس"، يعتمد على أحدث تقنيات التعلم العميق، ويستطيع تحويل الدارجة المغربية المكتوبة بعربيزي إلى كلمات عربية مفهومة بدقة مذهلة بلغت 93%، وهو ما يفتح آفاقا جديدة لدمج اللهجات العربية غير الرسمية في تطبيقات الذكاء الاصطناعي، من الترجمة إلى تحليل مشاعر المستخدمين على وسائل التواصل.
يتعلم من الحروف لا من الكلمات
واعتمد الباحثون من مختبر علوم الحاسوب بجامعة ابن طفيل المغربية، في مشروعهم على تدريب النموذج على مستوى الحروف، وليس الكلمات، ما منحه مرونة كافية للتعامل مع مئات الطرق المختلفة لكتابة نفس الكلمة. فمثلا، الحرف العربي "ق" قد يظهر في عربيزي كـ"9" أو "q" أو حتى "k".
وتم إنشاء قاعدة بيانات مكونة من 33 ألف كلمة مزدوجة (عربيزي/عربي) تم جمعها ومراجعتها بعناية من قبل ناطقين أصليين، مما جعلها أول قاعدة بيانات ضخمة مخصصة لهذا النوع من التحويل في المغرب.
نقلة نوعية في فهم اللهجات المغاربية
ولا يقف هذا الابتكار عند حدود المغرب فقط، بل أوضح الباحثون في دراستهم، أنه يُعد نموذجًا أوليا يمكن تعميمه على لهجات أخرى مثل التونسية أو الجزائرية، التي تواجه نفس التحديات في الكتابة والترميز.
ومن خلال تحسين قدرة الأنظمة على قراءة هذه النصوص الهجينة، يُمكن تطبيق النموذج في تحليل المحتوى الرقمي، ودعم تطبيقات الترجمة، ومساعدات الدردشة الذكية، وحتى في الدراسات الاجتماعية لرصد توجهات الرأي العام.
نحو ذكاء اصطناعي يفهم الناس بلغتهم
ومن جانبه، يشيد خالد العطار، الباحث في الذكاء الاصطناعي بجامعة القاهرة، بهذا الإنجاز، قائلا في تصريحات للعين الإخبارية، "هذا العمل يشكّل خطوة نوعية في معالجة اللغات الطبيعية للمنطقة العربية، فاللهجات العامية المكتوبة بعربيزي كانت تمثل تحديا كبيرا أمام أنظمة الذكاء الاصطناعي بسبب غياب المعايير الموحدة واستخدام الحروف والأرقام بشكل غير منتظم".
ويضيف أن "تطوير نموذج قادر على فهم الدارجة المغربية بعربيزي وكتابتها بالعربية خطوة مهمة نحو إشراك المتحدثين بالعاميات في بيئة رقمية أكثر شمولاً، وتفتح آفاقا جديدة أمام أدوات الترجمة، والتفاعل الآلي، وحتى أرشفة المحتوى الرقمي الشعبي".
aXA6IDIxNi43My4yMTYuMjA4IA== جزيرة ام اند امز