لماذا يعمل الذكاء الاصطناعي على تسطيح اللغة البشرية ببطء

٢٨ مارس ٢٠٢٦

الرواية السائدة حول الذكاء الاصطناعي التوليدي هي رواية عن التواصل اللامحدود. يحتفل المستهلكون والتقنيون بمستقبل تذيب فيه الترجمة الفورية السلسة الحدود، مما يسمح لتاجر في طوكيو بالتفاوض بسهولة تامة مع مشترٍ في بوينس آيرس. من السهل أن نفترض أن هذه الخوارزميات المتطورة هي الحارس الأمين للتواصل العالمي، وأنها تحطم حواجز اللغة التاريخية. ولكن تحت سطح هذه المعجزة التكنولوجية، يكمن تهديد عميق ومفارق. فبدلاً من الحفاظ على التنوع الهائل للتعبير البشري، يؤدي الانتشار الواسع للذكاء الاصطناعي إلى توحيده بصمت، وهو ما يدفع باللغات الأقلية واللهجات الإقليمية نحو الاندثار الرقمي.

تعتمد آليات تعلم الآلة بالكامل على البيانات التي تُغذى بها، والعالم الرقمي غير متوازن إلى حد كبير. فعلى الرغم من وجود أكثر من سبعة آلاف لغة منطوقة في العالم، إلا أن جزءاً ضئيلاً منها فقط يهيمن على الإنترنت. وقد سلطت دراسات من مؤسسات مثل "معهد ستانفورد للذكاء الاصطناعي المرتكز على الإنسان" الضوء باستمرار على أن النماذج اللغوية الكبيرة تُدرب في الغالب على اللغة الإنجليزية الأمريكية القياسية. وعندما اختبر الباحثون قدرة هذه النماذج البارزة على فهم اللهجات الإقليمية أو توليدها، كشفت النتائج عن محو لغوي ممنهج. فكثيراً ما تسيء الأنظمة تفسير لهجات مثل الإنجليزية العامية الأمريكية الأفريقية أو لهجة سكان أبالاتشيا الريفية، أو أنها تقوم بتصحيح النص بقوة لتحويله إلى معيار موحد وممل يشبه لغة الشركات.

وبالمثل، تظهر نظرة أوسع على تبني التكنولوجيا عالمياً أن اللغات التي تفتقر إلى أرشيفات رقمية ضخمة مستبعدة فعلياً من ثورة الذكاء الاصطناعي. وتشير البيانات التي حللتها معاهد لغوية عالمية إلى أن اللغات التي يتحدث بها الملايين، مثل بعض اللغات الأفريقية أو لغات جنوب شرق آسيا، غالباً ما تُعامل على أنها "قليلة الموارد" من قبل مطوري الخوارزميات. ونظراً لعدم وجود نصوص رقمية كافية لتدريب النماذج بفعالية، تفشل الخوارزميات في فهم تعقيداتها. ونتيجة لذلك، يضطر مستخدمو هذه اللغات إلى اللجوء إلى الإنجليزية أو لغة مهيمنة أخرى للمشاركة في الاقتصاد الرقمي الحديث.

السبب الكامن وراء هذا التسطيح اللغوي ليس نية خبيثة، بل هو التحسين الرياضي. تعمل النماذج اللغوية الكبيرة عن طريق التنبؤ بالكلمة التالية الأكثر احتمالاً إحصائياً، بناءً على مليارات المعايير المستخلصة من مسح الإنترنت. ولأن الإنترنت مشبع باللغة الإنجليزية القياسية بشكل كبير، فإن الخوارزميات تفضل بشكل طبيعي قواعدها ومفرداتها وتعابيرها الثقافية. وخلال مرحلة الصقل، تقوم التغذية الراجعة البشرية بتدريب النماذج بشكل أكبر على إنتاج استجابات تعتبر مهذبة واحترافية ومفهومة عالمياً. وبالتالي، تعاقب الأنظمة الانحرافات اللغوية والعبارات العامية والفروق الثقافية الدقيقة التي لا تتناسب مع القاعدة الإحصائية المتبعة.

لا تستطيع الخوارزمية التمييز بين خطأ نحوي ولهجة ثقافية متجذرة. إنها ببساطة تحدد أي انحراف عن مجموعة البيانات المهيمنة وتقوم بتسويته. بمرور الوقت، تخلق هذه التسوية الإحصائية صوتاً متجانساً يفتقر إلى النكهة الإقليمية أو العمق العاطفي أو الخصوصية الثقافية. إنه حل وسط خوارزمي مصمم لكي لا يسيء إلى أحد ويفهمه الجميع، لكنه يضحي بثراء التواصل الإنساني الأصيل في هذه العملية.

تمتد عواقب هذه التسوية الخوارزمية إلى ما هو أبعد من علم اللغويات الأكاديمي. فمع دمج الملايين من الناس لأدوات النصوص التوليدية، والردود الآلية على البريد الإلكتروني، والكتابة التنبؤية في روتينهم اليومي، بدأت الكتابة البشرية نفسها تتغير. اللغة تشكل الفكر، وعندما تدفعنا الأدوات التي نستخدمها للتواصل باستمرار نحو نبرة خوارزمية متجانسة، فإننا نتخلى ببطء عن أصواتنا الفريدة. يغير الناس مفرداتهم دون وعي لضمان أن الآلة تفهمهم، أو يعتمدون على الآلة لصياغة رسائل تفتقر بطبيعتها إلى النكهة الشخصية أو الثقافية.

على المستوى الكلي، يكون التأثير أشد على الثقافات المهمشة. فعندما تتحكم أنظمة الذكاء الاصطناعي بشكل متزايد في كل شيء، من خدمة العملاء الآلية وفحص السير الذاتية إلى الوثائق القانونية، يواجه الأفراد الذين يتحدثون لهجات غير قياسية عيباً واضحاً. تُصنَّف تعابيرهم على أنها غير احترافية أو غير مترابطة من قبل أدوات الفحص الآلي، مما يعزز التسلسلات الهرمية الاجتماعية القائمة من خلال أسطر برمجية غير مرئية. بالإضافة إلى ذلك، بالنسبة للغات الضعيفة أصلاً، فإن عدم القدرة على التفاعل مع البنية التحتية الرقمية الحديثة يسرّع من تدهورها. وإذا لم يتمكن جيل الشباب من استخدام لغتهم الأم على هواتفهم الذكية أو مع المساعدين الرقميين، فإن الحافز لتعلم هذه اللغة والحفاظ عليها يتضاءل بسرعة.

يتطلب منع هذا المحو التكنولوجي تحولاً متعمداً في كيفية بناء الذكاء الاصطناعي وتمويله. لا يمكن ترك الحل فقط لشركات التكنولوجيا العملاقة، التي حافزها الأساسي هو توسيع نطاق المنتجات القابلة للتطبيق عالمياً بسرعة وبتكلفة منخفضة. بدلاً من ذلك، يجب أن تكون هناك جهود متضافرة لتطوير نماذج لغوية محلية ومجتمعية. وقد بدأ هذا النهج يظهر بالفعل نتائج واعدة في بعض المناطق التي أدركت خطر الاندثار الرقمي.

على سبيل المثال، استثمرت حكومة أيسلندا بكثافة في إنشاء موارد لغوية رقمية مفتوحة المصدر لضمان ألا تبتلع اللغة الإنجليزية اللغة الأيسلندية في عصر الذكاء الاصطناعي. وشهدت مبادرات شعبية مماثلة في نيوزيلندا قيام مجتمعات السكان الأصليين بجمع البيانات المنطوقة والمكتوبة بنشاط لبناء خوارزميات تفهم لغة الماوري دون تصفيتها من منظور يركز على اللغة الإنجليزية. يجب على الحكومات والهيئات التنظيمية للتكنولوجيا العالمية أن تفرض وتدعم هذه الجهود المحلية، لضمان تدريب الخوارزميات من الألف إلى الياء داخل مجتمعات لغوية متنوعة.

اللغة أكثر بكثير من مجرد أداة بسيطة لنقل المعلومات. إنها وعاء تاريخ البشرية، تحمل نظرة العالم وروح الدعابة والذاكرة الجماعية للمجتمعات التي تتحدث بها. وبينما يعهد المجتمع بشكل متزايد بكتاباته وترجماته واتصالاته اليومية إلى الخوارزميات، يجب أن ندرك التكلفة الخفية لهذه السهولة السلسة. إذا سمحنا للذكاء الاصطناعي بتحسين التعبير البشري ليصبح معياراً واحداً وعقيماً، فإننا نخاطر بإسكات التنوع الفوضوي والجميل للفكر البشري. يجب أن يكون الوعد النهائي للتكنولوجيا هو الارتقاء بجميع الأصوات، وليس فقط تلك التي يسهل على الآلة التنبؤ بها.

Publication

The World Dispatch

Source: Editorial Desk

Category: AI