Politique

Pourquoi Google Translate sonne souvent faux en yorùbá, et dans bien d’autres langues

Groupe d’utilisateurs de Wikimedia au Nigéria, octobre 2018 via Wikimedia Commons, sous licence CC.BY.2.0.
[Sauf mention contraire, tous les liens renvoient vers des pages en anglais, ndt]

L’anglais domine le discours en ligne en tant que langue de communication « universelle » depuis la création d’Internet. En février 2020, plus de la moitié des sites [fr] Web étaient en anglais, selon WebTech3.

Mais comme de plus en plus de personnes se connectent sur Internet et utilisent différentes langues, cela a déclenché une révolution numérique linguistique : un accès immédiat aux traductions en anglais de plusieurs langues en un seul clic.

De nombreuses entreprises technologiques ont récemment fait des efforts pour documenter des mots de langues autres que l’anglais sur Internet, ouvrant la voie à la numérisation de plusieurs langues. Google, Yoruba Names, Masakhane MT et ALC sont des exemples d’entreprises et de start-ups qui ont essayé d’associer la technologie avec l’usage de ces diverses langues.

Fin février 2020, Google a annoncé l’ajout de cinq nouvelles langues à ses services Google Translate, dont le kinyarwanda, l’ouïghur, le tatar, le turkmène et l’odia, après une période de latence de quatre ans, pendant laquelle aucune nouvelle langue n’a été ajoutée.

Un homme a l’air perplexe en lisant un texte en ligne. Photo par Oladimeji Ajegbile, open-source via Pexels.

Mais avez-vous déjà cliqué sur l’option de traduction et réalisé que la traduction anglaise était, au mieux, juste passable ? Et au pire, pas du tout exacte ? Twitter propose dans la mesure du possible une traduction en yorùbá depuis l’anglais grâce à Google Translate et en général, les résultats ne sont pas si mauvais. Certains mots sont sans doute traduits correctement.

En tout état de cause, ce travail de traduction en vue de l’accessibilité linguistique est semé d’embûches et sujet à controverses. Ces défis s’expliquent par le fait que les entreprises technologiques collectent généralement leurs données linguistiques pour la traduction en anglais à partir d’Internet. Ces données peuvent fonctionner pour certaines langues, mais sont difficiles à exploiter pour le yorùbá et l’ὶgbò par exemple (deux langues principales du Nigéria), en raison de l’accentuation tonale approximative ou inexacte.

Questionné sur les raisons pour lesquelles il a fallu quatre ans à Google pour ajouter cinq nouvelles langues, un porte-parole de l’entreprise a expliqué :

Google Translate learns from existing translations found on the web, and when languages don’t have an abundance of web content, it’s been difficult for our system to support them effectively. … However, due to recent advances in our machine learning technology, and active involvement from our Google Translate Community members, we’ve been able to add support for these languages.

Google Translate apprend à travers les traductions existantes trouvées sur le Web, et lorsque des langues n’avaient pas suffisamment de contenu en ligne, il a été difficile pour notre système de les prendre en charge efficacement… Cependant, en raison des progrès récents de notre technologie d’apprentissage automatique et de la participation active de nos membres de la communauté Google Translate, nous avons pu ajouter la prise en charge de ces langues.

De plus, la plupart des gens ne sont pas très au fait de l’orthographe dans ces langues. Par conséquent, les bonnes traductions ne sont pas prises en compte car ces erreurs fréquentes ne sont pas signalées comme inadéquates.

La plupart des traductions automatiques comportent des erreurs, en particulier sur les mots culturellement nuancés. Par exemple, les mots yorùbá ayaba et obabìnrin ont une signification située dans un contexte culturel. La plupart des machines traduisent les deux mots par « reine ». Cependant, d’un point de vue traditionnel et culturel, il est essentiel de noter que les significations de l’ayaba et de l’obabìnrin sont différentes : le premier signifie « épouse du roi » tandis que le second désigne la reine.

Malgré ces complications dans la traduction, la technologie a contribué à l’avancement des langues africaines dans les espaces numériques, stimulant la formation de nouveaux mots. Les langues africaines se sont développées avec l’afflux de nouveaux gadgets comme les smartphones et les tablettes, et de nouveaux mots ont été inventés pour nommer ces outils et concepts technologiques. Ce processus a ainsi élargi les domaines d’utilisation et la fonctionnalité de ces langues.

Avec l’émergence de nouvelles technologies, les vocabulaires de nombreuses langues africaines sont devenus plus sophistiqués. Par exemple, la langue yorùbá a désormais des mots tels que erọ amúlétutù (climatiseur), erọ ìbánisọ̀rọ̀ (téléphone) et erọ ìlọta (grinder). De même, la langue ὶgbò a des mots tels que ekwè nti (téléphone) et ugbọ̀ àlà (véhicule). Les utilisateurs de ces langues ont donné à ces objets des noms décrivant leur utilité [par exemple, amúlétutù signifie littéralement « machine qui rend la maison fraîche », et erọ ìbánisọ̀rọ̀ « machine pour parler à quelqu’un », ndt].

Dans les cours sur la radiodiffusion et la publicité en yorùbá, les étudiants apprennent que la plupart des gens appellent la télévision  erọ amóhùnmáwòrán [littéralement : machine qui transmet le son et l’image]. Ces créations de nouveaux mots soulèvent de nombreuses questions et opinions – certains étudiants affirment que, du fait de leurs fonctionnalités, les caméras vidéo et les enregistreurs peuvent également être désignés pas le terme erọ amóhùnmáwòrán.

Ces défis linguistiques dans l’espace technologique sont positifs pour les langues, en ce qu’ils stimulent la pensée critique pour le progrès linguistique et technologique.

En 2019, Google a ouvert son premier Google Artificial Intelligence (AI) (Centre de recherche en intelligence artificielle) à Accra, au Ghana, axé sur l’amélioration de « la capacité de Google Translate à capturer plus précisément les langues africaines », selon CNN. Le chercheur Moustapha Cisse, qui dirige le travail des centres Google AI en Afrique, estime qu’« un continent avec plus de 2 000 dialectes [sic] mérite de meilleurs services », comme l’a également rapporté CNN.

Mozilla et BMZ ont récemment annoncé leur coopération pour ouvrir la technologie vocale aux langues africaines. Avec de telles initiatives, il y a fort à espérer pour l’avenir des études en langues africaines.

___

Ce billet que j’ai traduit de l’anglais a été écrit par le nigérian Aremu Adeola linguiste, lexicographe et traducteur. Il a été publié en premier lieu sur le site de globalvoices. org.

Laisser un commentaire avec Facebook

konakryexpress

Je revendique le titre de premier clandestin à entrer en Italie, le jour où la mort de Che Guevara a été annoncée. Mais comme ce serait long de tout décrire, je vous invite à lire cette interview accordée à un blogger et militant pour les droits humains qui retrace mon parcours dans la vie: https://fr.globalvoices.org/2013/05/20/146487/

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Bouton retour en haut de la page