L’inuktut devient la première langue autochtone au service de traduction de Google

L’une des langues autochtones comprenant le plus de locuteurs au Canada est désormais accessible sur Google. L’inuktut, une langue composée d’un ensemble de dialectes inuit, a été ajouté à Google Traduction, un service de traduction de textes, de documents et de sites web. Une première pour le géant du web au pays.
Cet ajout fait partie d’une initiative qui a pour but de développer un modèle linguistique d’intelligence artificielle unique visant à incorporer 1000 des langues les plus parlées dans le monde. Environ 40 000 personnes parlent l’inuktut au pays, selon les données de Statistique Canada.
« Or, le nombre de locuteurs à lui seul ne suffit pas à déterminer si une langue peut être intégrée à Google Traduction », a indiqué l’ingénieur du logiciel principal de la plateforme, Isaac Caswell.
Il doit en outre y avoir suffisamment de données textuelles disponibles en ligne pour créer un modèle linguistique.
D’autres langues autochtones du Canada n’ont tout simplement pas assez de données pour avoir un modèle de traduction automatique utilisable, a expliqué M. Caswell.
Les ingénieurs ont notamment envisagé d’y ajouter aussi le cri, une langue portée par quelque 86 000 personnes, mais il n’y avait pas suffisamment de sites web desquels puiser des données.
Nous ne voulons pas mettre quoi que ce soit sur la plateforme qui ne produise que du texte brisé ou qui n’a aucun sens, a souligné M. Caswell.
L’inuktut se distingue vraiment par le fait qu’il contient beaucoup de données épurées et bien écrites, a renchéri ce dernier, ajoutant que la communauté en ligne augmente depuis son ajout.
Ce faisant, Google emboîte le pas à des initiatives similaires d’intégration de l’inuktitut de Meta et Microsoft sur leur plateforme.
Un travail de collaboration
Lorsqu’elle envisage d’ajouter une langue à Google Traduction, la multinationale se penche sur deux éléments principaux : l’existence ou non d’un désir ou un besoin de la communauté, et dans quelle mesure le projet est techniquement réalisable.
Une fois que Google avait déterminé que son modèle pouvait reconnaître l’inuktut, la compagnie a entamé des consultations auprès des locuteurs et de diverses organisations.
Par exemple, Inuit Tapiriit Kanatami (ITK), une organisation nationale représentant environ 70 000 Inuit au Canada, a été approchée pour s’assurer que le développement du modèle soit fidèle à l’inuktut et à ses deux systèmes d’écriture, soit le qaniujaaqpait (dit syllabique) et le qaliujaaqpait (recourant à l’alphabet romain).

ITK a développé sa propre banque de données de caractères communs qui peuvent être utilisés pour écrire dans n’importe quel dialecte de la langue inuit afin de faciliter la communication écrite entre les différentes régions inuit.
Si nous n’avions pas eu leur aide, nous aurions simplement pu lancer le modèle en syllabique, ce qui aurait compromis certains de leurs projets, a indiqué Isaac Caswell.
L’organisation inuit a salué le travail de Google, évoquant la nécessité de revitaliser, de protéger et de promouvoir davantage les langues inuit.
L’ajout de l’inuktut sur une plateforme aussi largement utilisée permet aux Inuit d’interagir plus pleinement dans le monde numérique, a déclaré le président d’ITK, Natan Obed, par voie de communiqué.
Avec l’introduction de l’inuktut dans son service de traduction, Google accroît la représentation d’un groupe de personnes souvent négligé par le secteur technologique.
J’espère que cela leur permettra de se sentir un peu plus reconnus par une grande entreprise technologique, parce que, en général, les communautés autochtones ont historiquement été délaissées sur le plan technologique, a affirmé Isaac Caswell.
L’utilisation de l’intelligence artificielle pour promouvoir les langues autochtones n’est pas sans limites, a néanmoins reconnu M. Caswell. Quoiqu’il en soit, il espère qu’une technologie plus avancée permettra de rendre plus accessible un plus large éventail de langues autochtones.
Dans l’attente, d’autres options pourraient être ajoutées à la gamme de services de Google Traduction, notamment un outil de traduction verbale, selon le cadre.
À lire aussi :