Le texte qui suit a été traduit à partir d’un article basé sur le texte Humans still beat machines when it comes to literary translation, paru sur le site MULTILIGUAL, le 8 novembre 2022.
Un grand merci a notre traductrice fidèle, Nathalie Généreux, qui vit à Laval (Canada).
Vous n’utiliseriez pas Google Translate pour produire une version anglaise (ou dans n’importe quelle autre langue, d’ailleurs) d’un roman comme Cien años de soledad de Gabriel García Márquez, n’est-ce pas?
La réponse à cette question sera certainement un « non » catégorique. Bien que les chercheurs soient fascinés par les applications potentielles de la traduction automatique (TA) dans le domaine de la traduction littéraire, « les concurrents sérieux des traducteurs littéraires humains sont encore bien loin », conclut le Conseil Européen des Associations de Traducteurs littéraires (CEATL) dans un rapport de 2020.
Cela dit, les chercheurs essaient encore de voir comment la TA peut être appliquée aux œuvres littéraires. Une étude récente menée par un groupe de chercheurs de l’université du Massachusetts à Amherst a tenté de révéler pourquoi la TA n’est pas, dans la plupart des cas, à la hauteur des traductions littéraires réalisées par des humains.
« Étant donné que la traduction automatique est peu étudiée dans le domaine littéraire (en particulier sur le plan des documents), on ne sait pas très bien comment fonctionnent les systèmes de TA de pointe, et quelles erreurs systématiques ils commettent », ont précisé les chercheurs dans un article récemment publié et disponible gratuitement sur ArXiv.
Pour mettre en lumière certains des problèmes de la TA littéraire, les chercheurs ont rassemblé un corpus d’œuvres littéraires dans d’autres langues que l’anglais répondant aux critères suivants :
- L’œuvre se trouvait dans le domaine public dans son pays d’origine en 2022
- Plusieurs traductions de l’œuvre faites par des humains ont été publiées en anglais
- L’œuvre est publiée dans un format électronique
L’ensemble de données compilées par les chercheurs — appelé PAR3 — comprend au moins deux traductions humaines de chaque paragraphe source. Pour évaluer l’efficacité de la TA à des fins littéraires, les chercheurs ont utilisé Google Translate pour créer des versions anglaises des paragraphes sources et les ont présentées côte à côte avec les traductions humaines à deux groupes de lecteurs : des traducteurs littéraires professionnels et des écrivains anglais monolingues.
Comme on pouvait s’y attendre, les deux groupes ont massivement préféré les traductions humaines; dans 84 % des cas, les évaluateurs humains ont préféré les traductions faites par des humains à la version traduite par une machine. Les évaluateurs ont également présenté des idées qui, selon les chercheurs, pourraient être utilisées pour améliorer le potentiel de la TA dans les applications littéraires. En fonction des commentaires formulés, les chercheurs ont déterminé cinq façons d’améliorer la TA. Près de la moitié des erreurs de traduction automatique résultaient d’une traduction « trop littérale » du texte; même s’il ne s’agissait pas d’erreurs flagrantes, elles perturbaient souvent le flux du paragraphe, rendant le texte difficile à lire.
En outre, le manque de contexte a causé environ 20 % des problèmes signalés dans les paragraphes de TA. Les autres erreurs résultaient soit d’un mauvais choix de mots, soit d’une surprécision ou d’une sous-précision, soit d’erreurs dites « catastrophiques » qui « invalident complètement la traduction » (erreur de genre d’un personnage, par exemple). Les évaluateurs ont également utilisé ces renseignements pour créer un modèle de postédition automatique fondé sur le modèle de langage GPT-3 afin d’ajuster le résultat de la traduction automatique. Les versions post-éditées ont reçu des notes plus favorables que les versions non éditées produites par Google Translate.
« Dans l’ensemble, notre travail met en évidence de nouveaux défis en matière de TA littéraire, et nous espérons que la publication des données PAR3 encouragera la communauté de chercheurs à les relever », concluent les chercheurs.
-----------------
Podcast en anglais : Experienced literary translators hardly make a living
Lecture supplémentaires:
L’ordinateur va-t-il nous voler notre travail ? - James Hadley, Contrepoint No. 4
Commentaires