Alignator

Faute de logiciels adaptés à l’alignement entre des langues loitaines, telles que le français et le chinois, nous avons développé nous-mêmes un logiciel d’alignement semi-automatique au niveau de paragraphe en ligne et gratuit: Alignator (par Kim Gerdes), programmé en Python (pour le calcul) et en Javascript (pour l’interface graphique).

En l’absence de cognats, l’Alignator utilise un algorithme dynamique de dilatation temporelle pour deviner certaines paires de traduction. L’idée est que les paires de traduction ont une distribution similaire dans le texte entier – leurs positions peuvent être légèrement décalées par des insertions et des émissions dans la traduction, mais au total leurs signaux d’apparition se ressemblent plus qu’entre des mots qui ne sont pas des traductions mutuelles.

Le procédé provient de l’alignement par cognats : l’algorithme cherche un chemin diagonal minimal à travers une matrice de distances entre les paragraphes. Les résultats sont meilleurs pour des bitextes de grande taille et d’un parallélisme assez précis, sans trop d’insertions ou torsions.

L’idée de base de l’alignement de l’Alignator est qu’on ne veut jamais découper un paragraphe en deux, mais on veut aligner les frontières de paragraphes le plus précisément possible. De plus, l’algorithme part du principe, souvent faux et à corriger manuellement, que tout paragraphe dispose d’un (ou plusieurs) correspondant(s), autrement dit, il n’existe pas de paragraphe sans équivalent de traduction. Les résultats obtenus automatiquement ne sont que rarement parfaits et doivent normalement être corrigés manuellement.