Quelques précisions sur l’algorithme que j'utilise dans la balise
lang.
Souricette a écrit :
Pour les langues étrangères, je ne sais pas si ta balise va effectivement ou non chercher dans les traducteurs en ligne dispo.
Non pas du tout. L'algorithme ne fait aucune différence entre les langues étrangères ou imaginaires. Il se base uniquement sur les fréquences d'apparitions des caractères (et des successions de caractères) dans une langue donnée (sur base d'exemples qui servent à l'apprentissage de la langue). Mais a part ça, le charabia qui est produit est tout à fait aléatoire (en respect de cette statistique). Si la langue de la balise n'est pas connue, c'est la statistique du latin qui s'applique.
Code :
[lang=langage inconnu]Cette phrase devrait ressembler à du latin, non ?[/lang]
(en langage inconnu) « Mmes aminitisu aertedi apstendum erum num ciond, hinonc ? »Souricette a écrit :
Un même mot n'est pas nécessairement « traduit » de la même façon.
Un même mot est toujours traduit de la même façon. L'algorithme fonctionne au mot à mot : il utilise une clé de hachage du mot à traduire pour initialiser la séquence aléatoire. Deux fois le même mot implique deux fois la même clé de hachage et deux fois la même traduction.
L'algorithme essaye aussi de faire en sorte que les mots courts restent courts et les mots longs restent longs, dans une certaine mesure. Le nombre de mots, ainsi l'ordre des mots dans la phrase est préservée (ce qui n'est pas forcément très réaliste). La ponctuation et la casse sont aussi préservées.
Code :
[lang=langage inconnu]A malin, malin et demi ![/lang]
(en langage inconnu) « Dia amim, amim renodet flcadilo ! »Souricette a écrit :
Les ressemblances et redondances entre chasse et chasser vont passer totalement inaperçues.
Oui, c'est vrai. Dans cet exemple, et quelque soit la langue choisie,
« chasse » et
« chasser » ont deux clés de hachage distinctes, et produisent deux charabia qui n'ont a priori rien à voir l'un avec l'autre. Autrement dit, la proximité phonétique n'est absolument pas conservée.
Code :
[lang=langage inconnu]Pour qui sont ces serpents qui sifflent sur vos têtes ?[/lang]
(en langage inconnu) « Veung per cuibuninop mopero nene per fetis leri a saemam ? »Il y a peut-être moyen d'améliorer l'algorithme, il faudra que j'y réfléchisse à l'occasion.
Souricette a écrit :
Le nom de la langue apparaît. Ce qui peut être « ok » dans certains contextes, mais perturbant dans d'autres.
Oui. Je suis parti de l'hypothèse qu'en général, il n'est pas nécessaire de parler une langue pour pouvoir la reconnaître. Ça me parait d'autant plus acceptable (en tant que règle générale) dans un monde de fantasy.