Corpus Alice au pays des mesures : (Sources : anglais, japonais, français (traduction 1), français (traduction 2), italien, chinois, polonais, russe)
- Alice au pays des merveilles : 7 langues (anglais, japonais, français (2 traductions), italien, chinois, polonais, russe) ; lemmatisation via treetagger (EN, FR, IT), segmentation et lemmatisation via chasen (JP), segmentation via ICTCLAS (ZH).
- Alice au pays des merveilles : idem que le précédent avec affichage sélectif des volets visés.
- Chacun des volets de l'alignement est accessible ici (extraction via mkAlign à partir du TMX précédent) :
- FR (traduction 1), FR (traduction 1 lemme), FR (traduction 2), FR (traduction 2 lemme), EN, EN (lemme), IT, IT (lemme), JP, JP (lemme), JP (segmenté), ZH, ZH (segmenté), PL, RU.
- Tous ces fichiers intègrent en fin de chaque ligne le segmenteur # permettant de les recharger alignés 2 à 2 en utilisant le segmenteur par défaut de mkAlign.
- Kit d'alignement Alice : fichier au format RTF contenant dans une colonne la version de référence en anglais, et une colonne à compléter en y intégrant le nouveau volet à aligner.
Les commentaires récents