Avant de commencer l’analyse du texte coréen, il faut savoir que la langue coréenne est une langue qui fonctionne avec… Lire la suite COREEN – Avant la phase d’analyse : Phase de segmentation
Catégorie : Journal de bord
Concaténation et Nettoyage des corpus
Concaténation Maintenant que nous avons récupéré tous les textes, il nous faut les concaténer, car chaque article est sauvegardé dans… Lire la suite Concaténation et Nettoyage des corpus
Traitement du japonais
Le japonais est une langue un peu plus compliquée à traiter que les autres langues étudiées dans notre projet, car… Lire la suite Traitement du japonais
Script final
Nous allons décrire notre version du script final, dans lequel nous avons pu résoudre certains problèmes rencontrés dans les scripts… Lire la suite Script final
Script du Cours 6
Dans ce script, nous avons ajouté les contextes, les index hiérarchiques et le bigrammes.Il y a deux types de contextes… Lire la suite Script du Cours 6
Script du Cours 5
Le script produit à la fin du cours 5 nous permettait, en plus des résultats obtenus avec le script précédent,… Lire la suite Script du Cours 5
Script du Cours 4
Le script produit à la fin du cours 4 nous permettait de mettre dans chaque ligne d’un tableau le numéro… Lire la suite Script du Cours 4
Récupération des pages Web
La phase de récupération des 50 pages web pour chaque langue fut un travail long et fastidieux, et nous avons… Lire la suite Récupération des pages Web
Vous avez dit « transgenre »?
Nous travaillons sur le mot « transgenre », mais peut-être qu’une définition pourrait être utile, car certaines personnes considèrent que transgenre et… Lire la suite Vous avez dit « transgenre »?
Présentation du projet
Bonjour! Nous sommes Élodie et Léa, en master 1 Traitement Automatique des Langues. Vous vous trouvez sur le blog de… Lire la suite Présentation du projet