Calendrier2008-2009

Textopol > Enseignement >

Séminaire doctoral - 2008-2009

Traitement automatisé des discours et informatique textuelle:
Séminaire de l'Ecole Doctorale, 36 heures semestrielles
Séance mensuelle : samedi 9h 30 - 16h30 ;
salles informatiques CMC 227/342

Responsable : P. Fiala

Les six séances mensuelles constituent une introduction à l'analyse des corpus textuels. Chaque séance comprend la prise en main d’un logiciel et des problématiques qui s’y rattachent. Des exercices pratiques en linguistique de corpus et en statistique textuelle permettent de tester les fonctionnalités, de répondre aux questions pratiques. Le séminaire s’adresse aux doctorants et aux étudiants en Master 2 de Paris-12, et des autres universités dans la limite des places disponibles, titulaires du C2i ou ayant suivi avec succès un cours d’informatique textuelle. Il nécessite une inscription préalable. Pour les étudiants du Master 2 l’évaluation comprend la participation active à 4 séances et la réalisation d’une analyse informatisée.

Déroulement des séances :

3 heures de cours ; 3 heures de TD. Un accès libre aux postes de travail équipés des logiciels est prévu le mardi suivant chaque séance mensuelle,. Des formations complémentaires sont envisageables en collaboration avec JM Leblanc, maître de conférences : Xlstat, END-NOTE, logiciels multimédia.

Programme des séances

1. Samedi 25 octobre 2008 :

Etiqueter, quantifier, décrire les textes (Logiciels Cordial, Tree Tagger). Rechercher des formes, des contextes, des schémas syntaxiques, des propriétés sémantiques dans un corpus textuel (Bases textuelles littéraires et historiques, Logiciel Stella et filtres grammaticaux).

2. Samedi 15 novembre 2008 :

Construire et analyser des corpus lexicométriques (lexico3). Fonctions documentaires et fonctions statistiques ; typologies génériques. Hypothèse, corrélations et causalités interprétatives

3. Samedi 13 décembre 2008 :

Expérimentations lexicométriques, distance intertextuelle. topographies textuelles, Visualisation des résultats (Hyperbase, Astartex).

4. Samedi 17 janvier 2009 :

Analyses lexicométriques et analyses de contenu (Tropes). Cooccurrences dans les énoncés et mondes sémantiques (Alceste).

5. Samedi 7 février 2009 :

Voisinages lexicaux ; cooccurrences dans les textes ; tableaux de propriétés textuelles (Weblex et les grammaires MPC).

6. Samedi 7 mars 2009 :

Samedi 7 mars 2009: Les corpus multilingues : Alignements, traitements lexicométriques de corpus multilingues.

4 avril 2009 : Journée d’étude : Présentation des travaux