Textopol > Enseignement > Séminaire doctoral >
Programme des séances Archives 2006 - 2007
Les programmes détaillés de chaque journée seront mis à jour régulièrement, les exercices réalisés mis en ligne d'une fois sur l'autre afin que chacun puisse, si besoin est, s'y référer.
>> Séance 1: - 28 octobre 2006 -En ligne >> Séance 2: - 18 novembre 2006 -En ligne >> Séance 3: - 16 décembre 2006 -En ligne >> Séance 4: - 20 janvier 2007 -En ligne >> Séance 5: - 17 fevrier 2007 -En ligne >> Séance 6: - 17 mars 2007 -En ligne >> Séance 7: - - -... >> Séance 8: - - -
...
>> Séance 1Informatique textuelle
Samedi 28 octobre 2006 - Salle 227
9h30- 12h30
1. Objectifs et moyens du séminaire : Recherche textuelle informatisée ; espaces de travail ; accès et profils ; modes de travail, calendrier, évaluation
2. Les outils de la recherche: site Textopol ; logiciels et bases de données
3. Cours d’informatique textuelle (1) : Etiquetage, décomptes, explorations, statistiques : CORDIAL et LEXICO3.14h00-16h00
4. Un exemple de Traitements automatisés de discours politiques : les vœux présidentiels (JM Leblanc).
5. Exercices : Manipulation sur le corpus vœux
Documents:
• Instructions pour le recueil et la constitution de corpus lexicométriques
>> Séance 2Séminaire doctoral d'informatique textuelle
18 novembre 2006 - Salle 227
Corpus textuels, approches statistiques, étiquetages catégoriels
9h30-10h15
1. Rappels Espaces de travail et profils individuels. Ressources et bases de données. Evaluation et projets de travail individuels ( tour de table) Un exemple de traitement lexicométrique : Exercice d’application ( à rendre pour l’évaluation)
10h30-12h30
2. Prises en main (suite)
Etiquetage, décompte statistique (approche CORDIAL), approche lexicométrique LEXICO 3 (main traitement du corpus non catégorisé Vœux présidentiels).3. Cours de lexicométrie
La démarche lexicométrique ; hypothèses et variables ; constitution de corpus et partition ; tableau lexical complet et partiel ; propriétés statistiques vs propriétés linguistiques ; protocoles de description. Résultats et interprétions : présentation et discussion d’un ouvrage récent utilisant HYPERBASE et CORDIAL (Mayaffre, 2004).
13h30-16h30
4. Traitement de la base catégorisée Vœux présidentiels HYPERBASE, 5. Travail sur les corpus personnels.
Documents:
Traitement Hyperbase du corpus vœux présidentiels
Examiner la distribution des auxiliaires de modalité ( pouvoir, devoir, etc.) dans le corpus vœux
>> Séance 3Séminaire doctoral d'informatique textuelle
16 décembre 2006 - Salle 227
9h30-12h30
1. André Salem, prof. Paris 3 Sorbonne Nouvelle : « Les types génériques, expérimentations lexicométriques, topographies textuelles, typologies génériques »
2. Cours d’informatique textuelle (3) : La notion de cooccurrence, approche différenciée : LEXICO3, ALCESTE, WEBLEX
14h -16h30
3.Mise en œuvre dans les travaux personnels
4. Exercice Frantext.
Documents:
>> Séance 4Séminaire doctoral d'informatique textuelle
20 janvier 2006 - Salle 227
9h30-10h30
1. Projet de travail collectif : les vœux dans la campagne présidentielle 2007
2. Deux approches de l’analyse des énoncés : A. Tropes : analyse de contenu B. Alceste : analyse des univers sémantique à travers les cooccurrences d’énoncés
10h30-12h30
3. Prise en main du logiciel ALCESTE13h30 -16h30
4. Mise en œuvre des logiciels dans les travaux personnels.
5. Recueil de données
Documents:
>> Séance 5Séminaire doctoral d'informatique textuelle
17 février 2007 - Salle 227
9h30-10h30
1. Cours d’informatique textuelle (3) : La notion de cooccurrence, trois approches : LEXICO3, ALCESTE, WEBLEX
11h-12h30
2.Prise en main de WEBLEX : cooccurrences et lexicogrammes, filtres SQP, utilisation des tableaux
14h -16h30
3. Premiers résultats sur le corpus vœux 2007
4. Mise en œuvre des logiciels dans les travaux personnels.
Documents:
>> Séance 6Séminaire doctoral d'informatique textuelle
24 mars 2007 - Salle 227
9h30-10h
Avancement des travaux sur le corpus vœux 2007
10h30 -11h30 : Maria Zimina, postdoc Paris 13 et P3
I. Ressources textuelles multilingues : Gestion, accès au contenu linguistique
II. Textométrie multilingue Un nouveau courant de recherches interdisciplinaire…Exemples d’utilisations (pratique des segments répétés, classification automatique, spécificités, topographie bi-textuelle, etc.)12h - 13h
Exercices: alignements des textes et repérages des unités lexicales : corpus de vœux multilingues.
14h - 16h
Remises et discussion des travaux personnels
Documents:
>>Exercices et documents téléchargeables
1.1. Instruction pour le recueil et la constitution de corpus lexicométriques (PDF) (HTML)