Textopol > Enseignement > Séminaire doctoral >

Programme des séances Archives 2006 - 2007

 
Les programmes détaillés de chaque journée seront mis à jour régulièrement, les exercices réalisés mis en ligne d'une fois sur l'autre afin que chacun puisse, si besoin est, s'y référer.
             
>> Séance 1:  
- 28 octobre 2006 -
 
  En ligne
>> Séance 2:  
- 18 novembre 2006 -
 
  En ligne
>> Séance 3:  
- 16 décembre 2006 -
 
  En ligne
>> Séance 4:  
- 20 janvier 2007 -
 
  En ligne
>> Séance 5:  
- 17 fevrier 2007 -
 
  En ligne
>> Séance 6:  
- 17 mars 2007 -
 
  En ligne
>> Séance 7:  
- - -
 
  ...
>> Séance 8:  

- - -

 
  ...
             

     
>>
Séance 1
 

Informatique textuelle

Samedi 28 octobre 2006 - Salle 227

 

9h30- 12h30

1. Objectifs et moyens du séminaire : Recherche textuelle informatisée ; espaces de travail ; accès et profils ; modes de travail, calendrier, évaluation


2. Les outils de la recherche: site Textopol ; logiciels et bases de données

 


3. Cours d’informatique textuelle (1) : Etiquetage, décomptes, explorations, statistiques : CORDIAL et LEXICO3.

14h00-16h00

4. Un exemple de Traitements automatisés de discours politiques : les vœux présidentiels (JM Leblanc).


5. Exercices : Manipulation sur le corpus vœux




Documents:

• Instructions pour le recueil et la constitution de corpus lexicométriques


 

     
>>
Séance 2
 

Séminaire doctoral d'informatique textuelle

18 novembre 2006 - Salle 227

Corpus textuels, approches statistiques, étiquetages catégoriels

 

9h30-10h15

1. Rappels  Espaces de travail et profils individuels. Ressources et bases de données. Evaluation et projets de travail individuels ( tour de table) Un exemple de traitement lexicométrique : Exercice d’application ( à rendre pour l’évaluation)

10h30-12h30


2. Prises en main (suite)

 


Etiquetage, décompte statistique (approche CORDIAL), approche lexicométrique LEXICO 3 (main traitement du corpus non catégorisé Vœux présidentiels).

3. Cours de lexicométrie

La démarche lexicométrique ; hypothèses et variables ; constitution de corpus et partition ; tableau lexical complet et partiel ; propriétés statistiques vs propriétés linguistiques ; protocoles de description. Résultats et interprétions : présentation et discussion d’un ouvrage récent utilisant HYPERBASE et CORDIAL (Mayaffre, 2004).

13h30-16h30


4. Traitement de la base catégorisée Vœux présidentiels HYPERBASE, 5. Travail sur les corpus personnels.




Documents:

Traitement Hyperbase du corpus vœux présidentiels
Examiner la distribution des auxiliaires de modalité ( pouvoir, devoir, etc.) dans le corpus vœux

 

     
>>
Séance 3
 

Séminaire doctoral d'informatique textuelle

16 décembre 2006 - Salle 227

 

9h30-12h30

1. André Salem, prof. Paris 3 Sorbonne Nouvelle : « Les types génériques, expérimentations lexicométriques, topographies textuelles, typologies génériques »


2. Cours d’informatique textuelle (3) : La notion de cooccurrence, approche différenciée : LEXICO3, ALCESTE, WEBLEX

 

14h -16h30


3.Mise en œuvre dans les travaux personnels

4. Exercice Frantext.





Documents:




 

     
>>
Séance 4
 

Séminaire doctoral d'informatique textuelle

20 janvier 2006 - Salle 227

 

9h30-10h30

1. Projet de travail collectif : les vœux dans la campagne présidentielle 2007


2. Deux approches de l’analyse des énoncés : A. Tropes : analyse de contenu B. Alceste : analyse des univers sémantique à travers les cooccurrences d’énoncés

 

10h30-12h30


3. Prise en main du logiciel ALCESTE

13h30 -16h30

4. Mise en œuvre des logiciels dans les travaux personnels.




5. Recueil de données

Documents:




 

     
>>
Séance 5
 

Séminaire doctoral d'informatique textuelle

17 février 2007 - Salle 227

 

9h30-10h30

1. Cours d’informatique textuelle (3) : La notion de cooccurrence, trois approches : LEXICO3, ALCESTE, WEBLEX

11h-12h30


2.Prise en main de WEBLEX : cooccurrences et lexicogrammes, filtres SQP, utilisation des tableaux

 

14h -16h30


3. Premiers résultats sur le corpus vœux 2007

4. Mise en œuvre des logiciels dans les travaux personnels.





Documents:




 

     
>>
Séance 6
 

Séminaire doctoral d'informatique textuelle

24 mars 2007 - Salle 227

 

9h30-10h

Avancement des travaux sur le corpus vœux 2007

10h30 -11h30 : Maria Zimina, postdoc Paris 13 et P3


I. Ressources textuelles multilingues : Gestion, accès au contenu linguistique

 


II. Textométrie multilingue Un nouveau courant de recherches interdisciplinaire…Exemples d’utilisations (pratique des segments répétés, classification automatique, spécificités, topographie bi-textuelle, etc.)

12h - 13h

Exercices: alignements des textes et repérages des unités lexicales : corpus de vœux multilingues.

14h - 16h


Remises et discussion des travaux personnels




Documents:




 

>>
Exercices et documents téléchargeables
   
   

 

 


Séance 1:


1.1. Instruction pour le recueil et la constitution de corpus lexicométriques (PDF) (HTML)

 


 


>>Navigation:      
>>

INFORMATIONS et INSCRIPTIONS: fiala@univ-paris12.fr