Programme des séances 2006-2007

Textopol > Enseignement > Séminaire doctoral >

Programme des séances Archives 2006 - 2007

Les programmes détaillés de chaque journée seront mis à jour régulièrement, les exercices réalisés mis en ligne d'une fois sur l'autre afin que chacun puisse, si besoin est, s'y référer.

>> Séance 1:
- 28 octobre 2006 -

En ligne

>> Séance 2:
- 18 novembre 2006 -

En ligne

>> Séance 3:
- 16 décembre 2006 -

En ligne

>> Séance 4:
- 20 janvier 2007 -

En ligne

>> Séance 5:
- 17 fevrier 2007 -

En ligne

>> Séance 6:
- 17 mars 2007 -

En ligne

>> Séance 7:
- - -

...

>> Séance 8:
- - -

...

>>
Séance 1

Informatique textuelle

Samedi 28 octobre 2006 - Salle 227

9h30- 12h30

1. Objectifs et moyens du séminaire : Recherche textuelle informatisée ; espaces de travail ; accès et profils ; modes de travail, calendrier, évaluation

2. Les outils de la recherche: site Textopol ; logiciels et bases de données

3. Cours d’informatique textuelle (1) : Etiquetage, décomptes, explorations, statistiques : CORDIAL et LEXICO3.

14h00-16h00

4. Un exemple de Traitements automatisés de discours politiques : les vœux présidentiels (JM Leblanc).

5. Exercices : Manipulation sur le corpus vœux

Documents:

• Instructions pour le recueil et la constitution de corpus lexicométriques

>>
Séance 2

Séminaire doctoral d'informatique textuelle

18 novembre 2006 - Salle 227

Corpus textuels, approches statistiques, étiquetages catégoriels

9h30-10h15

1. Rappels Espaces de travail et profils individuels. Ressources et bases de données. Evaluation et projets de travail individuels ( tour de table) Un exemple de traitement lexicométrique : Exercice d’application ( à rendre pour l’évaluation)

10h30-12h30

2. Prises en main (suite)

Etiquetage, décompte statistique (approche CORDIAL), approche lexicométrique LEXICO 3 (main traitement du corpus non catégorisé Vœux présidentiels).

3. Cours de lexicométrie

La démarche lexicométrique ; hypothèses et variables ; constitution de corpus et partition ; tableau lexical complet et partiel ; propriétés statistiques vs propriétés linguistiques ; protocoles de description. Résultats et interprétions : présentation et discussion d’un ouvrage récent utilisant HYPERBASE et CORDIAL (Mayaffre, 2004).

13h30-16h30

4. Traitement de la base catégorisée Vœux présidentiels HYPERBASE, 5. Travail sur les corpus personnels.

Documents:

Traitement Hyperbase du corpus vœux présidentiels
Examiner la distribution des auxiliaires de modalité ( pouvoir, devoir, etc.) dans le corpus vœux

>>
Séance 3

Séminaire doctoral d'informatique textuelle

16 décembre 2006 - Salle 227

9h30-12h30

1. André Salem, prof. Paris 3 Sorbonne Nouvelle : « Les types génériques, expérimentations lexicométriques, topographies textuelles, typologies génériques »

2. Cours d’informatique textuelle (3) : La notion de cooccurrence, approche différenciée : LEXICO3, ALCESTE, WEBLEX

14h -16h30

3.Mise en œuvre dans les travaux personnels

4. Exercice Frantext.

Documents:

>>
Séance 4

Séminaire doctoral d'informatique textuelle

20 janvier 2006 - Salle 227

9h30-10h30

1. Projet de travail collectif : les vœux dans la campagne présidentielle 2007

2. Deux approches de l’analyse des énoncés : A. Tropes : analyse de contenu B. Alceste : analyse des univers sémantique à travers les cooccurrences d’énoncés

10h30-12h30

3. Prise en main du logiciel ALCESTE

13h30 -16h30

4. Mise en œuvre des logiciels dans les travaux personnels.

5. Recueil de données

Documents:

>>
Séance 5

Séminaire doctoral d'informatique textuelle

17 février 2007 - Salle 227

9h30-10h30

1. Cours d’informatique textuelle (3) : La notion de cooccurrence, trois approches : LEXICO3, ALCESTE, WEBLEX

11h-12h30

2.Prise en main de WEBLEX : cooccurrences et lexicogrammes, filtres SQP, utilisation des tableaux

14h -16h30

3. Premiers résultats sur le corpus vœux 2007

4. Mise en œuvre des logiciels dans les travaux personnels.

Documents:

>>
Séance 6

Séminaire doctoral d'informatique textuelle

24 mars 2007 - Salle 227

9h30-10h

Avancement des travaux sur le corpus vœux 2007

10h30 -11h30 : Maria Zimina, postdoc Paris 13 et P3

I. Ressources textuelles multilingues : Gestion, accès au contenu linguistique

II. Textométrie multilingue Un nouveau courant de recherches interdisciplinaire…Exemples d’utilisations (pratique des segments répétés, classification automatique, spécificités, topographie bi-textuelle, etc.)

12h - 13h

Exercices: alignements des textes et repérages des unités lexicales : corpus de vœux multilingues.

14h - 16h

Remises et discussion des travaux personnels

Documents:

>>
Exercices et documents téléchargeables

Séance 1:

1.1. Instruction pour le recueil et la constitution de corpus lexicométriques (PDF) (HTML)

>>Navigation:
>>

INFORMATIONS et INSCRIPTIONS: fiala@univ-paris12.fr


	*Textopol > Enseignement > Séminaire doctoral >* Programme des séances Archives 2006 - 2007