Séminaire doctoral 2003-2004
CMC 227
Séance 3.
17 janvier 2004
LEXICO 3
Présentation et prise en main
Samedi 17 janvier 2003
- La présentation de l’outil Lexico3 se fera au moyen de démonstrations en écran projeté au cours desquelles on abordera les fonctionnalités essentielles du logiciel.
- A chaque étape on proposera une série de manipulations afin de mettre en application les notions abordées.
- Démonstration et " exercices " s’appuieront sur un corpus d’exemple constitué des messages présidentiels de vœux aux Français sur la période 1959-2001. Ce corpus offre en effet la possibilité d’effectuer des mesures contrastives entre les locuteurs mais aussi d’observer les réalisations lexicales en diachronie.
- Un objectif de cette séancee serait de constituer un rapport des résultats obtenus lors des manipulations, qui seront recueillis dans un document Word.
- Les participants qui disposeraient de corpus même partiels pourraient par ailleurs appliquer le traitement lexicométrique à leur propre recherche.
- Une version de Lexico 3 est disponible au téléchargement à l’adresse suivante : http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/lexico3.htm
Déroulement de la séance :
Préparation du corpus
Format de fichier, casse.
Partition, balisage.
Les caractères délimiteurs.
La notion de forme graphique.
- Caractéristiques fréquentielles du corpus
L’index hiérarchique.
Caractéristiques des partitions : Occurrences, formes, hapax.
- Premières analyses contrastives : Distribution statistique et mise en contexte
Graphiques de ventilation.
Concordances.
- Manipulation 1
: Balisage, segmentation, création d’un rapport, graphiques de ventilation, concordances.
- Unités minimales ou segments
Les groupes de formes.
Les segments répétés.
- Manipulation 2
: Groupes de formes Segments répétés Conserver une requête dans le presse-papiers Naviguer entre les partitions.
- Les outils d’analyse statistique
Les spécificités par partie.
Les spécificités évolutives.
- Manipulation 3
: Spécificités par partie Graphique de ventilation Spécificités chronologiques.
- Les outils de statistique multidimensionnelle.
Caractériser les faits saillants du corpus.
L’analyse factorielle des correspondances.
- Manipulation 4
: Analyse factorielle des correspondances et spécificités.
Carte des sections.
Spécificité des sections, une manière d’aborder la notion de cooccurrences.
- Manipulation 5
: Carte des sections et spécificités .