Textopol > Enseignement > Séminaire doctoral >
Exercices - Corpus - Documents
>> Exercices de balisage, recueils, transformation de données textuellesSaisie et constitution de corpus
Ce document fournit les instructions élémentaires pour le recueil des textes et la constitution de corpus lexicométriques : normes de saisie, calibrage, nettoyage des données, opérations préalables à tout traitement automatisé.
Balisage et gestion de fichiers
Nettoyage, et calibrage des données au moyen de traitements simples sous Word. Transformation des balises Hyperbases vers lexico, Lexico Alceste...Trois jeux d'exercices.
- Exercice de balisage : Hyperbase vers Lexico, sur le corpus MajPres (PDF) (HTML)
- Document source (RTF)
- Corrigé (PDF) (HTML)
- Exercice 1.1 : Recueil, constitution, test d'un corpus (FSE 2003) (PDF) (HTML)
- Corrigé de l'exercice 1.1 (PDF) (HTML)
- Corpus FSE03, balisage Hyperbase (Format rtf) (format Txt)
- 4.1 : Conversion du corpus Majpres2 de Lexico vers Alceste (avec corrigé). (PDF) (HTML)
- Deux états du corpus Majpres2 (Lexico / Alceste). (Zip)
>> Exercices de mise en oeuvre des logiciels
Prise en main Hyperbase
Une série d'expériences portant sur les marques personnelles dans les messages de voeux permet d'aborder les notions de balisage et de mise en oeuvre du programme, mais aussi les fonctions documentaires (concordances contextes) ainsi que les fonctionnalités de recherche évoluée, création de listes de formes, analyse factorielle portant sur des listes mais aussi spécificités et représentations en histogrammes.
Prise en main de Lexico 3Exercices de prise en main de Lexico, en cinq étapes, sur le corpus des voeux présidentiels. Ces exercices progressifs permettent d'aborder l'ensemble des fonctionnalités du logiciel : segmentation, balisage, fonctions documentaires (concordances, contextes), fonctions statistiques (spécificités, analyses factorielles des correspondances...), recherche de cooccurents spécifiques...
- Présentation de Lexico3 , programme des exercices. (PDF) (HTML)
- 3.1 : Balisage, segmentation, rapport, graphiques de ventilation, concordances. (PDF) (HTML)
- 3.2 : Groupes de formes, segments répétés. (PDF) (HTML)
- 3.3 : Spécificités par partie et spécificités chronologiques. (PDF) (HTML)
- 3.4 : Analyse factorielle des correspondances. (PDF) (HTML)
- 3.5 : Topographie textuelle et cooccurrents spécifiques. (PDF) (HTML)
>> Exercices d'application des logiciels
- 5.1 : L'examen de la forme Europe sur le corpus Maplur. (Weblex)
- 5.2 : Recherche de motifs sous Weblex (PDF) (HTML)
Documents:
- Instructions pour le recueil et la constitution de corpus lexicométriques (PDF) (HTML)
- Protocole d'observation (PDF) (HTML)
- Corpus FSE03, balisage Hyperbase (Format rtf) (format Txt)
- Deux états du corpus Majpres2 (Lexico / Alceste). (Zip)
- Guide d'interrogation de la base Frantext (ENS-LSH) (Lien hypertextuel): http://cid-cedille.ens-lsh.fr/
- Bibliographie sommaire (PDF) (HTML)
<< Retour Textopol - Exercices - Programme détaillé des séances - Retour calendrier >>
<< Exercices >>