TEXTOPOL

jml · Site Admin Inscrit le: 11 Jan 2007 Messages: 152

INTRODUCTION

1. Qu’est-ce que la linguistique de corpus ?
- Définition de la notion de corpus, quelques exemples en sciences sociales
- Constitution du corpus, recueil des données, les hypothèses de recherche, les contraintes…

2. La linguistique de corpus et l’approche quantitative des données textuelles
- Les dénominations (lexicométrie textométrie, statistique lexicale, statistique textuelle…)
- Les origines, les postulats méthodologiques, les outils logiciels, les progrès techniques…
- Compter les mots, une pratique courante ?
- Exemples puisés dans l’actualité politique de « diagnostics fréquentiels »
- La répétition : style ? Thématique ? Genre ? Effet rhétorique ?
- Les unités de décompte : Mot, lemme, catégories, ngrammes, racines, forme graphique, segments cooccurrences…
- Les domaines d’application et les approches (Littérature, discours politique, médias mais aussi marketing ou autres domaines des sciences sociales)

3. Recueillir des données textuelles :

- Quelques bases de données textuelles et ressources électroniques (liens dans Textopol)
(Frantext, Abu, Gallica, Documentation française…)

4. Quelques notions à approfondir :

Les outils logiciels, les grands principes, quelques fonctionnalités…