jml Site Admin
Inscrit le: 11 Jan 2007 Messages: 152
|
Posté le: Mer Jan 30, 2008 10:17 pm Sujet du message: Séance 1 (2 heures) 18 janvier 2008 |
|
|
INTRODUCTION
1. Qu’est-ce que la linguistique de corpus ?
- Définition de la notion de corpus, quelques exemples en sciences sociales
- Constitution du corpus, recueil des données, les hypothèses de recherche, les contraintes…
2. La linguistique de corpus et l’approche quantitative des données textuelles
- Les dénominations (lexicométrie textométrie, statistique lexicale, statistique textuelle…)
- Les origines, les postulats méthodologiques, les outils logiciels, les progrès techniques…
- Compter les mots, une pratique courante ?
- Exemples puisés dans l’actualité politique de « diagnostics fréquentiels »
- La répétition : style ? Thématique ? Genre ? Effet rhétorique ?
- Les unités de décompte : Mot, lemme, catégories, ngrammes, racines, forme graphique, segments cooccurrences…
- Les domaines d’application et les approches (Littérature, discours politique, médias mais aussi marketing ou autres domaines des sciences sociales)
3. Recueillir des données textuelles :
- Quelques bases de données textuelles et ressources électroniques (liens dans Textopol)
(Frantext, Abu, Gallica, Documentation française…)
4. Quelques notions à approfondir :
Les outils logiciels, les grands principes, quelques fonctionnalités… |
|