|
TEXTOPOL Ressources informatisées pour l'analyse du discours politique
|
Voir le sujet précédent :: Voir le sujet suivant |
Auteur |
Message |
jml Site Admin
Inscrit le: 11 Jan 2007 Messages: 152
|
Posté le: Lun Oct 12, 2009 8:47 pm Sujet du message: Séances 1 et 2 Analyses informatisées du discours politique |
|
|
Lien vers Weblex:
http://weblex.ens-lsh.fr/wlx/
Notions abordées lors des deux premières séances:
INTRODUCTION
1. Linguistique de corpus et techniques d’enquête, approches et méthodes
- La notion de corpus, quelques exemples en sciences sociales
- Constitution du corpus, recueil des données, les hypothèses de recherche, les contraintes…
- Des préoccupations différentes
2. L’approche quantitative des données textuelles
- Les dénominations (lexicométrie textométrie, statistique lexicale, statistique textuelle…)
- Les origines, les postulats méthodologiques, les outils logiciels, les progrès techniques…
- Compter les mots, une pratique courante ?
- Quels faits quantifier?
- Les unités de décompte : Mot, lemme, catégories, ngrammes, racines, forme graphique, segments cooccurrences…
- Les domaines d’application et les approches (Littérature, discours politique, médias mais aussi marketing ou autres domaines des sciences sociales)
- Les différents types de logiciels utilisés dans ces domaines
- Les outils textométriques, les catégoriseurs, les cooccurrenceurs, les outils travaillant sur des ontologies sémantiques.
Distincition entre les outils contrastifs travaillant sur la base d’une comparaison et les outils aptes à fournir des structures textuelles.
Quelques lois statistiques du vocabulaire
- Hapax, fréquences, richesse, accroissement, diversité, originalité du vocabulaire…
- formes, occurrences,
3. Les procédures d’analyse lexicométrique et textométriques
A/ Démarche lexicométrique «classique » :
- Réorganisation de la séquence textuelle
- Segmentation en unités minimales
- Index, dictionnaire hiérarchique
- Tableau lexical, partitions
- Analyses contrastives
- Norme endogène le plus fréquemment
- Norme exogène possible pour Hyperbase (comparaison avec le TLF pour le français), quelle utilité, quelle interprétation, dans quels cas de figure…
B/ Les fonctions documentaires
- Concordances
- Contextes
- Segments répétés
C/ Les Fonctions statistiques
- Contrastives (Spécificités par partie)
- Chronologiques
- Fréquences relatives
- Multidimensionnelles (proximités des parties du corpus)
Analyse Factorielle des Correspondances
Classifications hiérarchiques
3. Les fonctions de base et les outils logiciels quelques exemples
A/ Analyses contrastives et chronologiques
- Spécificités par partie (Weblex, Lexico, Hyperbase)
- Spécificités chronologiques (Lexico)
- Corrélation chronologique (Hyperbase)
- Les courbes de fréquences relatives
B/ Analyses typologiques
Classification automatique Analyse factorielle
4. Un outil d’analyse statistique des données textuelles : Weblex
- concordances et contextes
- rechercher des co-fréquences
- groupes, motifs, extraction « d’empan textuels » (travail en surface)
- spécificités (d’une forme, de plusieurs formes cumulées, d’un ensemble d’énoncés…)
- la notion de cooccurrence et de lexicogramme, simple ou récursif
Rappel sur les unités minimales (forme graphique, n-grammes, catégories morphosyntaxiques ou sémantiques, ontologies)
- Quelques exemples de logiciels et d'applications (Cordial et Treetagger, Tropes, Alceste, Weblex)
- Présentation de Weblex autour de ces problématiques
- Application sur un corpus catégorisé - Recherche de motifs textuels en surface (forme graphique) ou sur les catégories.
Document distribué
Exemplier: jeu d'étiquettes utilisé pour le corpus voeux2
Pour aller plus loin sur les catégories morphosyntaxiques:
- quelques applications
------------------------------
Pour aller plus loin…
Technologies du Langage (Blog de Jean Véronis)
http://aixtal.blogspot.com/
Psychologie politique et analyse du discours assistée par Ordinateur (Pascal Marchand)
http://pascal-marchand.fr/
Approches textométriques de la campagne présidentielle américaine de 2008
http://www.scharloth.com/cgi-bin/poltracker/poltracker.pl
Blog de Textopol sur les voeux présidentiels et sur le rituel
http://textopol.free.fr/dotclear/
Bibliographie analyses statistiques du discours politique
http://textopol.free.fr/Documents/Bibliographie/R%E9f%E9rences%20bibliographiques.htm
Quelques liens utiles:
http://jadt.org/
http://corpus.revues.org/
http://www.cavi.univ-paris3.fr/lexicometrica/
Le blog de Textopol pour quelques exemples d'application
http://textopol.free.fr/dotclear/
Logiciel Lexico 3
http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/
- Catégoriseurs morphosyntaxiques
TreeTagger
Cordial
- Ontologies sémantiques
Wordnet1
wordnet2
Tropes
Quelques exemples de sorties sous Cordial
- Statistiques sur le texte
- Extrait catégorisé
Suggérez vos propres liens…. |
|
Revenir en haut de page |
|
|
|
|
Vous ne pouvez pas poster de nouveaux sujets dans ce forum Vous ne pouvez pas répondre aux sujets dans ce forum Vous ne pouvez pas éditer vos messages dans ce forum Vous ne pouvez pas supprimer vos messages dans ce forum Vous ne pouvez pas voter dans les sondages de ce forum
|
|