TEXTOPOL Index du Forum TEXTOPOL
Ressources informatisées pour l'analyse du discours politique
 
 FAQFAQ   RechercherRechercher   Liste des MembresListe des Membres   Groupes d'utilisateursGroupes d'utilisateurs   S'enregistrerS'enregistrer 
 ProfilProfil   Se connecter pour vérifier ses messages privésSe connecter pour vérifier ses messages privés   ConnexionConnexion 

Séances 1 et 2 Analyses informatisées du discours politique

 
Poster un nouveau sujet   Répondre au sujet    TEXTOPOL Index du Forum -> Communication politique
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
jml
Site Admin


Inscrit le: 11 Jan 2007
Messages: 152

MessagePosté le: Lun Oct 12, 2009 8:47 pm    Sujet du message: Séances 1 et 2 Analyses informatisées du discours politique Répondre en citant

Lien vers Weblex:

http://weblex.ens-lsh.fr/wlx/


Notions abordées lors des deux premières séances:

INTRODUCTION

1. Linguistique de corpus et techniques d’enquête, approches et méthodes

- La notion de corpus, quelques exemples en sciences sociales
- Constitution du corpus, recueil des données, les hypothèses de recherche, les contraintes…
- Des préoccupations différentes

2. L’approche quantitative des données textuelles

- Les dénominations (lexicométrie textométrie, statistique lexicale, statistique textuelle…)
- Les origines, les postulats méthodologiques, les outils logiciels, les progrès techniques…
- Compter les mots, une pratique courante ?
- Quels faits quantifier?
- Les unités de décompte : Mot, lemme, catégories, ngrammes, racines, forme graphique, segments cooccurrences…
- Les domaines d’application et les approches (Littérature, discours politique, médias mais aussi marketing ou autres domaines des sciences sociales)
- Les différents types de logiciels utilisés dans ces domaines
- Les outils textométriques, les catégoriseurs, les cooccurrenceurs, les outils travaillant sur des ontologies sémantiques.
Distincition entre les outils contrastifs travaillant sur la base d’une comparaison et les outils aptes à fournir des structures textuelles.


Quelques lois statistiques du vocabulaire

- Hapax, fréquences, richesse, accroissement, diversité, originalité du vocabulaire…
- formes, occurrences,

3. Les procédures d’analyse lexicométrique et textométriques

A/ Démarche lexicométrique «classique » :

- Réorganisation de la séquence textuelle
- Segmentation en unités minimales
- Index, dictionnaire hiérarchique
- Tableau lexical, partitions
- Analyses contrastives
- Norme endogène le plus fréquemment
- Norme exogène possible pour Hyperbase (comparaison avec le TLF pour le français), quelle utilité, quelle interprétation, dans quels cas de figure…

B/ Les fonctions documentaires

- Concordances
- Contextes
- Segments répétés

C/ Les Fonctions statistiques

- Contrastives (Spécificités par partie)
- Chronologiques
- Fréquences relatives
- Multidimensionnelles (proximités des parties du corpus)
Analyse Factorielle des Correspondances
Classifications hiérarchiques


3. Les fonctions de base et les outils logiciels quelques exemples

A/ Analyses contrastives et chronologiques

- Spécificités par partie (Weblex, Lexico, Hyperbase)
- Spécificités chronologiques (Lexico)
- Corrélation chronologique (Hyperbase)
- Les courbes de fréquences relatives

B/ Analyses typologiques

Classification automatique Analyse factorielle


4. Un outil d’analyse statistique des données textuelles : Weblex

- concordances et contextes
- rechercher des co-fréquences
- groupes, motifs, extraction « d’empan textuels » (travail en surface)
- spécificités (d’une forme, de plusieurs formes cumulées, d’un ensemble d’énoncés…)
- la notion de cooccurrence et de lexicogramme, simple ou récursif

Rappel sur les unités minimales (forme graphique, n-grammes, catégories morphosyntaxiques ou sémantiques, ontologies)

- Quelques exemples de logiciels et d'applications (Cordial et Treetagger, Tropes, Alceste, Weblex)

- Présentation de Weblex autour de ces problématiques

- Application sur un corpus catégorisé - Recherche de motifs textuels en surface (forme graphique) ou sur les catégories.
Document distribué

Exemplier: jeu d'étiquettes utilisé pour le corpus voeux2

Pour aller plus loin sur les catégories morphosyntaxiques:

- quelques applications


------------------------------
Pour aller plus loin…

Technologies du Langage (Blog de Jean Véronis)
http://aixtal.blogspot.com/

Psychologie politique et analyse du discours assistée par Ordinateur (Pascal Marchand)
http://pascal-marchand.fr/

Approches textométriques de la campagne présidentielle américaine de 2008
http://www.scharloth.com/cgi-bin/poltracker/poltracker.pl

Blog de Textopol sur les voeux présidentiels et sur le rituel
http://textopol.free.fr/dotclear/

Bibliographie analyses statistiques du discours politique

http://textopol.free.fr/Documents/Bibliographie/R%E9f%E9rences%20bibliographiques.htm

Quelques liens utiles:

http://jadt.org/

http://corpus.revues.org/

http://www.cavi.univ-paris3.fr/lexicometrica/


Le blog de Textopol pour quelques exemples d'application

http://textopol.free.fr/dotclear/

Logiciel Lexico 3

http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/


- Catégoriseurs morphosyntaxiques

TreeTagger

Cordial


- Ontologies sémantiques

Wordnet1

wordnet2

Tropes

Quelques exemples de sorties sous Cordial

- Statistiques sur le texte

- Extrait catégorisé

Suggérez vos propres liens….
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé Envoyer un e-mail
Montrer les messages depuis:   
Poster un nouveau sujet   Répondre au sujet    TEXTOPOL Index du Forum -> Communication politique Toutes les heures sont au format GMT + 1 Heure
Page 1 sur 1

 
Sauter vers:  
Vous ne pouvez pas poster de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous ne pouvez pas voter dans les sondages de ce forum


Powered by phpBB © 2001, 2005 phpBB Group
Traduction par : phpBB-fr.com