|
TEXTOPOL Ressources informatisées pour l'analyse du discours politique
|
Voir le sujet précédent :: Voir le sujet suivant |
Auteur |
Message |
jml Site Admin
Inscrit le: 11 Jan 2007 Messages: 152
|
Posté le: Ven Fév 01, 2008 12:55 pm Sujet du message: Séance 4 - 1 heure - 4 février 2008 |
|
|
Approches statistiques des données textuelles
rappels et approfondissements
- Concordances et contextes
- forme, occurrence (N, V), propriétés quantitatives des corpus
- unité minimale : mots composés, locutions…
- Lemmatisation, racinisation, catégorisation, approches avec ou sans dictionnaire
- segments répétés
- Co-fréquences et cooccurrences
- Tableau lexical et tableaux de données
- partition
- normes endogène ou exogène
- Analyse factorielle des correspondances :
- portant sur le tableau lexical, sur des effectifs (lexico 3)
- sur des données pondérées (Hyperbase et l’AFC du dictionnaire)
- sur des formes graphiques, lemmatisées, des catégories, syntaxiques, sémantiques, thématiques…
- sur des distances…
- Exemple de l’AFC en sciences sociales et des tableaux à double entrée autres que lexicaux (les interprétations, les précautions quant aux corrélations qui n’en sont pas…)
- Spécificités et ventilations dans les parties d’un corpus, fréquence absolue ou relative… |
|
Revenir en haut de page |
|
|
|
|
Vous ne pouvez pas poster de nouveaux sujets dans ce forum Vous ne pouvez pas répondre aux sujets dans ce forum Vous ne pouvez pas éditer vos messages dans ce forum Vous ne pouvez pas supprimer vos messages dans ce forum Vous ne pouvez pas voter dans les sondages de ce forum
|
|