Textopol >

Les outils

Lexicométriques Cooccurrenceurs Catégoriseurs Collaborations Quels outils...
Derniers liens vers les outils...

Autres liens sur le forum de Textopol autour de la visualisation

Le trameur, (Serge Fleury, André Salem, CLA2T/SYLED )
http://tal.univ-paris3.fr/trameur/

Le Textométre, (Michel Jacobson)
http://michel.jacobson.free.fr/noname/index.html

- COOCS (William Martinez)

Développé par William Martinez, le module coocs permet de mettre en évidence de nombreux phénomènes de cooccurrences: binaires, multiples, squelettes de phrases...
http://williammartinez.fr/coocs/page.php

DTM (Ludovic Lebart)
http://ses.telecom-paristech.fr/lebart/

SATO (François Daoust)
http://www.ling.uqam.ca/ato/sato/

Trideux (Ph. Cibois)
http://cibois.pagesperso-orange.fr/Trideux.html

 

Déposez vos suggestions d'ajouts d'autes outils, vos remarques, vos commentaires sur le forum de Textopol, rubrique OUTILS.

 

Les outils informatisés en linguistique de corpus sont aujourd'hui nombreux et diversifiés. Logiciels statistiques, étiqueteurs, taggeurs, analyseurs sémantiques. Ils peuvent être couplés pour construire des bases de comparaison méthodologiques permettant d'une part la formation des chercheurs, d'autre part la réalisation d'expertises lexicales ou de recherches approfondies, s'appuyant sur les concepts de l'analyse de discours, de la lexicométrie, des approches énonciatives et argumentatives.

Le CEDITEC recourt actuellement à trois types de logiciels, lexicométriques, cooccurrenceurs, étiqueteurs et évaluateurs sémantiques.

 

>>> Autres liens sur le forum de Textopol


Logiciels de type "lexicométrique"

   

Lexico 3

SYLED - CLA2T- Université de la Sorbonne nouvelle - Paris 3



Développé par André Salem, Serge Fleury, Cédric Lamalle, William Martinez, Lexico3 permet de mener des analyses contrastives et chronologiques et offre les fonctionnalités suivantes : Inventaire des segments répétés, concordances, décomptes portant sur les formes graphiques, spécificités par partie, spécificités chronologiques, analyses factorielles portant sur les formes, recherche de groupes de formes, graphiques de ventilation en fréquences absolues, relatives ou histogrammes de spécificités. Topographie textuelle et cooccurrences à partir des spécificités appliquées aux sections.

>> Savoir plus sur Lexico

>> Vers Lexico 3

 


   

Hyperbase

Etienne Brunet UMR "Bases, corpus et langage" (Institut de linguistique française, CNRS) Université de Nice

Conçu par Etienne Brunet, UMR "Bases, corpus et langage" (Institut de linguistique française, CNRS ) Université de Nice. Le logiciel Hyperbase a connu un grand nombre de développements et de versions.

La différence essentielle avec le logiciel Lexico 3 réside dans l’approche beaucoup plus stylistique et littéraire qui fut à l’origine de cet outil. Ainsi, selon les versions Hyperbase est couplé à des lemmatiseurs tels que Cordial, Winbrill ou Treetager et permet ainsi de considérer le texte non plus sur le seul plan de la forme graphique mais du lemme ou de la catégorie morphosyntaxique. Parmi les fonctionnalités principales, nous mentionnerons, les contextes et concordances, recherche documentaire par lemmes, formes graphiques, structure du vocabulaire, connexion lexicale, analyses factorielles et arborées du dictionnaire ou portant sur des listes, spécificités endogènes ou exogènes (Frantext). Environnement thématique, corrélation chronologique, corrélats…

>> Savoir plus sur Hyperbase
>> Vers Hyperbase

 

 

   

ASTARTEX-DIATAG

Jean-Marie VIPREY- Laboratoires ATST (EA 3183) /Laseldi (EA 2281)- Pôle Archive, Bases, Corpus de la Maison des Sciences de l’Homme de Franche-Comté (USR 3124)

Astartex, environnement d’exploration de corpus assisté par la statistique textuelle, conçu par Jean-Marie Viprey. Cette interface offre des fonctionnalités telles que la requête lexicale simple ou multiple en vue de la constitution de concordances et de contextes, le calcul statistique en temps réel sur les spécificités des contextes convoqués et sur la distribution, l’emploi de graphes d’Analyse Factorielle des Correspondances de relevés lexicaux (distribution massive dans les parties du corpus ; distribution fine dans la cooccurrence lexicale), la constitution de dictionnaires de corpus. Tous les résultats et ressources configurant le texte (tableaux, listes, nuages de points, dictionnaires) proposés  par Astartex ont la particularité d’être organisés en hypertexte expert. DiaTag est un environnement d’établissement du texte numérisé (modules de normalisation graphique, d’étiquetage lexical et flexionnel, de balisage), alternant des phases automatiques et des phases ouvertes interactives et conviviales en vue d’un étiquetage fin et contrôlé.

(Notice: V. Lethier, Laseldi, Université de Franche Comté)

 

 

Statistique textuelle et cooccurences

   

Weblex

Weblex  Serge Heiden - ICAR UMR 5181-CNRS / ENS LSH Lyon


Serge Heiden - ICAR UMR 5181-CNRS / ENS LSH Lyon
Outil lexicométrique évolué, accessible en ligne Weblex, offrait les fonctions suivantes. Fonctions documentaires (Concordances, contextes), et statistiques (spécificités, segments répétés, index...).Navigation hypertextuelle, et possibilité d'étudier différentes couches textuelles simultanément pour l'analyse des corpus étiquetés. Calcul des cooccurrences, lexicogrammes simples et récursifs, associés ou non à une forme pôle. Weblex n’est plus maintenu désormais mais l’on retrouvera probablement un grand nombre de ses fonctionnalités dans la plateforme TXM qui est actuellement en cours d développement.


>> Vers Weblex

   

Alceste

Conçu par Marx Reinert. Distribué par Image, Toulouse

Alceste : Conçu par Marx Reinert. Distribué par Image, Toulouse

Alceste (Analyses des Lexèmes Cooccurents des Enoncés Simples d'un TExte).

Conçu par Marx Reinert, commercialisé par la société Image, Alceste repose essentiellement sur l'algorithme de classification descendante. Sa particularité est que l'analyse ne repose plus sur une segmentation pré-établie du texte mais que des catégories sont établies de façon inductive, indépendamment des grandes divisions du corpus. L’analyse Alceste permet de faire émerger, pour un corpus donné, les grandes catégories thématiques qui structurent le texte. Sur le corpus présidentiel par exemple, Alceste identifie 5 classes que nous interprétons comme le rituel, la politique internationale, la politique intérieure, les valeurs. L’utilisation de mots étoilés, posés comme variables nous permet en outre de cernes des tendances : le rituel est plus particulièrement représentatif des énoncés produits par Giscard, la politique internationale est plus particulièrement constitutive des énoncés du général de Gaulle…

>> Plus sur Alceste
>> Vers le site Image

Etiqueteurs, évaluateurs sémantiques

   

Cordial 7& 8 analyseur

Synapse developpement, Toulouse

Cordial est un outil grammaticalisé. Fonctions documentaires (concordances, segments répétés), correction grammaticale et orthographique, dictionnaires, conjugueur, aide à la rédaction, classifications sémantiques, module stylistique.

Mais c'est surtout dans l'outil d'étiquetage morphosyntaxique et lemmatiseur que réside le principal intérêt du logiciel. Cordial peut être couplé à Weblex ou Hyperbase, voire à Lexico.


>> Vers Synapse

   

Tropes

Acetic, Paris

Classifications sémantiques, " univers de référence" correspondant aux grands thèmes du texte analysé. classification automatique des mots du texte, contraction du texte, détection des contextes, séries chronologiques.
Le logiciel offre la possibilité de visualiser les relations entretenues au sein du texte entre les thèmes dominants, sous forme de graphes et de revenir aux contextes d’emplois des mots entrant dans la classe d’équivalence.


>> Vers ACETIC

 

Autres outils

Autres liens sur le forum de Textopol autour de la visualisation

Le trameur, (Serge Fleury, André Salem, CLA2T/SYLED )
http://tal.univ-paris3.fr/trameur/

Le Textométre, (Michel Jacobson)
http://michel.jacobson.free.fr/noname/index.html

- COOCS (William Martinez)

Développé par William Martinez, le module coocs permet de mettre en évidence de nombreux phénomènes de cooccurrences: binaires, multiples, squelettes de phrases...
http://williammartinez.fr/coocs/page.php

- TreeCloud (Philippe Gambette)

TreeCloud est un ensemble de scripts Python qui relève les cooccurrences entre les mots les plus fréquents d'un texte, calcule une matrice de distance sémantique à partir de ces cooccurrences (de nombreuses formules sont implémentées), construit un arbre pour refléter cette matrice et le colore pour une meilleure visualisation des mots. Des fonctions de calcul de la stabilité de l'arbre obtenu sont également implémentées.

http://www.treecloud.fr

En savoir plus:

http://www.lirmm.fr/~gambette/2009GambetteVeronis.pdf

DTM (Ludovic Lebart)
http://ses.telecom-paristech.fr/lebart/

SATO (François Daoust)
http://www.ling.uqam.ca/ato/sato/

Trideux (Ph. Cibois)
http://cibois.pagesperso-orange.fr/Trideux.html

Suggérer d'autres liens vers des outils : forum de Textopol, rubrique OUTILS.

.

Quels outils, pour quoi faire ?

Les outils sont le résultat d'un projet initial, d'une certaine conception méthodologique, mais aussi des utilisations qu'en font les expérimentateurs. La présente rubrique fait un premier bilan de la question à travers:

  • Quelques applications et expériences menées au moyen de différents outils

  • Un tableau récapitulatif

Outils en cours de développement, tests, collaborations

 

   

edxml

 Calin-Ioan MOSUT
Université de la Sorbonne nouvelle - Paris 3 ENS Lyon

>> Manuel edxml
>> Module edxml

   

Le Métromètre

Valérie Beaudouin, François Yvon

Le métromètre est un outil d'analyse du vers classique, développé et mis au point par Valérie Beaudouin et François Yvon. Il produit une annotation ou étiquetage des données en transcrivant le vers dans l'alphabet phonétique et en le découpant selon les positions ou syllabes rythmiques.

>> En savoir plus :

- Beaudouin V. (1998). "Rythme et univers lexicaux chez Corneille et Racine". (JADT 98 )

- Beaudouin V. (2000). Rythme et rime de l'alexandrin classique, étude empirique des 80 000 vers du théatre de Corneille et Racine. (Revue Texto .)

- Beaudouin V. & Yvon F. (1996). "The Metrometer : a Tool for Analysing French Verse", Literary & Linguistic Computing, vol. 11, n°1, p. 23-32.

- Beaudouin V. (2002). Mètre et rythmes du vers classique. Corneille et Racine. Paris, Champion, coll. Lettres numériques.