Le projet ANR Textométrie (http://textometrie.ens-lsh.fr) a posé les bases d’une nouvelle plateforme logicielle de développement en mode open-source d’applications d’analyse textométrique (https://sourceforge.net/projects/textometrie). Cette plateforme est compatible avec le standard international de représentation des corpus textuels XML-TEI et intègre des composants de traitement automatique de la langue naturelle. Elle articule le moteur de recherche en texte intégral CWB (http://cwb.sourceforge.net) avec l’environnement de calcul statistique R (http://www.r-project.org).
Deux applications prototypes ont déjà été développées avec cette plateforme. Chacune offre un ensemble propre de fonctionnalités :

  1. une application Windows ou Linux offrant des services de concordances et de calcul de spécificités sur des partitions et des focus exprimés avec l’aide du moteur de recherche
  2. une application web offrant des services de navigation dans une édition numérique multi-facettes et de concordances

Après avoir présenté les enjeux théoriques des nouvelles notions disponibles pour la textométrie, nous ferons une démonstration d’importation d’un corpus encodé en XML-TEI, de son étiquetage avec le logiciel TreeTagger puis de son analyse avec l’application Windows. Cette démonstration sera suivie d’une présentation du prototype de l’application web.