A. Observations initiales à partir du logiciel HYPERBASE

 

 

On peut décrire d'abord les caractéristiques statistiques du corpus BK6 à l'aide du menu structure

 

1. Le Bouton structure donne l'étendue du vocabulaire particulier à chaque partie et du vocabulaire partagé entre elles

 

1.1. Le Bouton étendue  donne la longueur des 6 parties et l'étendue de leur vocabulaire; représentables par un histogramme

 

1.2. Le Bouton Hapax et richesse : donne une évaluation de la richesse et des mots rares; représentables par un histogramme

 

1.3.  Le Bouton Hautes fréquences  donne les 200 mots les plus fréquents du corpus global. On peut chercher les mots les plus fréquents de chaque partie et commenter la répartition des noms, des verbes, des mots grammaticaux. On peut alors étudier la répartition de certains mots qui paraissent intéressant, en allant dans le menu Mots et contexte

 

1.4  Le Bouton distance  permet de représenter par une AFC ou par arborexcence la proximité des différentes parties

 

2. Le Bouton Spécificités permet alors d'examiner les listes des mots les plus caractéristiques de chaque partie du corpus, de les commenter ou de les analyser à l'aide des bouton mots et concordance ou contexte

 

3. Le Bouton Liste  permet de constituer des listes, ou ensemble de formes, intéressantes ( les pronoms, les verbes modaux, les mots les plus fréquents, les termes désignant le terrorrisme, la guerre, la sécurité, la religion, la famille etc) et d'établir des AFC pour ces listes, ou d'en analyser la répartition par histogramme.

 

On peut ensuite systématiser et approfondir les descriptions dans les cadres suivants.

 

 

 

B. Distributions statistiques (Tableau Lexical Entier)

 

 

1. Propriétés zipféennes du TLC

            Les paramètres initiaux

            Le rapport rang-fréquence

            La richesse lexicale

            Les hapax

            Les THF

 

 

2. Sur le vocabulaire

            Voc partagé

            Voc original

            Voc spécifique

 

 

3. Proximités intertextuelles

 

            AFC

            CHA

 

 

 

 

C. Distributions linguistiques (Tableaux Lexicaux Réduits)

 

 

1. Catégories énonciatives

 

Pronoms et déterminants du discours

 

Modalités : assertives, interrogatives, exclamatives, jussives

 

Négations

 

Les auxiliaires modaux : Vouloir, pouvoir, devoir, falloir, avoir à

 

 

 

2. Catégories grammaticales

 

Noms et verbes

 

Adjectif et adverbe

 

 

 

3. Approches lexico-thématiques