L'analyse factorielle présentée ci-dessous montre une proximité lexicale entre les trois derniers présidents de la République, Hollande, Sarkozy, Chirac.

On note une marginalisation relative du lexique du général de Gaulle qui se démarque de l'ensemble du corpus.

Toute la difficulté réside dans l'interprétation de ces proximités qui peuvent s'expliquer par la dimension chronologique ou l'événementiel. (Evolution progressive et renouvellement du lexique avec le temps ou incidence de l'actualité sur le discours). Ces proximités peuvent aussi s'expliquer par une même tendance à minimiser le rituel des voeux (surtout chez Sarkozy et Hollande) ou dans les phénomènes liées à l'énonciation. La part de plus en plus faible accordée au rituel ne peut expliquer à elle seule cette configuration. En effet, De Gaulle est celui chez qui l'expression des voeux occupe la part la plus faible.

L'étude des spécificités lexicales permet d'expliquer en partie la configuration obtenue.

Analyse factorielle des correspondances du corpus voeux partition locuteurs (TextObserver)

Valeur propres des axes factoriels

L'analyse factorielle - Grille de lecture

L'analyse factorielle de correspondances est destinée à extraire les faits saillants du tableau lexical en produisant une représentation graphique des profils lignes et colonnes de ce tableau. L’analyse factorielle a pour finalité de représenter avec le moins de déformations possible les tendances globales contenues dans un tableau à double entrée. Ici, l’analyse factorielle fournit les tendances lourdes en termes d’emplois du stock lexical. Quelles sont les parties (locuteurs, textes, années) qui se ressemblent du point de vue du lexique, quelles sont celles qui s’opposent…

La particularité de l’AFC, difficile à concevoir, est qu’elle comporte autant d’axes que de partitions. L’AFC procède par approximations successives : le premier axe comporte une part importante de l’information, le second un peu moins, le troisième moins encore… La somme des axes représente 100%, soit la totalité de l’information. On examinera donc en premier lieu les deux premiers axes (axe 1 horizontal et axe 2 vertical) qui fournissent à deux pratiquement toute l’information. En observant ce plan factoriel nous examinons les proximités du lexique mobilisé au sein des 7 parties constituant le corpus vœux, (de toutes les formes, mots outils, prépositions, compris, à partir de la fréquence 5, seuil que nous avons fixé ici. )

Comparaison des 54 messages de voeux de la cinquième République (AFC partition années)

Le logiciel TextObserver utilisé ici propose trois modes de visualisation de l'analyse factorilelle des correspondances.

Le premier mode permet de représenter simultanément les trois premiers axes de l'analyse factorielle. Cette représentation en trois dimensions a son utilité lorsque le corpus comprend un grand nombre de parties. Elle peut en revanche occulter certains phénomènes statistiques et doit donc être utilisée en complément d'une représentation en deux dimensions.
Le second mode de représentation, permet de saisir à la fois le grandes oppositions du corpus en termes d'emploi du stock lexical, la taille des parties considérées et la fréquence des formes lexicales que l'on peut choisir de représenter.
Le troisième mode de représentation, plus classique, à deux dimensions se lit comme une analyse factorielle "traditionnelle".
Pour ces trois représentations il est possible d'afficher les mots les plus fortement contributifs de la représentation factorielle, de faire vairer les seuils, d'ajouter ou de supprimer des mots ou des groupes de mots et de visualiser les différents résultats en implémentant le mouvement.

L'analyse factorielle portant sur les textes (partition année) montre une relative dispersion des années VGE/Pompidou, que l'ajout des nouveaux messages depuis 2000 n'a jamais lissée.
Les zones correspondant à DG, Mitterrand, Chirac restent identifiables et montrent des ruptures correspondant à la succession des locuteurs.
Les années 2007-2011 (N. Sarkozy) semblent se caractériser par une évolution constante sur la période, comme si l'avant dernier président de la République faisait évoluer ses discours au gré des événements. Voir analyse du dernier message de N. Sarkozy

Le discours de Hollande de 2012 est plus proche des années Sarkozy (2009-2008) que des années Chirac.
On peut avancer l'hypothèse que les deux discours se rapprochent par la faible importance accordée aux vœux, par des profils énonciatifs relativement proches et par des phénomènes liés à l'événementiel.

Il convient cependant de prendre quelques précautions: sur une partition aussi fine l'analyse factorielle est assez instable: sur cette même partition, l'analyse factorielle portant sur la casse originale ou sur la casse minuscule produit des résultats très proches mais présentant cependant quelques variations.
L'analyse arborée de la connexion lexicale permet de vérifier cette première configuration.

Analyse arborée de la connexion du vocabulaire

Le calcul de distance porte ici sur la présence-absence des mots utilisés. (Logiciel utilisé : Hyperbase). La configuration qui en résulte est donc nécessairement plus tranchée que ce qui résulterait d'un calcul qui tiendrait compte des fréquences.
Le calcul "stabilise" la dispersion des années VGE/Pompidou à l'exception de l'année 1971 (Pompidou) qui se trouve dans le "bouquet" de textes de VGE.
La particularité des années 1959-1968 (De Gaulle) est confirmée : la distance à parcourir entre les textes du général de Gaulle et les autres parties du corpus est relativement importante.
Par ailleurs tous les textes sont groupés en une même zone, confirmant ainsi la stabilité des messages de vœux du premier président de la cinquième République.
Le discours de 1968 présente éventuellement une légère particularité.
L'ensemble des voeux de François Mitterrand est groupé sur la partie supérieure de la représentation.
Le calcul de distance souligne une particularité du premier message de Nicolas Sarkozy (2007).
Le message de François Hollande (2012) se trouve à proximité des années Sarkozy (2008-2009-2010-2011) et de Chirac (dans une moindre mesure : 2002-2003-2004-2005-2006).
Les voeux de Jacques Chirac sont caractérisés par une démarcation entre trois périodes:
  • - 1995-1996
  • - 1997-2001
  • - 2002-2006
Ce que confirme l'analyse arborée:
  • - Proximité relative Hollande-Sarkozy-Chirac
  • - Démarcation nette entre les locuteurs
  • - Dimension Chronologique:
Le centre topologique de l'arbre oppose les 4 premiers présidents de la République aux trois derniers.
La distance avec les voeux de Hollande est de plus en plus faible à mesure que l'on avance dans la chronologie. (Le chemin à parcourir entre DG 1959 et Hollande 2012 est bien plus importante que la distance Pompidou Hollande qui est plus longue que la distance VGE Hollande. La distance Mitterrand Hollande est plus courte... En revanche la distance 2007-2012 est plus importante que la distance 2002-2012 ou 1995-2012.

Ce qui n'apparaissait pas aussi nettement:
- Les trois périodes chiraquiennes;

A noter:

Les calculs de distance et les analyses factorielles constituent des pistes qu'il convient d'explorer et de vérifier.
Seul le retour au texte est garant d'une interprétation fiable.
Ce calcul ne tenant compte que de la présence absence neutralise les effets de sur représentation des formes liées à l'énonciation, dont on a vu par ailleurs qu'ils pesaient lourdement dans les contrastes observés au moyen des analyses factorielles portant sur les effectifs absolus.

Grille de lecture:

La connexion des vocabulaires - ou distance sur V - consiste à évaluer la distance entre des textes pris deux à deux en considérant la présence ou l’absence des vocables dans chacun de ces textes, sans se préoccuper de leur fréquence. Ce calcul est fondé sur l’indice de Jacquart.
Un mot contribuera à rapprocher deux textes s’il est commun aux deux et à les éloigner s’il est privatif et n’apparaît que dans un seul.
Ce mode de représentation consiste à matérialiser sur un plan la distance d’un texte à tous les autres et des textes deux à deux en traduisant directement cette distance par la longueur des segments qui mène de l’un à l’autre des textes, soit d’une feuille terminale de l’arbre à une autre.
La distance parcourue entre les différents points du graphique retranscrit donc fidèlement les distances produites par les calculs précédemment présentés. On se gardera cependant d’évaluer cette distance à vol d’oiseau mais bien de la mesurer en rendant compte du chemin parcouru.
Le niveau et la forme des embranchements sont également significatifs. Ainsi, des branches resserrées ou largement déployées donneront lieu à des interprétations différentes.