Quelques exemples de recherches de motifs sous Weblex

Exemples d'application sur le corpus " Lemonde "

- Voisinage de formes graphiques

"citoyenneté"[]*"égalité" : " citoyenneté " suivi d'un ou plusieurs mots quelconques, suivi de " égalité ".

" citoyenneté ne se limite pas au respect de droits et devoirs . C’est avant tout un sentiment d’ appartenance à une entité collective. ".

- Neutraliser la casse

"citoyenneté"[]*"égalité"%c : Même chose avec endormissement de la casse.

- Limiter la portée de la recherche à la phrase, au paragraphe si l'encodage le prévoit, à un certain nombre de mots...

"citoyenneté"[]*"égalité"%c Within s : Même chose en fixant comme limite la phrase.

- Recherche du syntagme " espace public " avec endormissement de la casse

"espace""public"%c :

- Recherche des formes graphiques dont la racine est cito.* avec endormissement de la casse.

"cito.*"%c : Donnera :

citoyen(s), citoyennes), citoyenneté(s)...en majuscules ou minuscules.

L'étiquetage du corpus porte sur huit propriétés par occurrences :

La forme graphique

La référence complète

Le lemme…

(Le lemme regroupe sous la forme canonique l'ensemble des formes fléchies d'un mot.).

Voir manuel de Weblex pour les tables des étiquettes.

- Recherche des noms propres :

Dans la fenêtre source A entrer l'expression: [p2="Np.*"]. Quelques erreurs inévitables, en particulier substantifs dont la graphie est en majuscule.

- Rechercher tous les substantifs

Si l'on veut que la recherche porte sur l'ensemble des substantifs, (Nc) sans autre précision, on entrera le motif "Nc.* ", les deux derniers caractères signifiant que NC peut être suivi de 0 à n caractères quelconques.

Le fait de rechercher les substantifs par le biais de la catégorie morpho-syntaxique permet d'obtenir toutes les graphies des termes recherchés, catégorisés comme substantifs par l’étiqueteur.

On notera que des erreurs de catégorisation peuvent intervenir. Ici P2 désigne l'aspect de la forme recherchée. Pour des requêtes simples comme celle ci, on peut omettre de préciser sur quel aspect porte la recherche dans la mesure où l'on spécifie au moteur dans les options générales d'affichage....On ne tapera alors que Nc, sans guillemets ni autres précisions. Par défaut cet affichage est réglé sur " word " c'est-à-dire sur la forme graphique.

[p2="Nc.*"] : (" .* " signifie qu'on ne tient compte ni du genre, ni du nombre).

N de N

[p2="Nc.*"]"de"[p2="Nc.*"]

donnera:

" temps de travail ", " Conditions de pérennisation ", " Possibilités de financement ", " pacte de stabilité ", " devoir de responsabilité ", " politiques de développement ", " projet de développement "...

Un mot quelconque, suivi d'une préposition suivie du lemme "citoyenneté" (Citoyenneté ou citoyennetés)

[]"de"[p3="citoyenneté"]

Donnera:

" droit de citoyenneté ", " internationale de citoyenneté ", " lien de citoyenneté ", " ou de citoyenneté ", " principe de citoyenneté".,.

Deux mots à gauche, suivi d'une préposition puis du lemme citoyenneté :

[][]"de"[p3="citoyenneté"]

" Le principe de citoyenneté ", " culture de citoyenneté ", " existence ou de citoyenneté ", " le lien de citoyenneté ", " réel droit de citoyenneté ", " valeur internationale de citoyenneté "...

Gouvernement, singulier ou pluriel, suivi d'un adjectif :

[p3="gouvernement"] [p2="Af*"]

Exemple de sortie :

"gouvernement français", "gouvernement algérien", "gouvernement actuel", " gouvernement travailliste ", " gouvernement socialiste ", " gouvernements européens ", " gouvernement démocratique ", " gouvernement illégitime ", " gouvernement réel ", " gouvernements nationaux "...

Ainsi:

[p3="citoyenneté"][p2="Af.*"] Lemme de citoyenneté, suivi d'un adjectif donnera:

" citoyenneté britannique ", " citoyenneté écologique ", " citoyenneté active ", " citoyenneté coupée ", " citoyenneté pleine ", " citoyenneté plénière ", " citoyenneté politique ", " citoyennetés multiples "...

3.1. Rechercher les énoncés où la forme canonique " citoyen " est suivie d'un sujet : Lemme " citoyen " suivi d'un mot dont la fonction grammaticale est sujet.

3.2. Expressions de la négation. Rechercher le codage grammatical désignant les compléments de négation. Puis afficher l'ensemble des énoncés comprenant une négation.

Conjonction (Opérateur &). Exemple, recherche des substantifs entrant dans une construction négative, oppositive...

Recherche d'un substantif et d'un trait grammatical " Complément de négation ".

Recherche de l'ensemble des énoncés comprenant les lemmes de " citoyen ", inclus dans une construction négative.

3.3. Disjonction. Recherche des lemmes " citoyen " OU " ville " Ou " quartier ", au sein d'une négation : P3 signifie que la recherche porte sur le lemme, " | " représente la disjonction. P4 signifie que le second terme de la recherche porte sur la codification grammaticale.

3.4. Succession de motifs : Substantif, éventuellement suivi d'un ou plusieurs mots quelconques, suivi d'un verbe :

[p2="Nc.*"][]*[p2="V.* "]

Recherche des verbes associés à " citoyenneté ".

[p3="citoyenneté"][]*[p2="V.*"] (Lemme citoyenneté, suivi d'un ou plusieurs mots quelconques, suivis d'un verbe)

[p3="citoyenneté"][]{l ,5}[p2="V.*"] (Lemme citoyenneté, suivi d'un verbe à au plus 5 occurrences)

[]{1,3}[p3="citoyenneté"][]{l,5}[p2="V.*"]

De 1 à 3 mots quelconques, suivis des différentes flexions de " citoyenneté ", puis de 1 à 5 mots quelconques suivis d'un verbe.

[p3="citoyen" & p7="suj.*"][]{l,6}[p2="V.*"] (Citoyen sujet, suivi d'un verbe, dans la limite de 6 occurrences).

Rechercher toutes les occurrences du lemme citoyenneté, en position de sujet.

Même chose pour le lemme " citoyen " (citoyen, citoyens, citoyenne, citoyennes).

Ce jeu d'étiquettes ne comprend pas de niveau d'indication sur une partie des déictiques spatio-temporelles qu'il pourrait être intéressant d'étudier comme la spatialité " autour de ", " au cœur ", " du côté de " ou les adverbes d'intensité " plus de ". Ceci aurait pu permettre de compléter les analyses par des mesures lexicales.

Cependant dans l'absolu il est possible de projeter n'importe quelle information sur un corpus, il suffit de disposer d'un catégoriseur adéquat ou de créer son propre jeu d'étiquettes.

Détermination de " citoyenneté " :

[p2="D.*"][p3="citoyenneté"] Lemme citoyenneté, précédé d'un déterminant :

" la citoyenneté, une citoyenneté, des citoyennetés, leur citoyenneté, sa citoyenneté, notre citoyenneté, cette citoyenneté, toute citoyenneté... "

[p2="D.*"][p3="citoyenneté"] Détermination, mot quelconque, citoyenneté :

" la vraie citoyenneté, la pleine citoyenneté, la double citoyenneté, une nouvelle citoyenneté... "

Rechercher tes définitions de citoyenneté

- La citoyenneté, c'est...

Rechercher les constructions oppositives

- La citoyenneté n'est pas mais

Rechercher les co-présences. Quel que soit l'ordre d'apparition.

Rechercher les marques de la spatialité. de la temporalité.

Pistes de recherche : Y-a-t-il une détermination particulière des termes recherchés dans une des sous-parties ?

Rechercher les pronoms personnels. première personne du singulier

- Les pronoms personnels de la première personne (singulier ou pluriel).

- Toutes les marques de la première personne.

- Tous les verbes

- Tous les verbes au présent de l'indicatif.

- Tous les verbes au présent de l'indicatif, première personne du pluriel.

Lister toutes les déterminations de citoyenneté et sortir les spécificités par partie (entre les " voix " du corpus, par semestre...).

Rechercher les temps et modes associés aux formes recherchées.

Visualiser toutes les positions syntaxiques de citoyenneté.

Recherche des emplois où le lexique de la citoyenneté est un qualifiant. Plusieurs solutions pour y parvenir. Le catégoriseur utilisé ne reconnaît pas les emplois adjectivaux. D'où le motif suivant :

[p2="Nc.*"][p3="citoyen"] Substantif suivi du lemme " citoyen " [C/citoyen(s), C/citoyenne(s)]

On obtient :

entreprises citoyennes, automobiliste citoyen, buts citoyens, dimension citoyenne, engagement citoyen, entreprise citoyenne, option citoyenne, orientation citoyenne, radio citoyenne, sanction citoyenne, éducation citoyenne...

Dans quels sous-corpus ces emplois sont-ils les plus remarquables ?

Certains énoncés ne sont pas pris en compte. C'est le cas par exemple des syntagmes : " une conscience lucide et citoyenne ", l'Europe sociale, citoyenne et... "...

On tentera alors la requête suivante :

[p2="Nc.*'l[p2='Ypw"|p2="cc"]?[p3="citoyen"] Un substantif, optionnellement suivi (d'une ponctuation OU d'une conjonction de coordination) suivi du lemme " citoyen ".

Les énoncés précédemment cités sont alors pris en compte mais d'autres tournures indésirables sont également recensées.