WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Approche exploratoire de la relation de conséquence : description et implémentation

( Télécharger le fichier original )
par Sébastien Druon
Université Toulouse 2 - DEA de Sciences du Langage 2001
  

Disponible en mode multipage

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

UNIVERSITE

DE TOULOUSE

LE

IRAIL

Approche exploratoire de

la relation de

conséquence: description

et implémentation

Sébastien Druon

Mémoire de DEA de Sciences du Langage
sous la direction de Mme Péry-Woodley
Université Toulouse 2 -- Le Mirail

Remerciements

Je remercie Marie-Paule Péry-Woodley pour avoir accepté de diriger ce travail ainsi que pour le suivi qu'elle m'a accordé tout au long de l'année et sa constante amabilité.

Je tiens également à remercier Joan Busquets pour la relecture de certaines parties et pour ses encouragements.

Enfin, je remercie aussi mes deux relecteurs qui ont consacré une partie de leur temps aux dernières corrections de ce mémoire: mon père et Céline Raynal.

Table des matières

Table des figures v

Liste des tableaux vi

Liste des algorithmes vii

Liste des définitions viii

Notations i

Introduction

1 Cadre global et méthodologie

1.1 LaRST

1.1.1 Les segments de discours

1.1.2 Les relations rhétoriques

1.1.3 Lanucléarité

1.1.4 Représentation graphique de la structure rhétorique

1.2 Vers un analyseur rhétorique

1.2.1 L'approche pattern-matching

1.2.2 L'approche morpho-syntaxique

1.2.3 L'intégration de l'interface sémantique-pragmatique

1.2.4 Applications: compréhension automatique de textes

et résumé automatique

1.3 L'analyse de corpus

1.3.1 Une approche exploratoire

1.3.2 Corpus utilisés

1.3.3 Méthodologie

2 Préalables théoriques

2.1 La conséquence

2.1.1 Conséquence logique, effet, résultat

2.1.2 Spécification de la notion de conséquence

2.2 La relation de conséquence

2.2.1 Qu'est-ce qu'une relation de conséquence?

2.2.2 Verbes et relation de conséquence

2.2.3 Relations apparentées à la conséquence

2.2.4 Ordre des segments de la relation de conséquence .

2.2.5 Vers une définition de la relation de conséquence. .

2.3 Conséquence et inférence

2.3.1 Pouvoir

2.3.2 Devoir

2.3.3 Devoir et pouvoir au conditionnel

2.3.4 Implications sur la relation de conséquence

2.4 Comment repérer un lien causal en discours

2.4.1 Les connaissances de sens commun

2.4.2 La propension à l'interprétation causale

2.4.3 Vers une autre stratégie

2.5 La classe aspectuelle

2.5.1 La taxinomie des éventualités de Vendler

2.5.2 État vs. événement

2.6 Le type deverbe

2.6.1 Les verbes relateurs

2.6.2 Les verbes factitifs et permissifs

2.6.3 Les verbes précisant l'effet produit

2.7 Conclusion

3 Les marqueurs spécifiques de la relation de conséquence: les connecteurs

3.1 Les connecteurs comme marque spécifique de la conséquence

3.2 Donc

3.3 Alors

3.3.1 Fonction phrastique

3.3.2 Alors que adversatif

3.3.3 Alors dans les conditionnelles

3.3.4 Alors temporel vs. alors consécutif

3.3.5 Conditions interdisant l'interprétation consécutive de

alors

3.4 Ainsi

3.4.1 Ainsique

3.4.2 Ainsi et les locutions apparentées

3.4.3 Conditions pour l'interprétation consécutive de ainsi

3.5 Aussi

3.5.1 Fonction phrastique

3.5.2 Fonction discursive

3.5.3 Conditions pour l'interprétation consécutive de aussi

3.6 Marques spécialisées

3.6.1 Conséquence pure: par conséquent

3.6.2 Connecteurs anaphoriques univoques

3.6.3 Reprise anaphorique de la raison

3.6.4 Récapitulation

3.7 Conclusion

4 Autres moyens de signaler une relation de conséquence

4.1 Les connecteurs ne suffisent pas à déterminer la structure

rhétorique d'un texte

4.2 Participe présent

4.2.1 Le gérondif

4.2.2 Incise et déterminative

4.2.3 Participe présent, cause et conséquence

4.2.4 Participe présent suivi d'un connecteur

4.2.5 Conditions d'emploi du participe présent dans une

construction consécutive

4.3 Anaphore propositionnelle et conséquence

4.3.1 Les pronoms anaphoriques ceci et cela et l'anaphore propositionnelle
4.3.2 Propositions introduites par ceci et cela: élaboration

vs. conséquence

4.3.3 Récapitulation

4.4 La relative

4.4.1 Qui

4.4.2 Ce qui

4.5 Syllogisme

4.6 La juxtaposition et la coordination

4.7 Verbes modaux

4.8 Bilan

5 Implémentation

5.1 Les paramètres à prendre en compte pour l'analyse de la

relation de conséquence

5.1.1 En présence d'un connecteur

5.1.2 En l'absence d'un connecteur

5.1.3 Avec l'un ou l'autre

5.1.4 Récapitulation

5.2 Préalables à l'analyse automatique de la relation de conséquence: étiquetage morpho-syntaxique et lemmatisation . .

5.2.1 Nécessité d'un étiquetage morpho-syntaxique

5.2.2 Choix du système d'étiquetage

5.3 Choix du langage de programmation: PERL

5.4 Présentation du système

5.4.1 Repérage d'une proposition complète

5.4.2 Traitement des connecteurs

5.4.3 Traitement des autres indices

5.4.4 Présence d'un type de verbe particulier

5.5 Utilisation

5.5.1 En ligne de commande

5.5.2 Par navigateur

5.6 Problèmes à résoudre et fonctions à implémenter

5.6.1 Éléments à implémenter

5.6.2 Problèmes d'implémentation à résoudre

5.7 Comparaison de l'analyse quantitative manuelle et de l'ana-

lyse quantitative donnée par l'illustrateur

5.8 Conclusions

Conclusion

Bibliographie

A Code source de l'illustrateur

Table des figures

1.1 Représentation graphique d'une relation rhétorique

1.2 Analyse quantitative du corpus Howto-Linux-Text-Terminal

1.3 Méthodologie

2.1 Représentation graphique de la relation de conséquence . .
2.2 Taxinomie des éventualités d'après VENDLER (1967)

5.1 Exemple de sortie de l'illustrateur

5.2 Comparaison analyse manuelle / analyse de l'illustrateur.

Liste des tableaux

1 Les conventions utilisées i

2.1 Relations proches de la relation de conséquence chez MANN

etTHOMPSON (1987)

2.2 Comparatif des relations apparentées à la conséquence . .

3.1 Donc

3.2 Alors

3.3 Ainsi

3.4 Aussi

3.5 Les connecteurs univoques

4.1 Participe présent

4.2 Anaphore propositionnelle

4.3 Relative

4.4 Syllogisme

5.1 Contraintes utilisées

5.2 Fonctions de base de l'illustrateur

Liste des algorithmes

1 Algorithmes de repérage d'une proposition à droite ou à gauche

de l'indice

2 Donc

3 Alors

4 Ainsi

5 Aussi

6 Connecteurs à placement libre

7 Connecteurs à placement fixe

8 Participe présent

9 Cequi

10 Cequi

11 Syllogisme

12 Verbe efficient

Liste des définitions

2.1 Effet

2.2 Conséquence logique

2.3 Résultat

2.4 Conséquence

2.5 Relation de conséquence (provisoire)

2.6 Relation de conséquence

2.7 Inférence

2.8 Causation (lien causal ou de causalité)

2.9 État

2.10 Processus

2.11Activité

2.12 Événement

2.13 Accomplissement

2.14 Achèvement

2.15 Éventualité

2.16État(2)

2.17 Événement (2)

3.1 Connecteur

Notations

Nous reprenons ici les symboles que nous utiliserons dans les tableaux:

symbole signification

segment de discours de droite de la relation
segment de discours de droite de la relation

+ permis

++ obligatoire

- interdit

Place de l'indice dans une proposition: S V C

- début de proposition ( );

- entre le sujet et le verbe (

- immédiatement après le verbe ( );

- fin de proposition ( ).

;

TAB. 1 - Les conventions utilisées

Introduction

Le rapport de cause à conséquence peut revêtir dans la langue des formes multiples. Pourtant, si l'on s'en tient à la grammaire traditionnelle, on ne rattache à l'expression d'un rapport de cause à effet que des conjonctions ou des adverbes. Or nous sommes parti du constat que la grammaire traditionnelle, ainsi qu'une grande partie de la littérature linguistique moderne traitant de la question ne s'en tenait qu'à ces éléments lexicaux. Peu de travaux ont eu pour but de mettre à jour les autres moyens qui existent en français pour exprimer cette relation de conséquence.

Les marques classiques de la conséquence doivent être complétées par des indices plus subtils et complexes afin d'aboutir à une description plus exhaustive de la relation. Nous proposons donc une approche exploratoire de la relation de conséquence basée sur l'analyse de corpus: nous repérons dans un corpus composé de textes scientifiques et de manuels informatiques toutes les relations de conséquence que nous rencontrons, sans a priori sur la façon (lexicale ou autre) de les exprimer. Avec cette approche, notre objectif est de caractériser de façon aussi précise que possible la relation de conséquence.

Cette approche exploratoire nous amène donc à considérer plusieurs indices comme pertinents à son étude:

- les marques spécifiques à l'expression de la conséquence que sont

Introduction

 

les connecteurs consécutifs (donc, alors, par conséquent, si bien que), ces marques ayant fait l'objet dans la littérature d'un certain nombre d'études;

- les constructions pouvant parfois participer à l'expression de la conséquence comme certaines constructions participiales (avec un participe présent), certaines relatives (les relatives continuatives) ou encore certaines constructions anaphoriques (anaphores propositionnelles). Dans ce cas il convient de déterminer les conditions particulières qui nous font interpréter la relation comme relation de conséquence (des restrictions sur ses arguments);

- les moyens favorisant l'interprétation consécutive en l'absence de ces indices (et qui peuvent aussi être utilisés en leur présence) : les éléments lexicaux exprimant une modalité ou le type du verbe (à savoir s'il s'agit par exemple d'un verbe efficient).

Nous essaierons donc d'obtenir un panorama le plus riche possible des moyens d'expression de la relation de conséquence en français en étudiant ses arguments de près.

Cette analyse s'est faite en deux étapes:

- premièrement, analyser la façon dont la relation de conséquence est exprimée dans le corpus, afin de rassembler les indices qui ont privilégié l'interprétation conséquentielle;

- deuxièmement, valider ces indices par une recherche automatique et recenser les cas où l'interprétation conséquentielle est impossible en présence de ces indices. La répétition de cette étape nous permet d'affiner ces indices.

À l'aide de ces résultats, nous pouvons circonscrire les différentes contraintes, qu'elles soient positionnelles, syntaxiques ou encore sémantiques sur la relation de conséquence et ainsi contribuer à l'analyse de la

Introduction

 

structure des textes en étudiant un des liens logiques qui font leur cohérence. Ces résultats nous permettront également de construire un programme informatique permettant de détecter automatiquement la présence de relations de conséquence dans un texte.

Notre mémoire se divise en cinq chapitres.

Dans le premier chapitre, nous aborderons le cadre global dans lequel se situe notre travail; nous présenterons donc la théorie dans le cadre de laquelle il s'inscrit: la RST, puis la méthodologie que nous avons adoptée afin de faire notre étude.

Dans un deuxième chapitre, nous ferons le point sur les préalables théoriques indispensables à notre étude.

Le troisième chapitre sera consacré aux marques lexicales spécifiques

à l'expression de la relation conséquence: connecteurs consécutifs.

Nous nous attarderons dans le quatrième chapitre sur les indices autres que les connecteurs qui nous permettent l'interprétation consécutive d'une relation rhétorique.

Nous récapitulerons dans le cinquième et dernier chapitre les différents paramètres à prendre en compte pour l'analyse de la relation de conséquence. Puis nous présenterons l'illustrateur que nous avons implémenté en utilisant les paramètres recueillis dans les chapitres précédents et qui permet d'extraire automatiquement les relations de conséquence d'un texte.

Chapitre 1

Cadre global et méthodologie

Comme nous l'avons évoqué dans l'introduction, nous voyons la relation de conséquence comme un lien «logique» qui structure le discours. Or il existe une théorie rencontrant un certain succès dans le domaine de l'analyse du discours, la RST (Rhetorical Structure Theory), qui permet de donner une représentation d'un texte en tenant compte de ces liens logiques. C'est donc dans le cadre de la RST que se situera notre étude.

Dans ce chapitre, après avoir brièvement présenté la RST dans ses grandes lignes, nous exposerons nos objectifs et la méthodologie que nous avons mise en place afin d'étudier la relation de conséquence.

1.1 LaRST1

Nous allons dans cette section faire une brève présentation de la RST et montrer en quoi l'étude de la relation de conséquence s'inscrit dans une perspective plus globale de description de la structure d'un texte dans ce cadre.

Dans leur article fondateur (MANN et THOMPSON (1987)), Mann et Thompson posent les bases d'une théorie du discours: la RST ou Rhetorical Structure Theory (théorie de la structure rhétorique).

'Pour une présentation plus complète de la RST, voir DRUON (2000) (en français), ou l'article fondateur de la théorie MANN et THOMPSON (1987) (en anglais).

1. Cadre global et méthodologie

 

Cette théorie permet de décrire de façon simple et intuitive la structure d'un texte narratif (non-dialogique). En effet, cette théorie peu formalisée permet de représenter la structure d'un texte de façon arborescente et récursive.

1.1.1 Les segments de discours

Une des idées de base de la RST est qu'un texte est composé de segments de discours2, qui sont « des intervalles linéaires de texte ininterrompu ». Un segment de discours n'a donc pas de taille prédéfinie et il peut être composé d'un ensemble de paragraphes (c'est à ce moment-là un segment complexe) aussi bien que d'une proposition grammaticale (la proposition est généralement un segment minimal). Un des principes de la RST est qu'elle permet la récursivité, c'est-à-dire qu'un segment de discours peut être décomposé en segments de discours plus petits, et ce jusqu'à l'obtention de segments de discours élémentaires (généralement de l'ordre de la proposition3).

La RST permet aussi bien une analyse descendante, partant du discours dans son entier et le décomposant en segments plus petits jusqu'à obtention de segments minimaux qu'une analyse ascendante, partant des segments minimaux, les rassemblant en segments plus gros et ainsi de suite jusqu'à n'obtenir qu'un seul segment, le discours.

Nous adopterons l'approche ascendante qui est la seule réalisable par un système informatique basé sur la surface.

2Mann et Thompson emploient le terme text spart.

3Nous considérerons pour l'instant la proposition comme segment minimal, bien qu'on puisse considérer comme segments de discours des unités plus petites, mais ce n'est pas le cas pour l'expression de la conséquence.

1. Cadre global et méthodologie

 

1.1.2 Les relations rhétoriques

La RST est fondée sur une notion clé selon laquelle on a une relation rhétorique qui unit deux ou plusieurs segments de discours. Une relation rhétorique est une relation étiquetée4 qui relie en général deux segments de discours entre eux5, et qui détermine les relations sémantiques et pragmatiques qu'ils entretiennent. L'exemple suivant nous montre une relation de cause:

(1 .2) Vous devez taper beaucoup moins de caractères à l'invite car l'in-

terpréteur de commandes bash tape à votre place autant que possible.

Un fait important est qu'une relation rhétorique est susceptible de pouvoir relier entre eux aussi bien de très grands segments de discours (comme des paragraphes) que des segments minimaux. De plus, une des propriétés de la RST étant la récursivité, un segment de discours non- minimal contiendra des segments de discours plus petits eux aussi reliés par une autre relation rhétorique. Ceci permet de construire une représentation arborescente du texte.

1.1.3 La nucléarité

Un autre concept fondamental est la notion de nucléarité. En effet, dans une relation de discours, les deux segments n'ont pas le même sta-

4MANN et THOMPSON (1987) proposent 26 relations de base, comme par exemple les relations de moyen, de but, de cause, d'élaboration ou encore de conséquence. Ce nombre de relations n'est cependant pas fermé, Mann et Thompson laissant la possibilité d'en créer de nouvelles si l'analyse le demande.

5Certaines relations peuvent relier plus de deux segments entre eux. C'est le cas par exemple de la relation de séquence qui relie les trois segments de l'exemple suivant:

(1.1) Le chasseur a chargé son fusil. Il a visé le pigeon. Il l'a abattu.

1. Cadre global et méthodologie

tut6 : l'un est considéré comme plus essentiel à la compréhension du texte -- on l'appelle le noyau, noté -- et l'autre comme plus secondaire -- que l'on nomme le satellite, . Une relation rhétorique est donc asymétrique, puisqu'elle relie deux constituants d'inégale importance.

Illustrons cette propriété par une relation de conséquence:

(1.3) Le flux des octets de données dans le câble entre deux ports

série est bidirectionnel, il y a donc deux flux (et deux fils)

différents à considérer.

Notons qu'il n'est pas toujours évident de décider du statut de noyau ou de satellite de chaque membre d'une relation rhétorique. En effet, dans l'exemple précédent, la RST considérera comme un satellite alors qu'intuitivement, on considérerait plutôt que apporte l'information la plus importante. Cela ne posera pas de problème pour notre analyse, car nous suivrons la RST à la lettre et nous étiquetterons comme satellite la conséquence de la relation de conséquence. Cela peut en revanche poser des problèmes en aval par exemple dans un système de résumé automatique sélectionnant les noyaux (information importante) du texte, les noyaux n'apportant pas toujours l'information la plus importante si on respecte littéralement la RST.

1.1.4 Représentation graphique de la structure rhétorique

La structure rhétorique d'un texte peut être représentée très facilement à l'aide d'unités très simples appelées schémas. Un schéma permet de représenter une relation rhétorique entre deux segments de discours,

1. Cadre global et méthodologie

 

et il est composé:

- de lignes horizontales représentant les segments de discours; - d'une ligne verticale marquant le noyau;

- d'une flèche reliant le satellite à son noyau, indiquant le sens de la relation.

Relation Rhétorique

Noyau Satellite

FIG. 1.1 - Représentation graphique d'une relation rhétorique

1.2 Vers un analyseur rhétorique

Notre objectif à travers l'étude de la relation de conséquence est la construction d'un analyseur rhétorique du français. En effet, cette relation fait partie d'un ensemble plus vaste de relations comme nous venons de le voir à la section précédente. Son étude constitue donc une brique dans la réalisation d'un système capable de dériver automatiquement la structure rhétorique d'un texte.

Un tel analyseur n'existe pas pour le moment pour le français, mais deux systèmes ont été récemment élaborés pour l'anglais, l'approche adoptée par leurs deux concepteurs différant sensiblement l'une de l'autre.

1.2.1 L'approche pattern-matching

Dans sa thèse (MARCU (1997)), Daniel Marcu propose de dériver la structure rhétorique des textes à partir d'indices fiables et faciles à repérer: les connecteurs. Pour établir une relation rhétorique, le système de

1. Cadre global et méthodologie

 

Marcu fait donc une simple recherche de motifs dans les textes (patternmatching) à l'aide d'expressions régulières, ce qui lui permet de repérer les connecteurs et de voir leur contexte immédiat afin de préciser quelque peu leur sens. Par exemple en français, le résultat de la recherche de /Aussi, / est un connecteur alors que celle de /aussi/ ne l'est pas. Cependant, même si cela fonctionne pour aussi, un simple pattern-matching ne suffit en général pas (nous le verrons au chapitre 3).

1.2.2 L'approche morpho-syntaxique

Simon Corston-Oliver (CORSTON-OLIVER (1998b)) quant à lui propose de compléter la recherche de motifs par une analyse morpho-syntaxique. En effet, certains éléments permettent d'établir que l'on a une relation rhétorique particulière, comme par exemple la présence d'un participe présent ou d'un verbe au passif, chose que l'on ne peut chercher avec de simples expressions régulières.

1.2.3 L'intégration de l'interface sémantique-pragmatique

Nous proposons évidemment de tenir compte des critères précédemment cités, mais aussi d'aller en voir d'autres. Ces critères importants à envisager sont des critères sémantiques et pragmatiques, comme l'aspect verbal, le type de verbe (sémantique lexicale) ou les actes de langage en jeu (pragmatique)7.

7Bien que le type d'acte de langage soit très important dans certains cas pour déterminer à quelle relation rhétorique on a affaire (c'est le cas pour la relation de conséquence, voir DRUON (2000)), nous n'aurons pas le temps ici de traiter de ce sujet.

1. Cadre global et méthodologie

1.2.4 Applications : compréhension automatique de textes et résumé automatique

L'analyseur rhétorique construit, on peut envisager des applications qui utilisent la représentation du texte conforme à la RST qu'il donne en sortie.

Obtenir la structure rhétorique d'un texte ouvre la voie à deux grands types d'applications:

- La compréhension automatique de textes / l'extraction d'informations (voir JACKIEWICZ (1998)) : cet arbre rhétorique nous permettrait d'avoir une vue d'ensemble sur la construction argumentative du texte, et donc par exemple de sélectionner les passages importants comme peuvent l'être les conclusions (ce que permet l'étude de la relation de conséquence);

- Le résumé automatique (voir MARCU (1997)) : obtenir la structure

rhétorique d'un texte est aussi très intéressant. En effet, de par l'at-

tribution d'un statut informationnel plus important aux noyaux, on

a une base solide pour le résumé automatique en sélectionnant pré-

férentiellement les noyaux lors de la contraction du texte.

En gardant cet objectif de compréhension ou de résumé automatique, nous devrons chercher les conditions permettant ou empêchant l'interprétation consécutive d'une relation de discours, et ce à différents niveaux (orthographique, syntaxique, sémantique.. .). C'est à partir de l'analyse de corpus que nous y parviendrons.

1. Cadre global et méthodologie

 

1.3 L'analyse de corpus

1.3.1 Une approche exploratoire

Nous avions dans notre mémoire de maîtrise (DRUON (2000)) fait un exposé du fonctionnement de quelques connecteurs consécutifs du français. Or nous savions déjà (et nous l'avions remarqué) que la relation de conséquence était susceptible d'être exprimée autrement que par la présence d'un connecteur. Notre objectif cette fois-ci était de couvrir au moins en partie les moyens d'expression de la conséquence en français. Nous essaierons donc de nous détacher des marques lexicales que sont les connecteurs pour essayer de repérer l'ensemble d'indices, plus complexe, qui permettent l'interprétation consécutive.

Nous avons donc décidé d'aborder la question avec une approche de corpus, une approche exploratoire.

Afin d'étudier la relation de conséquence, nous avons parcouru nos corpus avec l'intention de repérer intuitivement toutes les relations de conséquence qui s'y trouvaient. L'idée était qu'à partir de ce premier repérage, on pouvait déjà avoir une vue d'ensemble sur les moyens d'expression de la relation de conséquence dans les textes procéduraux et scientifiques (dont nos deux corpus sont respectivement constitués). Cette première vue d'ensemble, et cela explique le côté exploratoire de notre approche, est obtenue par une recherche dans le corpus, donc sans a priori sur les moyens d'expression de la conséquence.

1.3.2 Corpus utilisés

1. Cadre global et méthodologie

 

disponibles sous format électronique:

- Des textes procéduraux, en fait un ensemble de quelques manuels d'utilisation de Linux: les «howto»;

- Le texte d'une revue de type « revue de vulgarisation scientifique »: le numéro 335 de La Recherche.

Après analyse manuelle, nous avons obtenu l'analyse quantitative présentée en page suivante.

1.3.3 Méthodologie

Une fois les corpus choisis, nous avons mis en oeuvre cette approche exploratoire en plusieurs étapes:

1. Nous commençons par l'annotation manuelle de la relation de conséquence dans les corpus, en prenant bien soin de délimiter ses arguments et de noter pour chaque relation trouvée quel argument se trouve être la cause et lequel est la conséquence. Ainsi, nous pouvons extraire du texte annoté toutes les relations de conséquence des corpus, ce qui permet une analyse plus rapide et facile;

2. À partir de cet ensemble d'extraits présentant des relations de conséquence, nous obtenons après analyse une première grille des indices permettant de repérer une relation de conséquence (connecteurs, aspect, temps des verbes...);

3. Afin d'affiner l'analyse, nous avons extrait automatiquement des corpus ces indices8 avec leur contexte (les propositions qui les entourent), ce qui permet de voir dans quel cas cet indice n'induit pas une relation de conséquence;

8Nous nous sommes pour l'instant limité à l'extraction d'indices facilement repérables correspondant à des mots entiers (comme les connecteurs ou les verbes modaux devoir et pouvoir), ou bien à des formes facilement repérables par une expression régulière comme les participes présents.

 

Autre indice

 
 

Aucun indice

ceci/cela ce qui

pt. pr.

 

et

juxt.

analysemanuelle

26 16,0%

7 4,3%

2 1,2%

17

10,4% 19

11,6%

total

 

21,5%

 
 

22%

 
 

ainsi

 

alors

ce faisant

Connecteur

ce q fait q dans ce cas

 

donc

par csq

pour cette r.

23

14,1%

11

6,7%

1 0,6%

3 1,8% 4 2,5%

42

25,8%

7 4,3%

1 0,6%

 
 
 
 
 

56,5%

 
 
 
 

analyse manuelle

total

FIG. 1.2 - Analyse quantitative du corpus Howto-Linux-Text-Terminal

1. Cadre global et méthodologie

 

4. Une fois déterminées ces nouvelles contraintes sur la relation, on peut à nouveau extraire automatiquement les indices avec leur contexte, en tenant évidemment compte de ces contraintes;

5. On obtient ainsi (en combinant la grille des indices et les contraintes sur ces indices obtenues par une analyse plus poussée) une description précise des éléments que nous pouvons utiliser pour repérer automatiquement dans un texte une relation de conséquence.

Nous avons synthétisé cette méthodologie dans la figure 1.3 présentée en page suivante.

Notre démarche est à rapprocher de la méthode d'exploration contextuelle de l'équipe de Jean-Pierre Desclés (voir à ce propos MINEL et al. (2001) et DESCLÉS et al. (1997)). En effet, ils définissent la méthodologie de l'exploration contextuelle comme suit (elle s'applique quelle que soit la catégorie textuelle envisagée) :

1. Identifier l'information sémantique pertinente et ses indicateurs linguistiques;

2. Identifier le segment de contexte C nécessaire pour prendre en compte la polysémie;

3. Écrire les étapes procédurales pour trouver les indices linguistiques pertinents en explorant le contexte C de façon à résoudre les ambiguïtés. DESCLÉS et al. (1997)

Nous aborderons donc notre étude dans le même état d'esprit, en essayant tout d'abord de trouver des indices en présence desquels il est possible d'avoir une relation de conséquence puis nous les compléterons avec des règles sur le contexte de ces indices.

Nous allons maintenant poser quelques préalables théoriques qui nous paraissent indispensables à l'étude de la conséquence.

1. Cadre global et méthodologie

 

texte brut

annotation manuelle du corpus

texte annoté

extraction des relations

ensemble de relations

analyse manuelle des arguments

grille d'analyse

Ensemble d'indices avec leur contexte

contraintes sur les indices

ANALYSE COMPLÈTE DE LA RELATION

extraction d'indices avec leur contexte

analyse de la conformité avec la relation

Légende

Texte

Opération manuelle

Opération automatique

FIG. 1.3 - Méthodologie

Chapitre 2

Préalables théoriques

Après avoir brièvement le cadre théorique dans lequel se situe notre étude et la méthodologie que nous avons adoptée afin de rendre compte des moyens d'expression de la relation de conséquence, nous allons maintenant devoir réfléchir sur la notion même de conséquence et poser les bases théoriques indispensable à l'analyse des moyens d'expression de la relation de conséquence.

Nous allons donc essayer de définir ce que nous entendons par conséquence et relation de conséquence et après avoir réfléchi à la manière dont nous percevons un lien de cause à effet, nous préciserons les notions d'aspect verbal et de verbe efficient, notions indispensables pour l'analyse qui suivra.

2.1 La conséquence

Pour bien délimiter l'objet de notre étude, il nous faut commencer par définir la notion de «conséquence». Après avoir passé en revue les notions proches, nous préciserons ce que nous entendons par «conséquence» en limitant le terme au domaine du raisonnement.

2. Préalables théoriques

 

2.1.1 Conséquence logique, effet, résultat

Certaines notions classiques correspondent en partie au sens que nous attribuons à «conséquence» : il s'agit de l'effet, du résultat et de la conséquence logique.

Définition 2.1 -- Effet: «Fait réel, actualisé, conçu le plus généralement dans sa relation avec un autre fait réel, considéré comme sa cause. » AUROUX (1990), p. 753

L'effet est donc le pendant de la cause, et c'est en cela qu'il se rapproche de la notion de conséquence que nous voulons établir. En revanche, l'effet est uniquement perçu comme un fait réel ce qui n'est pas le cas de la conséquence comme nous le verrons par la suite.

En logique, on parle souvent de conséquence logique, qui se rapproche de la notion de conséquence que nous voulons définir:

Définition 2.2 -- Conséquence logique: On dit que est la conséquence logique de si est nécessairement vrai lorsque l'est.

Cette définition n'est pas convenable pour définir la notion de conséquence en langage naturel du fait du caractère nécessaire de la relation entre et . Cette nécessité n'apparaît pas en langage naturel:

(2.1) Pierre est tombé donc il s'est fait mal.

En effet, le fait que Pierre tombe n'entraîne pas nécessairement qu'il se fasse mal. La conséquence logique ne correspond donc pas vraiment à la conséquence comme nous l'entendons.

Nous allons maintenant aborder le concept de résultat afin d'obtenir une définition de la conséquence.

Définition 2.3 -- Résultat: « Point d'aboutissement, provisoire ou

définitif, d'un mouvement physique ou intellectuel. » LABARRIÈRE (1990), p. 2260

2. Préalables théoriques

 

C'est la définition de «résultat» qui est la plus proche de celle que nous voulons donner à «conséquence». En effet, l'effet est restreint à un fait et la conséquence logique présente un caractère nécessaire qui n'apparaît pas pour le résultat.

2.1.2 Spéci~cation de la notion de conséquence

À partir des définitions données dans la section précédente, nous pouvons maintenant donner une définition à conséquence. À la lumière de ces définitions, nous limiterons la notion de conséquence à celle de « conclusion d'un raisonnement ». C'est donc un phénomène discursif qui ne reflète pas forcément un lien de causalité dans le monde extérieur. Par la suite, nous emploierons ce terme dans cette acception, notre but étant de décrire la relation rhétorique de conséquence, impliquant un raisonnement.

Définition 2.4 -- Conséquence: La conséquence est la conclusion que le locuteur tire d'un raisonnement.

2.2 La relation de conséquence

Après avoir défini la notion de conséquence et en nous appuyant sur cette définition, nous allons circonscrire et définir ce qui fait l'objet de notre mémoire: la relation de conséquence.

2.2.1 Qu'est-ce qu'une relation de conséquence?

2.2.1.1 Conséquence vs. relation de conséquence

Il ne faut pas confondre conséquence et relation de conséquence. En

2. Préalables théoriques

 

éventualité. En revanche, la relation de conséquence est, comme son nom l'indique, une relation, donc le lien entre le point de départ de ce raisonnement et sa conséquence.

2.2.1.2 Définition préliminaire

Avant de détailler plus en profondeur la relation de conséquence, nous allons en donner une définition provisoire, qui nous permettra de travailler.

Définition 2.5 -- Relation de conséquence (provisoire): La relation de conséquence est une relation rhétorique1 unissant deux étapes d'un raisonnement: le point de départ d'un raisonnement et sa conclusion.

2.2.2 Verbes et relation de conséquence

Observons l'exemple suivant:

(2.2) Les restrictions budgétaires des années 1980 ont engendré des

coupures massives d'abonnements.

(2.3) Ily a eu des restrictions budgétaires dans les années 1980 donc

ily a eu des coupures massives d'abonnements.

Certains, comme GARCIA (1998), voient dans le lien causal directement exprimé dans l'exemple 2.2 par le verbe engendrer une relation de conséquence. Nous ne sommes pas de cet avis et nous rejoignons le point de vue de Jackiewicz:

Les connecteurs2, au contraire des verbes, «sont utilisés davantage pour étayer et justifier les propos en tant que marqueurs d'acte de parole que pour créer un contenu informatif

1Voir la section 1.1.

2Pour plus de précisions sur les connecteurs, voir DRUON (2000) et le chapitre 3.

2. Préalables théoriques

 

(causal) nouveau, en tant qu'opérateurs» bien qu'«ils expriment la causalité» JACKIEWICZ (1998), p. 82

En effet, nous voyons dans les verbes comme engendrer3 une façon de créer un contenu causal nouveau, et non un moyen d'exprimer une relation rhétorique4. Le locuteur établit un lien causal, mais son raisonnement n'est pas marqué.

En revanche, ce type de verbe en association avec d'autres indices peut tout à fait participer à l'établissement d'une relation rhétorique, comme c'est le cas dans l'exemple suivant:

(2.4) Utilisez une petite échelle d' ohms sur un ohmmètre pour que la

tension appliquée par l' ohmmètre soit faible . Ceci réduira les dommages possibles sur les composants sains.

De plus, considérer qu'un verbe puisse exprimer une relation rhétorique nous obligerait à prendre en compte des segments de discours minimaux plus petits que la proposition. À partir de maintenant, nous considérerons donc que la relation de conséquence est une relation qui relient des segments de taille au moins égale à la proposition.

2.2.3 Relations apparentées à la conséquence5

Nous avons présenté la relation de conséquence comme une relation entre une cause et une conséquence. On est parfois tenté de reconnaître comme relation de conséquence des relations qui n'en sont pas, mais qui en sont très proches, comme la cause, le but, la condition, la manière

3Il s'agit en fait des verbes efficients, dont nous parlerons à la section 2.6.

4D'après GALIOTOU (1999), l'exemple 2.2 implique qu'un agent participe au lien causal alors que dans l'exemple 2.3 c'est une raison. Cela revient à ce que nous disons : l'utilisation d'un connecteur permet de marquer un acte de parole, de relier une raison à sa conclusion, produit d'un raisonnement, ce qui n'est pas le cas avec le verbe.

5Cette section est en partie inspirée de NAZARENKO (2000). Se référer à cet ouvrage pour une vue d'ensemble sur les moyens d'exprimer la causalité en français.

2. Préalables théoriques

 

ou l'arrière-plan. Nous nous baserons sur les définitions des relations données par MANN et THOMPSON (1987) que nous présentons dans le tableau 2.16.

Relation

Noyau

Satellite

But

une situation cible

l'intention sous-jacente à la situation

Cause délibérée

une situation

une autre situation, cause de la première, du fait de l'action délibérée de quelqu'un

Cause non délibérée

une situation

une autre situation, ayant provoqué la première, mais pas du fait d'une action délibérée

Circonstance

texte exprimant les évé-
nements ou idées situés
dans le cadre interprétatif

un cadre interprétatif temporel ou situationnel

Condition

action ou situation dont l'occurrence résulte de l'occurrence de la situation conditionnante

la situation condition-

nante

Résultat délibéré

une situation

une autre situation, causée par celle-ci, du fait de l'action délibérée de quelqu'un

Résultat non-délibéré

une situation

une autre situation provoquée par la première, mais pas du fait d'une action délibérée

TAB. 2.1 - Relations proches de la relation de conséquence chez MANN et THOMPSON (1987)

2.2.3.1 La relation de cause

La relation de cause est peut-être celle qui est la plus proche de la relation de conséquence. Plus précisément, elle est son pendant. La relation de cause présente effectivement une relation entre une cause et une

6Ce que nous appelons relation de conséquence figure chez MANN et THOMPSON (1987) sous le nom de résultat, délibéré ou non délibéré (distinction que nous ne marquerons pas).

conséquence, mais le point de vue est inversé: en effet, en utilisant une relation de cause, on met plus l'accent sur la cause que sur la conséquence. Dans la terminologie de Mann et Thompson, il y a donc inversion du statut de noyau et de satellite entre ces deux relations (Le noyau est la conséquence pour la relation de cause et la cause pour la relation de conséquence) :

(2.5) Le texte est une forme limitée de graphique. donc le terme

«terminal graphique» est quelquefois donné à tous les terminaux texte

(2.6) Puisque le texte est une forme limitée de graphique, le

terme «terminal graphique» est quelquefois donné à tous les terminaux texte

(2.7) Le terme «terminal graphique» est quelquefois donné à tous

les terminaux texte puisque le texte est une forme limitée de

graphique,

La relation de cause est en quelque sorte le symétrique de la relation de conséquence, le statut de noyau et de satellite étant inversé entre ces deux relations (relation de cause dans l'exemple 2.6 vs. relation de conséquence dans l'exemple 2.5) . En revanche, on ne peut pas parler d'inversion de l'ordre de la relation parce que l'ordre de la relation de cause est libre, au contraire de celui de la conséquence qui est fixe (comparer les exemples 2.7 et 2.6).

Il faut remarquer que la distinction entre relation de cause et relation de conséquence, bien qu'évidente si on utilise un connecteur, n'est pas une distinction tranchée quand la relation n'est pas marquée:

(2.8) Jean a vendu sa voiture. Il a des ennuis d'argent

(2.9) Jean a vendu sa voiture donc il a des ennuis d'argent

(2.10) Jean a vendu sa voiture parce qu'il a des ennuis d'argent

La relation de cause énonce donc un lien de causalité, mais l'accent est mis sur la cause et non sur la conséquence comme pour la relation de conséquence.

2.2.3.2 La relation de but

Le satellite d'une relation de but est présenté comme résultant de la volonté de l'agent du noyau. De plus, le satellite d'une relation de but n'indique pas une action réalisée ou qui se réalisera, mais une volonté de faire une action. Ce n'est pas le cas pour la conséquence, comme le montre l'exemple 2.12, paraphrase de l'exemple 2.11 :

(2.11) On peut paramétrer le curseur pour qu'il apparaisse

comme un rectangle.

(2.12) On peut paramétrer le curseur, donc il apparaîtra comme

un rectangle.

La relation de but présente donc elle aussi une conséquence, mais teintée
d'intentionnalité. De plus, le lien causal n'est que virtuel, il n'est pas
encore réalisé: on établit un lien causal qui est susceptible de se réaliser.

2.2.3.3 La relation de condition

La relation de condition met l'accent sur les conditions dans lesquelles un événement peut avoir lieu. La grande différence avec la relation de conséquence est que pour la relation de conséquence, le noyau est actuel, alors qu'il est virtuel pour la condition:

La relation de condition présente donc la conséquence (forcément potentielle) d'une éventualité7 (état ou événement) virtuelle. On peut aussi interpréter la relation de condition comme l'énoncé d'une loi alors que la relation de conséquence est l'application de cette loi:

(2.14) Si on maintient une touche enfoncée, alors celle-ci est «tapée» de manière répétée.

(2.15) On maintient une touche enfoncée, donc celle-ci est «tapée» de manière répétée.

La relation de condition correspond bien ici à l'énoncé d'une loi (maintien d'une touche répétition du caractère), alors que la relation de conséquence correspond à son application (on maintient la touche enfoncée et cela a pour conséquence de répéter le caractère).

On remarquera d'ailleurs un parallélisme entre condition et certaines constructions que l'on pourrait prendre pour une conséquence:

(2.16) Taper « cat mon_fichier > /dev/ttyS0 » enverra le contenu du fichier mon_fichier sur COM1 (ttyS0).

La relation de condition présente relie donc la condition de réalisation d'un événement à sa conséquence potentielle.

2.2.3.4 La relation de circonstance

Le satellite de la relation de circonstance décrit les circonstances dans lesquelles s'est déroulé le noyau (qui peut être considéré comme la conséquence de ces circonstances favorisantes) et non sa cause.

(2.17) Curieusement, c'est des autres galaxies que viendra peut-être

la lumière. En effet, les trous noirs supermassifs que l'on

7Sur les notions d'éventualité, d'état et d'événement, voir la section 2.5.

commence à détecter au centre des galaxies proches sont eux aussi en proie à une profonde asthénie.

On peut toujours considérer le noyau comme conséquence du satellite. 2.2.3.5 La relation de manière

Dans une relation de manière8, on a toujours la présence d'une conséquence dans un des deux segments de discours, mais l'accent est mis sur la manière dont l'événement cause s'est déroulé et non sur cet événement comme dans la relation de cause.

(2.18) Joliot leur fait des reproches injustes, accusant Goldschmidt, d'avoir organisé toute l'opération d'extraction du premier milligramme de plutonium en son absence.

2.2.3.6 Comparaison de la relation de conséquence avec ses relations apparentées

Dans le tableau suivant, nous reprenons ce que nous venons de dire sur les relations apparentées à la relation de conséquence pour bien voir ce qui distingue ces relations entre elles et par conséquent bien distinguer la relation de conséquence9 :

8La relation de manière, ni d'ailleurs une relation proche, n'est pas mentionnée dans MANN et THOMPSON (1987).

9Selon les paramètres donnés dans le tableau on ne peut pas distinguer la relation de but de la relation de condition. Cependant, ces critères sont suffisants pour bien distinguer la relation de conséquence des autres relations.

 

N

S

N actuel

S actuel

mobilité

Conséquence

cause

conséquence

+

+

-

Cause

conséquence

cause

+

+

+

But

cause

conséquence

-

-

+

Condition

cause

conséquence

-

-

+

Circonstance

conséquence

circonstance

+

+

?

Manière

conséquence

manière

+

+

+

TAB. 2.2 - Comparatif des relations apparentées à la conséquence

2.2.4 Ordre des segments de la relation de conséquence

Contrairement à la relation de cause, où l'ordre des segments peut être libre (exemples 2.19 et 2.20), la relation de conséquence a un ordre fixe: le noyau (présentant la cause) est présenté en premier et il est suivi de son satellite (présentant la conséquence) (exemples 2.21 et 2.22).

(2.19) Parce que Kevin pleure, Samantha le console.

(2.20) Samantha console Kevin parce qu'il pleure.

(2.21) Kevin pleure donc Samantha le console.

(2.22) * Donc Samantha console Kevin, il pleure.

Cela fonctionne aussi pour des relations inférentielles, où l'on considère toujours que pour deux segments de discours et entretenant une relation inférentielle de cause à conséquence, on a toujours . Et cela même si présente la cause de , dans ce cas on dit que la relation de conséquence tient non pas entre deux éventualités, mais entre deux énonciations.

La conséquence principale est que le noyau est toujours placé avant le satellite dans le texte pour une relation de conséquence. Dans la RST, la relation de conséquence sera donc toujours représentée comme suit:

2. Préalables théoriques

 

Conséquence

Cause Conséquence

FIG. 2.1 - Représentation graphique de la relation de conséquence

2.2.5 Vers une définition de la relation de conséquence

Après les remarques faites dans les deux sections précédentes (2.2.3 et 2.2.4) et en nous appuyant sur la pré-définition donnée en 2.2.1, nous pouvons maintenant essayer de compléter la définition de la relation de conséquence.

Définition 2.6 -- Relation de conséquence: Une relation de conséquence est une relation entre deux segments de discours:

- le premier, le noyau, est toujours actuel et est une éventualité qui constitue les prémisses d'un raisonnement;

- le second, le satellite, est lui aussi toujours actuel et présente la conclusion de ce raisonnement.

2.3 Conséquence et inférence

Nous allons dans cette section traiter du rapport étroit qu'entretiennent conséquence, inférence et modalité. Nous commencerons par donner la définition de l'inférence, pour discuter ensuite quelques modes de réalisation de l'inférence en français.

Définition 2.7 -- Inférence : L'inférence consiste à poser à partir

d'éventualités données dans l'expérience du sujet une éventualité non donnée, résultat d'un raisonnement.

Le français a à sa disposition plusieurs possibilités d'exprimer une inférence, parmi lesquelles les verbes modaux épistémiques devoir et pou-

2. Préalables théoriques

 

voir10. C'est ce que nous allons maintenant examiner.

2.3.1 Pouvoir

Selon TAMOWSKI et DENDALE (1994), il existe en français deux sortes de verbe pouvoir. Le premier est le pouvoir dit «radical», qui exprime la permission (exemple 2.23), la capacité ou la possibilité (exemple 2.24):

(2.23) Maintenant que tu as fait tes devoirs, tu peux aller jouer. (2.24) Jean s'est musclé. Il peut maintenant soulever 100kg.

Le deuxième pouvoir est celui qui nous intéressera, le pouvoir épistémique:

(2.25) Pierre n'est pas chez lui. Il peut être à la bibliothèque.

Pouvoir épistémique exprime une conclusion tirée à partir d'hypothèses, il a donc une valeur inférentielle. De plus, il insiste sur la « disposition du locuteur à admettre d'autres hypothèses que la sienne ». C'est-à-dire que la conclusion retenue par le locuteur n'exclut pas d'autres conclusions possibles.

2.3.2 Devoir

Le verbe devoir en français a deux significations principales: une signification déontique et une signification épistémique.

La signification déontique se rapporte à une obligation:

(2.26) Rémi doit faire ses devoirs

'°Cette section se base en grande partie sur les travaux de Patrick Dendale (DENDALE (1994), DENDALE (2000), TAMOWSKI et DENDALE (1994) et DENDALE et ROSSARI (2000)) pour le français et STONE (1994) pour l'anglais. Se reporter à ces articles pour plus de détails sur la question.

2. Préalables théoriques

 

Mais cette signification ne nous concerne pas ici. Nous nous intéresserons en revanche à la signification épistémique du verbe devoir qui est en rapport étroit avec l'inférence:

(2.27) Claude a beaucoup travaillé. Il doit être fatigué.

Selon DENDALE (1994), le verbe devoir dans sa signification épistémique donne une valeur de probabilité, de plus ou moins grande vraisemblance à une proposition. Le locuteur utilise donc devoir quand il « fait une inférence à partir de prémisses sur l'applicabilité desquelles il sait qu'il a pu se tromper ».

Contrairement à pouvoir, avec qui le locuteur laisse la porte ouverte à d'autres conclusions que la sienne, l'emploi du verbe devoir épistémique implique que le locuteur ne sélectionne qu'une seule conclusion à l'exclusion de toute autre, mais sur laquelle il émet pourtant quelques réserves.

2.3.3 Devoir et pouvoir au conditionnel

Les modaux épistémiques devoir et pouvoir peuvent aussi être employés au conditionnel. Dans ce cas, ils acquièrent en plus de leur sens de base une valeur de prédiction, ou de détachement du locuteur par rapport aux faits qu'il rapporte (et donc par rapport à la conclusion qu'il en tire) :

(2.28) Pierre est malade. Il pourrait bien être absent.

(2.29) Cliquez sur le bouton «fermer». La fenêtre devrait disparaître.

2.3.4 Implications sur la relation de conséquence

2. Préalables théoriques

 

d'inférence, on a souvent une relation de conséquence. Ceci paraît logique car d'après la définition de l'inférence, une inférence marque un raisonnement et la relation de conséquence relie les prémisses à la conclusion d'un raisonnement.

2.4 Comment repérer un lien causal en discours

Nous venons de définir ce qu'est la relation de conséquence. Or les critères à notre disposition pour repérer une telle relation sont tout à fait subjectifs (lorsque l'on parle de prémisse et de conclusion d'un raisonnement). Il faut donc définir ce qui nous permet de détecter un lien de cause à effet dans le discours.

Après avoir défini ce qu'est un lien causal, nous allons nous demander comment nous faisons pour le repérer en lisant un texte ou en écoutant un interlocuteur.

Définition 2.8 -- Causation (lien causal ou de causalité): La causation est une relation entre événements ou états dans le temps et l'espace. Elle est basée sur l'idée de faire arriver les choses ou de les empêcher d'arriver. est la cause de si la présence de entraîne la présence de

, ou si l'absence de entraîne l'absence de .11

Nous parlons donc de lien de causalité ou lien causal12 pour désigner le lien qui unit une cause à son effet. Par exemple:

Pierre a chuté. Il s'est fait mal.

est la cause de , nous dirons donc qu'il existe un lien de causalité entre et .

11Cette définition est tirée de ITKONEN (1994).

12GALIOTOU (1999) utilise le terme de lien causal dans le même sens que causation.

2. Préalables théoriques

 

2.4.1 Les connaissances de sens commun

Selon certains auteurs, nous repérons un lien de cause à effet grâce à des règles de causalité. C'est le cas de MOESCHLER (1998) à qui nous avons emprunté l'exemple qui suit13:

(2.30) Le verre de whisky est tombé. Il s'est cassé.

Si nous interprétons la relation entre les deux propositions de cet exemple comme une relation de conséquence, c'est parce que nous avons connaissance (consciente ou non), ou du moins à notre disposition, une loi causale qui nous permet de faire cette interprétation. Ici c'est une loi causale du type tomber-casser qui nous permet de voir une relation de conséquence entre le fait que le verre de whisky est tombé et celui qu'il s'est cassé.

En admettant que notre interprétation des relations causales se fasse à partir de nos connaissances du monde (en l'occurrence de règles de causalité associant divers événements), il devient très difficile de modéliser le fonctionnement de la relation de conséquence. En effet, il faudrait construire une base de données d'une grande partie des connaissances de sens commun acquises par un être humain (la taille de cette base de données dépend évidemment de la complexité du texte et de l'étendue du domaine qu'il couvre). Et cette tâche n'est pas actuellement à notre portée, et de toute façon dépasse de loin le cadre de notre recherche.

Il existe cependant un projet principal visant à modéliser nos connaissances de sens commun14 : le projet Cyc initié dans les années 80 et toujours dirigé depuis par Douglas Lenat (voir LENAT (1995) et COPE-

13Ce point de vue est aussi celui de ASHER (1993) qui postule que l'on a par défaut une relation de narration entre deux segments qui se suivent, mais si nos connaissances de sens commun nous permettent de trouver une loi causale entre ces deux segments, alors la relation sera interprétée comme une relation de résultat par exemple.

141l existe également un autre projet, OpenMind common sense (http: / / www. openmind.org/commonsense) auquel tout le monde peut participer.

2. Préalables théoriques

 

LAND (1997)). Cette base de connaissances intègre aussi, bien entendu, les connaissances causales que nous avons du monde, comme par exemple (tiré de COPELAND (1997)):

(2.31) causal(there is water in the fuel the engine misfires)

Le problème est que ce projet est loin d'arriver à son terme, la somme de

travail en jeu étant colossale et n'est pas utilisable par un particulier.

C'est pourquoi nous voulons trouver des stratégies pour éviter au maximum le recours à ces connaissances causales pour déterminer la présence d'une relation de conséquence dans un texte, et nous pensons pouvoir nous passer de lois causales dans une majorité de cas. De plus, il ne semble pas suffisant de connaître les liens causaux qui existent entre deux éventualités afin de déterminer si nous nous trouvons face à une relation de conséquence. Prenons par exemple un cas de déduction:

(2.32) Jean est moine: il est célibataire.

Dans ce cas-là, nous avons besoin de connaissances encyclopédiques pour pouvoir interpréter la relation unissant les deux énoncés «Jean est moine» et «il est célibataire». Ici on extrait une propriété d'un cas plus général, et l'interprétation de la relation comme relation de conséquence ne repose pas sur une loi causale, mais sur une relation d'un autre type, plus précisément une relation entre un objet et une de ses propriétés (le fait d'être moine et une de ses propriétés: le célibat).

2.4.2 La propension à l'interprétation causale

Pendant que certains préfèrent une solution privilégiant les lois causales comme mécanisme d'interprétation d'une relation de conséquence, d'autres prônent une solution radicalement opposée, ne faisant pas du tout appel à d'éventuelles lois causales. C'est le cas de NAZARENKO (2000),

2. Préalables théoriques

 

45-48. En effet, d'après elle, nous avons naturellement tendance à voir une relation causale entre deux événements mis en relation dans le discours:

« Dès lors que deux situations ou deux événements sont mis en relation par le discours, nous y voyons un lien de cause à effet» NAZARENKO (2000)

Nazarenko prend donc là une position opposée à celle d'ASHER (1993) qui veut que la relation entre deux segments de discours soit tout d'abord interprétée comme une narration, soit une simple succession temporelle de deux éventualités sans lien causal particulier (voir à ce sujet la note 13 page ).

De plus, ce principe de propension à l'interprétation causale semble beaucoup trop puissant car il permet de tout interpréter causalement. Comme le montre l'exemple suivant, l'existence d'un lien de causalité sous-jacent dans une relation n'implique pas forcément une relation de cause ou de conséquence:

(2.33) L'employée a été licenciée quand on a découvert les malversations.

Nazarenko voit dans cet exemple une relation de cause implicite, l'interprétant comme «L'employée a été licenciée parce qu'on on a découvert les malversations». Effectivement, il existe un lien de causalité entre le licenciement et les malversations, mais il n'implique aucunement une relation rhétorique de cause entre les deux. En effet, l'établissement d'une relation de cause nécessiterait qu'un raisonnement soit marqué ce qui n'est pas le cas.

Afin de pouvoir repérer une relation de conséquence dans un texte, il va donc nous falloir délimiter plus précisément ce qui nous permet de

2. Préalables théoriques

 

l'interpréter comme telle et non pas se fier à un principe trop général qui permettrait l'interprétation consécutive de n'importe quel couple de propositions.

2.4.3 Vers une autre stratégie

Nous devrons donc adopter d'autres stratégies afin de voir comment on peut repérer une relation de cause à effet. En effet, il existe d'autres moyens pour interpréter une relation de discours comme relation de conséquence que de faire à chaque fois appel aux connaissances de sens commun. La solution de Nazarenko, quoi que séduisante au premier abord, est beaucoup trop puissante car elle peut permettre de tout interpréter causalement. De plus, la relation de conséquence est une relation créée par le discours et elle est relativement indépendante des lois du monde réel. Il est donc légitime de chercher des indices de sa présence dans les textes car ce n'est que là qu'elle est présente. Nous nous proposerons donc dans les chapitres suivants de chercher d'autres moyen de repérer une relation de conséquence en cherchant les indices linguistiques qui nous permettent cette interprétation.

2.5 La classe aspectuelle

Il est très important de tenir compte de la classe aspectuelle du verbe car elle constitue un indice qui peut faire basculer notre interprétation d'une relation de discours vers une interprétation consécutive15.

15Voir à ce propos le chapitre 4.

2. Préalables théoriques

 

2.5.1 La taxinomie des éventualités de Vendler

Afin de décrire les arguments de la relation de conséquence, nous avons entre autre besoin de décrire la classe aspectuelle des situations que décrivent ses arguments : un état, un événement ou autres. . .16 Nous reprendrons donc la taxinomie des éventualités proposée par VENDLER (1967).

Définition 2.9 -- État : Un état est « la manière d'être d'une per-

sonne ou d'une chose, considérée dans ce qu'elle a de durable » (REY et REY-DEBOVE (1993)). Un état dure donc dans le temps, et ce de façon homogène. Dans l'exemple suivant, le prédicat «est amoureuse» décrit un état de Marie:

(2.34) Marie est amoureuse.

Définition 2.10 -- Processus: On parle de processus quand un prédicat dénote une progression.

Définition 2.11 -- Activité : Une activité est un processus dont la longueur est indéfinie, non bornée dans le temps.

(2.35) L'homme marchait.

Définition 2.12 -- Événement: Un événement est un processus non- homogène qui culmine en un point du temps (il a une fin).

Définition 2.13 -- Accomplissement: Quand un événement peut s'étendre sur une période de temps, on parle alors d'accomplissement.

(2.36) Jean-Claude révisait son examen.

Définition 2.14 -- Achèvement: Un événement ponctuel est appelé achèvement.

(2.37) Le piéton s'arrêta au feu rouge.

16Voir MOESCHLER (1999) reprenant VENDLER (1967).

2. Préalables théoriques

 

Définition 2.15 -- Éventualité: Nous utiliserons le terme d'éventualité17 pour référer aussi bien à l'aspect statique (état) que dynamique (événement, activité ou processus) que peut revêtir une situation.

Nous avons regroupé ces définitions dans une taxinomie que nous avons empruntée à MOESCHLER (1999), et complétée par des traits : voir la figure 2.2.

éventualités

états processus

activités événements

1- dynamique] 1+ dynamique]

1- borné] 1+ borné]

1- ponctuel]

1+ ponctuel]

accomplissements achèvements

FIG. 2.2 - Taxinomie des éventualités d'après VENDLER (1967)

2.5.2 État vs. événement

Nous garderons simplement la distinction état vs. événement qui nous semble suffisante pour décrire la relation de conséquence. Nous nous intéresserons donc principalement à la différence de trait I dynamique].

Nous garderons la définition de l'état donnée plus haut et nous élargirons la définition d'un événement à l'ensemble des processus. Définition 2.16 -- État (2) : Un état est une éventualité considérée

2. Préalables théoriques

 

dans ce qu'elle a de statique, de durable.

Définition 2.17 -- Événement (2): On parle d'événement pour une éventualité ayant un trait progressif, non statique.

2.6 Le type de verbe

Le type de verbe est très important pour l'analyse de la relation de conséquence. Nous verrons en effet par la suite (chapitre 4) que le fait de connaître le type du verbe dans une proposition est indispensable à l'interprétation consécutive en présence de certains indices.

Un type de verbe nous intéresse tout particulièrement : les verbes décrits par JACKIEWICZ (1998), p.96-110 sous le nom de verbes efficients. Ces verbes sont appelés ainsi car ils ont la faculté d'exprimer l'action qui produit un effet.

Jackiewicz distingue trois sous-types de verbes efficients:

- Les verbes relateurs;

- Les verbes factitifs et permissifs;

- Les verbes précisant l'effet produit.

2.6.1 Les verbes relateurs

Les verbes relateurs mettent en rapport deux situations. Il peut s'agir par exemple du verbe provoquer ou du verbe entraîner:

(2.38) Une faible demande en mémoire impliquait des coûts réduits
pour produire des moniteurs au début des années 1980.

(2.39) Des pores apparaissent à la surface des membranes cellulaires, entraînant la mort des cellules.

2. Préalables théoriques

2.6.2 Les verbes factitifs et permissifs

On parle de construction factitive pour les construction en faire + Vinf et permissive pour les constructions en laisser + Vinf:

(2.40) Les développements technologiques ont fait surgir de nouvelles questions.

(2.41) L'article français le plus cité en chimie sur la période laisse entrevoir une solution.

2.6.3 Les verbes précisant l'effet produit

Un certain nombre de verbes permettent de préciser l'effet produit, comme par exemple augmenter ou faciliter:

(2.42) Cultiver sur une même parcelle des variétés de riz différentes augmente la résistance globale de la culture à certaines attaques parasitaires.

(2.43) Le contexte financier, souvent fragile, de ces presses ne facilite pas l'innovation.

2.7 Conclusion

Nous avons donné dans ce chapitre une vue d'ensemble sur les préalables théoriques nécessaires à l'étude de la relation de conséquence en français : nous avons délimité ce qu'était notre objet d'étude, la relation de conséquence, problématisé la recherche d'indices nous permettant d'interpréter une relation rhétorique comme relation de conséquence, et introduit certains paramètres qui nous serviront pour l'analyse proprement dite de la relation.

2. Préalables théoriques

 

Nous allons maintenant commencer par présenter des marques caractéristiques de la relation de conséquence: les connecteurs consécutifs.

Chapitre 3

Les marqueurs spécifiques de la

relation de conséquence : les

connecteurs

Nous allons dans ce chapitre étudier les connecteurs consécutifs rencontrés dans nos corpus. Nous allons préciser les contraintes qui font qu'un connecteur est interprété en tant que tel et qu'il exprime la conséquence. Nous nous attendons à rencontrer des contraintes d'ordre ponctuationnel (la ponctuation qui entoure le connecteur peut modifier son interprétation), positionnel (selon sa position dans l'énoncé, un connecteur n'aura pas forcément le même sens), syntaxiques (comme par exemple la présence d'un verbe à la suite du connecteur), sémantique (l'aspect du verbe a des incidences sur l'interprétation du connecteur) ou encore sur les actes de langage (les propositions reliées par un connecteur ne pourront exprimer n'importe quel acte de langage). Mais nous détaillerons ces contraintes plus tard dans la section 5.1.

Nous allons commencer par définir rapidement la notion de connecteur, puis nous étudierons les connecteurs rencontrés dans les corpus La Recherche n 335 et Howto-Linux.

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

3.1 Les connecteurs comme marque spécifique de la conséquence

Il existe un moyen en français (ainsi que dans beaucoup d'autres langues) spécialisé dans le marquage des relations rhétoriques (et par conséquent de la relation de conséquence) : il s'agit des connecteurs. Les connecteurs sont des éléments lexicaux (conjonctions de subordination et de coordination, adverbes conjonctifs) qui permettent d'établir une relation de discours. Ces éléments ont beaucoup été étudiés dans la littérature (JAYEZ et ROSSARI (1998), JAYEZ et ROSSARI (1997), ROSSARI et JAYEZ (1996), PIOT (1991), FORGET (1984) entre autres en ce qui concerne les connecteurs consécutifs du français).

Définition 3.1 -- Connecteur: Élément lexical servant à relier deux propositions mais ne jouant pas de rôle syntaxique dans la proposition qu'il introduit.

Nous avions déjà étudié dans notre mémoire de maîtrise (DRUON (2000)) un petit ensemble de connecteurs consécutifs : donc, alors, par conséquent et de sorte que. Nous en avions étudié la distribution, ainsi que la possibilité ou non pour ces connecteurs de marquer une inférence. Nous avions déjà remarqué que tous les connecteurs consécutifs n'étaient pas univoques. Par exemple, alors pouvait marquer aussi bien une relation de conséquence qu'une simple succession temporelle sans cette nuance consécutive, alors que d'autres connecteurs, comme par conséquent n'autorisaient que l'interprétation consécutive:

Nous allons maintenant nous intéresser de plus près à ces marqueurs non univoques et essayer d'affiner l'étude de leurs arguments et de leur placement au sein de la phrase afin de déterminer les conditions dans lesquelles ils marquent une relation de conséquence et celles où ils en

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

expriment une autre. Nous distinguerons de même les cas où un élément lexical sera employé comme connecteur de ceux où il a une fonction phrastique1. Cette différence n'est pas du tout triviale à établir, et une approche basée sur les expressions régulières comme celle de MARCU (1997) est loin pouvoir distinguer à coup sûr entre fonction phrastique et fonction discursive : il faut faire une analyse plus profonde qu'une simple analyse de surface (nous aurons recours en plus de l'approche de surface à une analyse syntaxique, voire même parfois à la sémantique lexicale). De plus, nous allons élargir le nombre de connecteurs étudiés afin de couvrir l'ensemble des connecteurs rencontrés dans nos deux corpus. Nous rajouterons à l'ensemble des connecteurs un certain nombre de locutions, dont il n'est en général pas fait mention dans les études sur les connecteurs, que nous avons rencontrées dans nos corpus. En effet, le comportement de ce faisant, c'est la raison pour laquelle ou bien encore ce qui fait que est très proche de celui des connecteurs consécutifs traditionnels, et ces locutions répondent bien à la définition d'un connecteur donnée plus haut.

3.2 Donc

Donc est le marqueur prototypique de la relation de conséquence. Il semble être le plus employé (ce qui est corroboré par l'étude de nos deux corpus, voir section 1.3.2).

Donc est un marqueur spécialisé et peu équivoque2. Son sens premier est d'exprimer la conséquence3:

1MARCU (1997) distingue la fonction «phrastique» (sententialfunction) d'un connecteur, où il ne joue pas le rôle de connecteur, mais porte sur un élément de la phrase, de sa fonction «discursive» où le connecteur est utilisé en tant que tel et joue un rôle au niveau du discours.

2Cela vaut surtout pour l'écrit. Donc a un nombre d'emplois beaucoup plus important à l'oral. Voir à ce propos HYBERTIE (1996).

3Ce n'est pas le cas des autres connecteurs courants comme alors, ainsi ou aussi qui

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

(3.1) Le flux des octets de données dans le câble entre deux ports série

est bidirectionnel, il y a donc deux flux (et deux fils) différents à considérer.

En revanche, donc a aussi une autre possibilité d'emploi, dans laquelle il se rapproche très nettement du sens de «au total» ou de «bilan :»4 :

(3.2) Par un heureux télescopage, s'affiche en couverture de ce nu-

méro un article qui s'inscrit dans la lignée des travaux fondamentaux de Frédéric Joliot-Curie. Loin, très loin des applications à problèmes, les physiciens qui étudient le noyau de l'atome s'interrogent: leur discipline serait-elle à rebâtir? Dans les accélérateurs, s'accumulent en effet des observations dérangeantes et, pour en rendre compte, le modèle de comportement du noyau est de plus en plus complexe. Trop complexe, affirment certains. La physique nucléaire attendrait donc son Copernic!

Nous n'assimilons pas ce sens à un type d'expression de la conséquence. En effet, donc exprime à ce moment-là la fermeture d'une question, un bilan, ce qui n'est pas à rapprocher de la conséquence. Précisons que le donc de «bilan» relie comme le donc consécutif deux segments de discours, mais que le premier est beaucoup plus grand dans le sens de «bilan» (comparer l'exemple 3.36 avec l'exemple 3.2). De plus, le donc de «bilan» se trouve généralement dans un segment de discours placé en fin de paragraphe (ce qui est le cas de l'exemple 3.2).

Les contraintes sur donc sont dans l'état actuel des choses assez peu nombreuses5 6:

ont un sens de base autre que la conséquence et dont le sens reste toujours teinté de ce sens de base.

4Ce sens, appelé «conclusif» par HYBERTIE (1996) n'apparaît pas dans le corpus Linux Howto.

5Pour l'instant nous ne pouvons pas vraiment utiliser directement les résultats de ce

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 
 

conséquence

bilan

taille de

petit

grand

placement dans le paragraphe

libre

fin

TAB. 3.1-Donc

3.3 Alors

Alors est un connecteur assez polysémique et peut recevoir plusieurs interprétations selon sa fonction et sa distribution.

3.3.1 Fonction phrastique

Alors est tout d'abord un adverbe de temps paraphrasable par «à ce moment-là», c'est donc un adverbe temporel anaphorique qui fait référence à une période de temps:

(3.3) Ce modèle reposait sur le fait que les plus anciens Homo erectus

avaient été mis au jour en Afrique de l'Est et que les plus récents se trouvaient en Asie et en Europe. Homo erectus était alors une espèce largement distribuée dans le temps et dans l'espace et était probablement l'ancêtre des néandertaliens et, surtout des Homo sapiens sapiens , c'est-à-dire nous-mêmes.

Lorsque alors est suivi d'un participe passé, il ne peut avoir d'usage discursif, il s'agit d'un adverbe temporel:

(3.4) Pourtant, la forme «souris» de la protéine du prion (PrP) était dé-

celable chez la moitié des animaux, résultat alors jamais observé sur des souris asymptomatiques.

Alors peut aussi être précédé de jusque en quel cas il est aussi adverbe temporel:

tableau, car il faut d'abord être capable de déterminer la taille de .

6Pour une explication des conventions utilisées dans les tableaux, voir le tableau 1 p. i.

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

(3.5) Une équipe européenne a identifié, par chromatographie, un gaz

à fort effet de serre jusqu'alors inconnu.

De même, si on note la présence d'un autre connecteur introduisant la proposition où se trouve alors, il ne peut avoir une fonction phrastique:

(3.6) Pourtant la température d' un atome isolé ne signifie alors pas

grand-chose, et c'est là tout le paradoxe.

3.3.2 Alors que adversatif

Lorsque alors est suivi de que, c'est un connecteur à part entière, qui peut avoir un sens adversatif (exemple 3.7) ou temporel (exemple 3.8):

(3.7) Un véritable terminal couleur peut modifier la couleur du texte et

du fond avec plusieurs couleurs différentes alors qu'un terminal monochrome ne peut modifier que la luminosité d'une couleur donnée.

(3.8) Le tournevis glisse du contact alors que vous le poussez vers le

bas.

Dans ce cas l'expression de la conséquence n'est pas possible et nous écarterons donc tous les cas où alors sera suivi de que.

3.3.3 Alors dans les conditionnelles

Alors est très souvent employé en combinaison avec si dans les conditionnelles en si... alors (et avec quand dans le cas des conditionnelles en quand... alors), relation apparentée à la relation de conséquence (voir section 2.2.3), mais qui n'en est pas une:

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

(3.10) Quand l'écran est plein (page 1), alors les données supplémentaires venant de l'hôte vont sur la page 2.

Dans ce cas, alors ne note pas une relation de conséquence. On devra donc écarter les couples de propositions dont la deuxième est introduit par alors et la première par si ou quand des couples de propositions pouvant accepter une relation de conséquence.

3.3.4 Alors temporel vs. alors consécutif

Le sens premier de alors est de marquer une succession temporelle, comme le montre l'exemple suivant:

(3.11) Les modes par blocs peuvent comprendre une possibilité de formulaires où l'ordinateur hôte envoie un formulaire au terminal. L'utilisateur le remplit alors et envoie la touche envoi qui ne renvoie que les données du formulaire à l'ordinateur hôte.

En plus de cet usage temporel, alors prend relativement souvent une valeur consécutive7, comme c'est par exemple le cas ici:

(3.12) Après cette période d'incubation, les tsé-tsé entrent dans le compartiment des «infectantes» : le parasite est alors transmis à chaque piqûre.

La question qui se pose alors est de savoir ce qui nous permet de différencier le alors temporel du alors consécutif. Là où un simple patternmatching suffisait pour écarter le alors des conditionnelles et alors que d'une interprétation consécutive, il ne suffit plus pour distinguer sens temporel de sens consécutif.

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

Selon HYBERTIE (1996), alors en début d'énoncé est plus susceptible d'exprimer la conséquence, mais nous n'avons pas pour le moment déterminé les conditions qui permettent de distinguer bien nettement le sens consécutif du sens temporel de alors. Cela d'autant plus que l'on n'observe pas un découpage bien net entre les deux sens et qu'il est donc souvent très difficile de distinguer le alors temporel du alors consécutif, voire même parfois de alors adverbe temporel.

Ce qui semble le plus simple est de dire que l'on interprète consécutivement le connecteur alors lorsqu'il y a un lien de causalité entre ses deux arguments. Comme nous l'avons déjà dit, ce lien de causalité est très complexe à établir (voir section 2.4) dans le cadre d'un analyseur rhétorique automatique.

3.3.5 Conditions interdisant l'interprétation consécutive de alors

Il est très difficile de distinguer le alors temporel du alors consécutif (dans le tableau qui suit, ils ont les mêmes conditions d'emploi), mais en revanche il est assez facile de déterminer les conditions dans lesquelles on ne peut jamais avoir de relation de conséquence en présence du connecteur alors:

 

conséq.

temp.

cond.

advers.

phrast.

+que

-

-

-

++

-

quand/si+

-

-

++

-

-

autre connecteur

-

-

-

+

+

+ participe passé

-

-

-

-

+

TAB. 3.2-Alors

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

3.4 Ainsi

Rechercher les occurrences de ainsi et des locutions qui lui sont apparentées (de cette manière, de cette façon et de la sorte) ne suffit pas à repérer une relation de conséquence : ce n'est pas le seul emploi qui existe, et nous allons exposer les conditions qui permettent cette interprétation.

3.4.1 Ainsique

Il est important d'étudier ainsi que afin de bien le distinguer de ainsi. En effet, une simple recherche du connecteur ainsi comme marque de la conséquence dans un texte peut amener à retrouver des formes qui n'expriment pas la conséquence. C'est le cas de ainsi que, dont nous allons donner un aperçu de quelques emplois (son sens n'est jamais consécutif).

Ainsi que peut être utilisé comme substitut de la conjonction de coordination et dans son sens additif:

(3.13) La liste suivante fournit quelques liens dans cette section, ainsi que des options de communication supplémentaires positionnées uniquement sur le terminal.

Ainsi que peut aussi avoir un emploi rhétorique. Dans ce cas, il est paraphrasable par comme et il exprime une comparaison:

(3.14) Ainsi que l' indique le Dr Jean-Marie Abgrall, «le recrutement d'un adepte passe par trois phases, à partir desquelles l'adhésion va s'obtenir progressivement, en même temps qu'apparaît une forme de dépendance intellectuelle et affective. »

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

de recevoir une interprétation consécutive.

3.4.2 Ainsi et les locutions apparentées

Ainsi peut être employé de plusieurs façons différentes et peut aussi bien exprimer une relation rhétorique (conséquence ou manière) qu'avoir une fonction phrastique. Nous allons présenter ces différents emplois dans ce paragraphe ainsi que certaines locutions dont le fonctionnement est identique.

3.4.2.1 Fonction phrastique

Ainsi n'a pas pour seule vocation d'exprimer une relation de conséquence; sa vocation première est même d'exprimer la manière de façon anaphorique. En effet, ainsi reprend un élément du discours qui précède en insistant sur la manière dont il s'est déroulé.

(3.15) On constate que la masse ainsi délimitée reste de l'ordre de 2,9 106 M.

On observe deux cas où ainsi a une fonction phrastique: lorsque ainsi est sous la dépendance d'un verbe, en position de complément d'objet direct8 (exemple 3.16), ou lorsque ainsi joue le rôle d'un complément circonstanciel de manière (exemple 3.17):

(3.16) Une des raisons possibles de faire ainsi est d'économiser les factures de téléphone quand les tarifs ne sont pas symétriques.

(3.17) Souvenez-vous que d'autoriser tout le monde à monter des disques
ainsi est un trou de sécurité béant, si cela vous préoccupe.

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

Certaines locutions peuvent jouer le même rôle anaphorique que ainsi. C'est le cas de de cette manière, de cette façon et de la sorte. La paraphrase avec ces locutions peut donc servir de test pour différencier les usages où ainsi a une fonction phrastique de ceux où il a une fonction discursive:

(3.18) Souvenez-vous que d'autoriser tout le monde à monter des disques {de cette manière, de cette façon, de la sorte} est un trou de sécurité béant, si cela vous préoccupe.

3.4.2.2 Fonction discursive

Lorsqu'il est placé en tête de proposition, ainsi est quasiment toujours interprété comme connecteur consécutif.

Les cas où il ne peut s'agir d'une relation de conséquence sont les suivants:

- lorsque ainsi est suivi de que, comme nous l'avons vu à la section 3.4.1;

- et lorsque ainsi est suivi d'un participe passé. Dans ce cas il exprime la manière:

(3.19) Ainsi chauffée, la matière se transforme en plasma.

Dans tous les autres cas, ainsi en tête de proposition jouera le rôle de connecteur consécutif, devenant une marque facile à repérer:

(3.20) Un terminal texte est souvent relié au port série de l'ordinateur par l'intermédiaire d'un long câble. Ainsi, un terminal peut se situer à une distance assez grande de son ordinateur hôte.

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

couples d'énoncés suivants sont reliés par la même relation rhétorique de conséquence:

(3.21) Un terminal est relié au port série. Ainsi, il peut se situer à distance.

(3.22) Un terminal est relié au port série. Il peut ainsi se situer à distance.

Quand il n'est pas placé en tête de phrase, ainsi doit se situer juste après le verbe pour exprimer la conséquence.

Dans ce dernier cas, ainsi ne doit pas faire partie d'une proposition comportant déjà un autre connecteur, car il a alors une valeur de circonstanciel de manière:

(3.23) Les meilleures résolutions utilisées dans les études de ce type sont de l'ordre d'une centaine de kilomètres mais on ne peut simuler ainsi que quelques années d'évolution du climat.

Ici la présence du connecteur mais comme introduction de la proposition où se situe ainsi empêche son interprétation consécutive.

3.4.3 Conditions pour l'interprétation consécutive de ainsi

On interprète donc ainsi consécutivement dans deux cas: s'il est placé en début de proposition après une pause forte ou s'il se trouve immédiatement après le verbe de la proposition où il se situe, proposition ne devant pas être introduite par un autre connecteur.

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 
 

discursif

phrastique

conséquence

comparaison

manière

additif

+que

-

++

-

++

anaphore propositionnelle

++

-

-

-

présence d'un autre conn.

-

-

+

+

place

 
 
 
 

suivi d'un participe passé

-

-

+

+

TAB. 3.3-Ainsi

3.5 Aussi

3.5.1 Fonction phrastique

Aussi a deux fonctions phrastiques principales: - l'adjonction; dans ce cas il est employé seul:

(3.24) Les plus anciens, datés de 3555 avant J.-C, sont aussi les plus anciens que l'on connaisse.

- la comparaison lorsque aussi est employé corrélativement au pronom que:

(3.25) Le comportement mécanique d'objets aussi courants que des fruits ou des légumes n'avait encore jamais été modélisé rigoureusement.

Nous allons voir qu'il n'est pas difficile de distinguer ces emplois phrastiques de l'emploi discursif de aussi en observant simplement son environnement syntaxique immédiat.

3.5.2 Fonction discursive

Même si ce n'est pas dans la majorité des cas, aussi a également une fonction discursive. Il acquiert alors une valeur consécutive à laquelle est mêlée la valeur d'adjonction qu'il a comme adverbe9.

9Pour plus de détails sur la valeur de aussi consécutif, voir HYBERTIE (1996).

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

Aussi ne peut avoir de fonction discursive que lorsqu'il est placé en début de proposition. Ainsi placé, il ne peut d'ailleurs avoir d'autre fonction qu'une fonction discursive, celle d'exprimer la conséquence.

On observe deux types de constructions pouvant marquer la conséquence : soit aussi est placé en début de proposition et la proposition qu'il introduit comporte une inversion du sujet (exemple 3.26), soit aussi est suivi d'une virgule et dans ce cas il n'y a pas d'inversion du sujet (exemple 3.27):

(3.26) La contribution de l'Atlantique nord est d'environ un milliard de tonnes, celle du Pacifique nord est mineure, mais celle de l'océan Austral restait à préciser. Pourtant cet océan occupe 20 % de la superficie de l'océan mondial, aussi devenait-il urgent de s'y intéresser.

(3.27) À cette jonction de l'histoire intervient une nouvelle catégorie d'acteurs : les centres de recherche publics. Eux aussi éditent des revues savantes et eux aussi font face à des difficultés financières. Aussi, l'idée de vendre leurs revues aux éditeurs commerciaux leur apparut de plus en plus séduisante.

3.5.3 Conditions pour l'interprétation consécutive de aussi

Il est assez facile de repérer dans un texte quand aussi est employé comme connecteur consécutif, comme nous le montre le tableau suivant:

 

conséquence

phrastique

place dans

 
 

environnement ortho.

- (1) /. Aussi, (2)

-

inversion du sujet

++ (1) / - (2)

-

TAB. 3.4-Aussi

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

3.6 Marques spécialisées

En dehors des connecteurs que nous venons d'étudier, qui peuvent avoir une fonction phrastique et une fonction discursive, voire la possibilité d'exprimer plusieurs relations rhétoriques différentes selon le contexte, il existe cependant des connecteurs totalement univoques10 qui n'ont pour rôle que de marquer une relation de conséquence. Le plus utilisé d'entre eux est par conséquent, mais il en existe bien d'autres que nous allons énumérer dans cette section.

3.6.1 Conséquence pure : par conséquent

Le connecteur par conséquent est le seul qui soit complètement univoque, et donc sans problème d'interprétation. En effet, il ne peut recevoir d'autre interprétation qu'une interprétation consécutive:

(3.28) Malheureusement, les terminaux graphiques couleur pour Linux (X Window) avec des communications à grande vitesse est un marché de niche avec des prix élevés, et par conséquent dans ce cas les économies en coût de matériel, s'il y en a, seront faibles.

Cela entraîne qu'à chaque fois que l'on rencontre ce connecteur, on a une relation de conséquence, sans condition supplémentaire.

3.6.2 Connecteurs anaphoriques univoques

Un certain nombre de connecteurs reprennent anaphoriquement le contenu de la (ou des) proposition(s) qui précède(nt) et sont totalement univoques quant à la relation rhétorique qu'ils expriment11.

'°En fait, seul par conséquent est totalement univoque, les autres pouvant avoir une fonction phrastique. Mais une simple contrainte sur le positionnement résout immédiatement l'ambiguïté.

''Modulo une contrainte de placement pour certains.

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs 3.6.2.1 Ce qui fait que

Ce qui fait que ne doit pas être placé en début de phrase pour introduire une relation de conséquence

(3.29) RJ48 possède un taquet supplémentaire ce qui fait qu'une fiche RJ48 ne rentrera pas dans une prise RJ45.

(3.30) Ce qui fait qu'une fiche RJ48 ne rentrera pas dans une prise
RJ45, c'est que RJ48 possède un taquet supplémentaire.

En effet, nous avons une relation de conséquence en 3.29, où ce qui fait que n'est pas placé en début de phrase, alors qu'en 3.30, il ne s'agit pas d'une relation de conséquence.

3.6.2.2 De ce fait

On peut exprimer une relation de conséquence à l'aide de de ce fait:

(3.31) Par exemple, la proportion de repas de sang pris sur les humains n'est pas intégrée dans les SIG. Or ce terme intervient au carré dans les équations donnant la vitesse de propagation de la maladie! De ce fait, et contrairement à une idée triviale, ce paramètre est beaucoup plus important que la densité des tsé-tsé.

Il peut exister des cas où de ce fait se trouve dans une position où il n'est pas du tout un connecteur comme dans l'exemple suivant, bien que nous n'ayons pas rencontré le cas en corpus:

(3.32) Je ne suis pas au courant de ce fait.

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

3.6.2.3 Ce faisant

Ce faisant a une liberté de placement assez grande, car il peut se placer aussi bien en tête de proposition (exemple 3.34) qu'en milieu de proposition (exemple 3.33) et même en incise (exemple 3.35):

(3.33) C'est comme si on avait branché un terminal de type A sur un port série et ensuite positionné TERM sur le type B, déclarant ce faisant que le terminal est de type B.

(3.34) En assemblant des fils et des anneaux conducteurs, cette équipe a fabriqué une structure où les lois physiques qui régissent la propagation de micro-ondes sont partiellement inversées. Ce faisant, ils ouvrent la voie à la fabrication de dispositifs inédits.

(3.35) Ceux-ci se troquent au détour de contacts personnalisés et de liens privilégiés qu'entretiennent entre eux divers laboratoires, équipes et chercheurs et, ce faisant, perpétuent l'esprit originel de la République des lettres.

3.6.2.4 Dans ce cas

Dans ce cas exprime la conséquence lorsqu'il est situé en début de phrase (exemple 3.36) alors que quand il est placé librement, il a une fonction phrastique (exemple 3.37):

(3.36) Certains terminaux possèdent une option de configuration pour informer le terminal qu'aucune imprimante n'est présente. Dans ce cas le terminal ignorera toute commande qui redirigerait la sortie vers l'imprimante.

(3.37) Nous sommes seuls dans ce cas.

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

3.6.3 Reprise anaphorique de la raison

Nous avons rencontré trois connecteurs : pour cette raison (exemple 3.38), c'est pourquoi (exemple 3.40) et c'est la raison pour laquelle (exemple 3.39) qui ont pour particularité de reprendre anaphoriquement une raison. En cela, ils permettent d'introduire la conclusion d'une relation de conséquence.

(3.38) Il risque d'y avoir des problèmes si vous n'allumez pas le terminal en premier (voyez «getty se relance trop rapidement»). Pour cette raison, on devrait utiliser «stty clocal» qui est la valeur par défaut.

(3.39) Le répertoire /bin dispose lui aussi de droits d'accès: cf. «Droits d'accès aux répertoires» pour plus d'informations. C'est la raison pour laquelle vous ne pouvez pas effacer le fichier /bin/ls à moins d'être root.

(3.40) Dans les métaux, qui contiennent des charges électriques «libres» de se déplacer, la perméabilité magnétique reste positive, mais la permittivité électrique est négative pour les fréquences inférieures à un seuil, nommé «fréquence de résonance plasma». Les ondes électromagnétiques ne peuvent alors pas s'y propager. C'est pourquoi les ultraviolets traversent les métaux, tandis que la lumière visible ou les ondes hertziennes, dont les fréquences sont beaucoup plus petites, se réfléchissent à la surface.

Il existe une contrainte de placement forte sur ces connecteurs: ils doivent se placer en début de phrase (après une marque de ponctuation forte). S'ils se trouvent dans une autre position, ils n'auront pas un sens consécutif comme on le voit ici:

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

(3.41) Ce qui m'échappe, c'est la raison pour laquelle être une personne potentielle conférerait un droit spécial de vivre.

(3.42) Dès les années 1960 on suggéra que les trous noirs supermassifs pouvaient être à la source de l'incomparable puissance des noyaux actifs de galaxies pour cette raison.

3.6.4 Récapitulation

Nous avons regroupé tous les connecteurs consécutifs «univoques» dans le tableau suivant:

 

environnement ortho.

place dans

par conséquent

-

 

ce qui fait que

[, | Ø] x

 

decefait

-

 

ce faisant

-

 

dans ce cas

. X

 

reprise de la raison

. X

 

TAB. 3.5 - Les connecteurs univoques

3.7 Conclusion

Avec ce que nous venons de voir dans ce chapitre, nous avons pu nous apercevoir que les connecteurs dans leur grande majorité, bien que présentés comme marques univoques d'une relation rhétorique, ne sont pas toujours univoques. Mieux encore, il est parfois très difficile de distinguer entre différents sens d'un même connecteur, mais on peut dans une grande partie des cas lever les ambigüités en observant de plus près l'environnement et les arguments du connecteur.

Maintenant que nous avons vu les moyens «classiques», ou du moins classiquement cités, d'exprimer la relation de conséquence, nous allons

3. Les marqueurs spécifiques de la relation de conséquence : les connecteurs

 

nous attarder sur les autres moyens de le faire qui sont à notre disposition.

Chapitre 4

Autres moyens de signaler une

relation de conséquence

Il existe un certain nombre d'études concernant les connecteurs de conséquence du français (voir en particulier ROSSARI et JAYEZ (1996), JAYEZ et ROSSARI (1997), HYBERTIE (1996) ou encore FORGET (1984)), mais la question des autres moyens de marquer la conséquence n'a -- à notre connaissance -- pas encore été étudiée. Nous allons donc, après avoir justifié la nécessité d'aborder les moyens de marquer une relation de conséquence autres que les connecteurs, étudier quelques indices qui nous permettent de repérer une relation de conséquence, notamment le participe présent, la relative ou encore l'anaphore propositionnelle.

4.1 Les connecteurs ne suffisent pas à déterminer la structure rhétorique d'un texte

Pour construire automatiquement à l'aide d'un système informatique la structure rhétorique d'un texte, on peut se baser sur la recherche d'indices de ces relations. Les indices privilégiés d'une relation rhétorique sont les connecteurs (voir chapitre 3), qui nous viennent en premier à l'esprit. Il est possible d'élaborer un système ne reposant que sur ces connec-

4. Autres moyens de signaler une relation de conséquence

 

teurs, comme le fait par exemple Daniel Marcu dans MARCU (1997). Mais il se pose à ce moment-là un problème: il est impossible d'obtenir une analyse rhétorique complète d'un texte (bien que Marcu estime que cela est suffisant pour les buts qu'il s'est assignés, autrement dit le résumé automatique). En effet, il existe bien d'autres moyens de marquer une relation rhétorique que les connecteurs', et il faut évidemment prendre en compte ces autres moyens pour s'approcher le plus possible d'une représentation rhétorique complète d'un texte.

Nous nous attacherons particulièrement aux moyens purement linguistiques, hormis les connecteurs, qui nous permettent d'interpréter la relation qui relie un couple de segments de discours comme une relation consécutive, bien que d'autres mécanismes puissent parfois entrer en jeu, comme l'appel à nos connaissances de sens commun et aux lois causales (voir section 2.4). Il nous semble en effet qu'il est moins coûteux pour un système informatique de se baser sur une analyse linguistique fine plutôt que de faire appel à des connaissances extra-linguistiques, difficiles à appréhender et à modéliser, et beaucoup trop nombreuses à prendre en compte.

Contrairement aux cas où l'on est en présence de marques lexicales d'une relation rhétorique, les connecteurs, qu'il suffit de repérer pour connaître la relation rhétorique qu'ils expriment, on doit en l'absence de connecteurs prendre en compte un nombre de contraintes beaucoup plus important et faire une analyse beaucoup plus fine afin de repérer une telle relation.

Contrairement aux connecteurs qui sont utilisés pour marquer une

1Il semble que la fréquence d'emploi des connecteurs varie selon le genre discursif (journalistique, technique, juridique) : les textes juridiques emploient les connecteurs en nombre afin d'éviter au maximum les écarts d'interprétation, alors que le style journalistique est lui plutôt caractérisé par un emploi très réduit des connecteurs, favorisant plutôt la fluidité du style.

4. Autres moyens de signaler une relation de conséquence

 

relation rhétorique, les autres façons de marquer une relation de conséquence ne sont pas aussi simples à repérer. En effet, c'est un ensemble d'éléments qui vont nous permettre de faire une interprétation consécutive d'un couple de propositions. Nous rechercherons donc maintenant la présence d'indices; indices, qui, en combinaison avec d'autres indices et seulement à ce moment-là permettent l'interprétation consécutive.

Nous commencerons donc par un moyen utilisé assez fréquemment pour marquer la conséquence: le participe présent.

4.2 Participe présent

Le participe présent peut en français exprimer une relation de conséquence, bien que d'autres relations puissent être exprimées grâce à lui2.

L'exemple suivant montre un cas d'expression de la conséquence à l'aide d'un participe présent:

(4.1) La bombe atomique est venue augmenter la confusion générale à l'égard de la Science, portant cette confusion jusque chez les savants eux-mêmes.

Partant de ce constat, il va nous falloir trouver les conditions dans lesquelles l'usage d'un participe présent permet ou non l'interprétation consécutive. Pour ce faire, nous allons étudier l'environnement du participe présent dans les cas où il n'exprime pas une relation de conséquence et nous en déduirons dans quel cas il peut l'exprimer.

2L'anglais quant à lui fait un usage intensif du participe présent en -ing pour exprimer la conséquence. Le participe présent est dans cette langue plus univoque qu'en français (voir CORSTON-OLIVER (1998b)).

4. Autres moyens de signaler une relation de conséquence

 

4.2.1 Le gérondif

Le participe présent n'est pas à confondre avec le gérondif, qui est une construction constituée du pronom en suivi d'un participe présent. Le gérondif ne peut pas marquer la conséquence: les relations rhétoriques qu'il est susceptible d'exprimer sont les relations de cause (exemple 4.2) et de manière (exemple 4.3) :

(4.2) En transfectant son gène, les chercheurs ont laissé la glycopro-

téine s'exprimer dans des cellules endothéliales.

(4.3) Tuez ensuite l'ancien getty en utilisant la touche k dans «top».

Nous pouvons donc exclure très simplement les participes présents faisant partie d'un gérondif de l'expression de la conséquence en éliminant les cas où le participe est précédé du pronom en.

4.2.2 Incise et déterminative

Après avoir exclu de l'expression de la conséquence les gérondifs, nous allons maintenant nous pencher sur deux constructions impliquant un participe présent, mais qui n'expriment pas une relation de conséquence: les incises et les déterminatives.

L'exemple suivant montre une proposition comprenant un participe présent qui est en incise:

(4.4) Trois articles, émanant de deux groupes de recherche, suggèrent que ce serait notre galaxie qui prendrait la première place.

Nous ne pouvons pas y voir une relation de conséquence: l'incise vient simplement ajouter une information supplémentaire sur un groupe nominal, en l'occurrence elle vient préciser la nature des trois articles. L'incise ne peut pas marquer une relation de conséquence parce qu'elle ne peut

4. Autres moyens de signaler une relation de conséquence

 

déjà pas marquer une relation rhétorique. En effet, elle vient compléter un groupe nominal et n'est pas en relation avec une autre proposition (une relation rhétorique est une relation entre deux propositions, ou du moins entre deux éventualités que le GN n'exprime pas ici).

L'autre construction qui n'est pas susceptible d'exprimer la conséquence est la déterminative3:

(4.6) Le terminal ressemble à une fenêtre donnant sur l'ordinateur.

Nous avons le même genre de problématique que pour l'incise avec la déterminative: elle n'exprime pas une relation rhétorique. La déterminative est facile à repérer car elle n'est jamais séparée du groupe nominal qu'elle complète par une marque de ponctuation, et à chaque fois que l'on rencontre un participe présent suivant immédiatement un groupe nominal (sans ponctuation intermédiaire), il s'agira d'une déterminative.

En observant ces deux constructions, on peut préciser un peu plus les conditions dans lesquelles on peut interpréter consécutivement une construction comprenant un participe présent. Le fait qu'un participe présent n'étant pas précédé d'une marque de ponctuation exprime toujours une déterminative nous indique que le participe présent devra toujours être précédé d'une marque de ponctuation. Dans le cas où le participe présent est précédé d'une marque de ponctuation, il faudra repérer les cas d'incise pour les exclure. Quoi qu'il en soit, les deux arguments de la relation de conséquence devront être des propositions complètes.

3Nous appelons cette construction déterminative en référence aux relatives déterminatives. En effet, cette construction est paraphrasable par une relative déterminative:

(4.5) Le terminal ressemble à une fenêtre qui donne sur l'ordinateur.

4. Autres moyens de signaler une relation de conséquence

 

4.2.3 Participe présent, cause et conséquence

Comme nous venons de le voir, un participe présent qui se trouve dans une incise ou dans une déterminative n'est pas susceptible d'exprimer la conséquence.

Dans les autres cas, le participe présent peut marquer la conséquence, mais est aussi susceptible de dénoter une relation de cause. Nous allons donc voir ce qui permet de différencier les deux usages.

Le premier critère est la position: un participe présent situé en début de phrase (après un point) ne peut marquer la conséquence:

(4.7) Poussant plus loin l'investigation, les chercheurs ont trouvé des

traces de réplication du prion et de neurodégénérations spongiformes.

Les critères que nous venons d'exposer doivent encore être affinés, car si on les respecte, on peut toujours avoir aussi bien une relation de cause qu'une relation de conséquence. Nous compléterons ces critères par des contraintes de deux ordres: une contrainte positionnelle et une contrainte sémantique.

Nous allons commencer par la contrainte positionnelle. En effet, le participe présent doit être placé immédiatement après la virgule pour que l'on ait une relation de conséquence:

(4.8) Le SCI projeta donc en pleine lumière une collection de revues

qui, jusque-là, n'était jamais apparue autrement que fragmentée, chaque élément appartenant à une spécialité ou discipline particulière.

(4.9) Au-dessus d'une certaine intensité, des pores apparaissent à la

surface des membranes cellulaires, entraînant la mort des cellules.

4. Autres moyens de signaler une relation de conséquence

 

L'exemple 4.8 exprime effectivement la cause alors que l'exemple 4.9, où le participe suit immédiatement la virgule, exprime la conséquence.

Cette contrainte positionnelle doit encore être complétée par une contrainte sémantique sur le verbe au participe présent pour bien distinguer les cas

où l'on peut exprimer la conséquence à l'aide d'un participe présent. En effet, le verbe au participe présent ne doit jamais exprimer un état:

(4.10) Nous y observons des hommes morphologiquement proches de ceux présents en Afrique de l'Est il y a 1,8 million d'années, vivant dans un environnement et parmi une faune similaires.

Ici nous avons une relation d'élaboration, et non de conséquence.

Il reste donc le cas où le participe présent précédé d'une virgule exprime un événement:

(4.11) Lorsque le légume est encore frais, l'économe glisse facilement, enlevant une épaisseur régulière de peau.

Nous avons maintenant bien circonscrit les conditions nécessaires pour que l'on interprète consécutivement une construction comprenant un participe présent : le participe présent doit se situer après une virgule le séparant d'une proposition complète. De plus, il doit exprimer un événement et ne pas se trouver en incise.

4.2.4 Participe présent suivi d'un connecteur

Le participe présent exprimant la conséquence est très fréquemment accompagné d'un connecteur «anaphorique», comme ainsi, ou cefaisant, qui lui est postposé:

(4.12) C'est comme si on avait branché un terminal de type A sur un port série et ensuite positionné TERM sur le type B, déclarant ce faisant que le terminal est de type B.

4. Autres moyens de signaler une relation de conséquence

 

(4.13) Les messages du système peuvent aussi être écrits directement à l'adresse matérielle de la console, court-circuitant ainsi /dev/tty0.

(4.14) On rapporte souvent cette valeur à l'effectif des populations humaines, obtenant ainsi le paramètre «RVH» (pour Rapport des effectifs de Vecteurs sur les effectifs Humains)

Dans ce cas précis, l'interprétation est totalement univoque, autant du point de vue du participe présent que de ainsi.

4.2.5 Conditions d'emploi du participe présent dans une construction consécutive

Nous avons réuni dans le tableau suivant les conditions dans lesquelles un participe présent peut participer à l'établissement d'une relation de conséquence:

 

conséquence

élaboration

moyen

cause

verbe de

changement d'état

état

libre

libre

env. ortho.

, XXXant

, XXXant

libre

libre

gérondif

-

-

++

+

p.pr.dans

-

-

+

+

p.pr.dans

++

++

+

+

conn. cons.

+

-

-

-

TAB. 4.1 - Participe présent

4.3 Anaphore propositionnelle et conséquence

Certains procédés jouent un rôle dans l'expression de la conséquence. C'est le cas de l'anaphore propositionnelle. Les pronoms ceci et cela expriment souvent une anaphore propositionnelle, et c'est donc en recherchant leur présence qu'on a des chances de trouver une relation de

4. Autres moyens de signaler une relation de conséquence

 

conséquence. Il va donc falloir trouver les indices supplémentaires qui permettent cette interprétation en présence des pronoms ceci ou cela.

4.3.1 Les pronoms anaphoriques ceci et cela et l'anaphore propositionnelle

Les pronoms anaphoriques ceci et cela sont employés pour reprendre un élément déjà posé dans le discours, en général un groupe nominal:

(4.15) Mais d'un autre côté je ne vois pas vraiment pourquoi cela / ceci nous gêne.

Cependant, il existe une autre possibilité d'emploi de ces pronoms ana-
phoriques, l'anaphore ne portant pas alors sur un groupe nominal, mais
sur une proposition entière. On parle alors d'anaphore propositionnelle:

(4.16) Plus ils sont soûls, plus le nombre de configurations qu'ils donnent à voir à leur commandant est élevé. Cela fait pour le moins désordre...

Dans ce cas dans nos corpus4, le pronom anaphorique sera toujours placé en début de proposition, séparée par une marque de ponctuation de la proposition qui la précède.

Or il se trouve que quand ils expriment une anaphore propositionnelle, les pronoms ceci et cela5 acquièrent un rôle discursif que nous allons étudier.

4C'est le cas dans nos corpus, mais on peut très bien imaginer le cas où ceci / cela est précédé d'un adverbial:

(4.17) Plus ils sont soûls, plus le nombre de configurations qu'ils donnent à voir à

leur commandant est élevé. Évidemment cela fait pour le moins désordre...

5Il existe d'autres moyens de marquer une anaphore propositionnelle, comme par exemple un adjectif démonstratif suivi d'un groupe nominal:

(4.18) Plongés dans ce potentiel, tous les autres nucléons subissent cette déforma-

tion, et leurs orbitales réagissent en se déformant à leur tour. Cette réaction peut amplifier le phénomène de déformation spontanée.

4. Autres moyens de signaler une relation de conséquence

4.3.2 Propositions introduites par ceci et cela : élaboration vs. conséquence

En tant que marqueurs d'anaphore propositionnelle, ceci et cela sont des indices d'une relation rhétorique lorsqu'ils sont placés en début de proposition. Mais cette relation n'est pas toujours la même : elle peut être une entre relation de la conséquence ou une simple élaboration (au sens de MANN et THOMPSON (1987)).

Précisons que ces pronoms anaphoriques peuvent entrer dans une construction exprimant la condition, lorsque la proposition précédente est introduite par si ou quand:

(4.19) Si le démarrage ne réussit pas, ceci ne sera d'aucun utilité.

(4.20) Quand on la met sur Meta, cela en fait une touche Meta qui positionne le bit de haut rang sur chaque octet.

Il est donc facile d'écarter ces constructions lors d'une recherche automatique.

De toute façon, ceci et cela ne peuvent exprimer l'anaphore propositionnelle que s'ils sont précédés d'une marque de ponctuation forte (point ou point-virgule).

Quand elle est précédée d'une marque de ponctuation forte, une proposition introduite par ceci ou cela exprime généralement une relation d'élaboration (4.21) ou, c'est ce qui nous intéresse, une relation de conséquence (4.22):

(4.21) Il peut paramétrer le temps de fonctionnement du port après sa fermeture. Cela est nécessaire à des vitesses basses de 1200 et moins.

Dans ce cas, l'interpération consécutive est également possible. Cependant, nous en resterons pour le moment aux pronoms démonstratifs ceci et cela, la problématique de l'anaphore propositionnelle étant bien trop vaste.

4. Autres moyens de signaler une relation de conséquence

 

(4.22) Vous pouvez essayer de taper soit «reset» soit «setterm -reset». Ceci enverra la chaîne de ré-initialisation à partir de l'entrée du terminal dans la base terminfo.

Il semble que ce qui nous permet de distinguer entre conséquence et élaboration est contenu dans la sémantique du verbe.

En effet, en présence d'un verbe d'état comme dans l'exemple 4.21 la seule interprétation possible est l'élaboration. En revanche, en présence d'un verbe efficient comme dans l'exemple 4.22 l'interprétation sera consécutive.

C'est donc la position du pronom anaphorique dans la proposition et la sémantique du verbe de cette proposition qui nous permet de déterminer les conditions dans lesquelles une relation de conséquence peut être exprimée en présence de ceci et cela.

4.3.3 Récapitulation

Lorsqu'on rencontre une proposition introduite par ceci ou cela, on a des chances de se trouver dans un cas de figure où une relation rhétorique est exprimée. Nous récapitulons donc dans le tableau suivant quels indices supplémentaires permettent une interprétation consécutive:

 

conséquence

condition

phrastique

 

changement d'état

libre

libre

env. ortho.

[.; :] (ceci | cela)

, (ceci | cela)

libre

si ou quand dans

-

++

+

TAB. 4.2 - Anaphore propositionnelle

4.4 La relative

4. Autres moyens de signaler une relation de conséquence

 

surtout est utilisée: les relatives continuatives et les relatives dont l'antécédent est un pronom relatif anaphorique de la proposition qui précède.

4.4.1 Qui

On peut exprimer une relation de conséquence à l'aide d'une relative d'un type particulier, la relative continuative, comme le montre l'exemple suivant:

(4.23) Vous pouvez essayer de lui envoyer un signal 9 à partir de top qui devrait le forcer à s'arrêter.

Par une paraphrase avec donc, on voit bien la valeur consécutive que prend la relative:

(4.24) Vous pouvez essayer de lui envoyer un signal 9 à partir de top. Cela devrait donc le forcer à s'arrêter.

(4.25) Il ne quittera vraisemblablement la tête du classement que frappé par la limite d'âge de 2 ans, qui le fera sortir de la base de données Hot Papers.

Les relations de conséquence marquées par une relative continuative sont très rares (seulement deux occurrences dans nos corpus), il nous a donc été difficile de déterminer des critères permettant leur interprétation consécutive. De plus, il nous semble que cette forme est simplement compatible avec l'expression de la conséquence plutôt qu'un moyen d'exprimer cette relation rhétorique. En revanche, un autre type de relative justifie plus qu'on la considère comme moyen d'expression de la conséquence: les relatives introduites par ce qui.

4.4.2 Ce qui

Les relatives introduites par ce qui permettent l'expression de la conséquence:

(4.26) Compter le nombre d'articles plutôt que leur qualité incite à produire des textes saucissonnés et contribue à augmenter le nombre de revues, ce qui accentue la crise actuelle.

En fait, ces relatives ont comme antécédent le pronom ce qui reprend anaphoriquement la proposition qui précède. On peut à ce propos faire un parallèle avec les propositions introduites par cela ou ceci, avec lesquelles elles sont complètement interchangeables, comme le montre l'exemple suivant paraphrasant l'exemple 4.26:

(4.27) Compter le nombre d'articles plutôt que leur qualité incite à produire des textes saucissonnés et contribue à augmenter le nombre de revues. Ceci / cela accentue la crise actuelle.

De même, si elle est placée en début de phrase après un point, une proposition introduite par ce qui se substituera à un groupe nominal:

(4.28) Ce qui se passe généralement est que ce qui est tapé au clavier est envoyé directement à l'ordinateur hôte uniquement qui en retour renvoie au terminal chaque caractère qu'il reçoit.

La partie anaphorique, le pronom ce, doit reprendre la proposition qui précède et non constituer un «substitut» nominal:

(4.29) Une routine fait une vérification pour déterminer ce qui vient de se passer.

(4.30) Tout ce qui a été tapé à toute vitesse est exécuté.

(4.31) Il s'agit d'un mâle, ce qui n'est pas particulièrement un atout, alors qu'il reste aujourd'hui quatre mâles et une seule femelle dans cette population.

La seule possibilité de placement de ce qui est donc après une virgule en début de proposition. De plus, le verbe de cette proposition ne doit pas être un verbe d'état sans quoi on n'aurait plus une relation de conséquence:

(4.32) On peut utiliser stty pour configurer le comportement de ce terminal, ce qui comprend l'arrêt de tout ou partie de cette fonctionnalité.

Voici donc un tableau reprenant les conditions dans lesquelles on peut avoir une relation de conséquence en présence de ce qui:

 

conséquence

elaboration

phrastique

verbe de

changement d'état

état

libre

env. ortho.

, ce qui

, ce qui

[A,] ce qui

incise

-

+

-

TAB. 4.3 - Relative

4.5 Syllogisme

On rencontre régulièrement dans les textes des raisonnements en trois temps, que l'on appelle classiquement syllogismes.

Le cas le plus typique de syllogisme est de la forme or donc , comme le montre ce grand classique:

(4.33) Tous les hommes sont mortels. Or Socrate est un homme. Donc Socrate est mortel.

Dans ce cas, la conséquence est marquée de façon explicite par le connecteur donc, mais il arrive souvent qu'elle ne soit pas marquée. À ce moment-là, seul le or reste:

(4.34) Au-dessus d'une certaine intensité, des pores apparaissent à la surface des membranes cellulaires, entraînant la mort des cellules et ce, d'autant plus facilement que celles-ci sont grosses. Or les cellules souches sont très petites: un choix judicieux de l'intensité permet de les épargner.

La conclusion du syllogisme est séparée de la proposition marquée par or par deux points ou par un point.

On peut donc facilement circonscrire les triplets de propositions exprimant un syllogisme en repérant la marque lexicale or6, ce qui nous permet de délimiter simplement la relation de conséquence qui lui correspond.

Cependant toutes les constructions avec or n'expriment pas un syllogisme, bien qu'il semble que ce soit généralement le cas:

(4.35) Les tsé-tsé mâles et femelles «susceptibles» s'infectent en piquant un malade. Or il faut environ vingt jours pour que le parasite atteigne les glandes salivaires de la mouche. C'est un temps relativement long pour un vecteur qui a une durée de vie moyenne de un mois!

Il nous restera donc à trouver les indices qui permettent de distinguer un or amenant une conséquence d'un or qui n'en amène pas.

Il existe aussi quelques constructions proches de celles impliquant la présence de or, comme par exemple des constructions en « toutefois : »:

4. Autres moyens de signaler une relation de conséquence

 

(4.36) Faute d'informations, les modélisations supposent habituellement que la structure est analogue à celle que l'on observe après un certain temps de croissance. Toutefois, les premières observations microscopiques directes révèlent que ce n'est pas toujours vrai [.. .]. Il faudra sans doute réviser quelques modèles.

Les contraintes pour l'interprétation consécutive dans le cas d'un syllogisme sont donc très simples:

conséquence

+ `or' +

TAB. 4.4 - Syllogisme

4.6 La juxtaposition et la coordination

La relation de conséquence peut être exprimée alors qu'aucun des indices que nous avons établis dans ce chapitre et le chapitre précédent ne sont présents. Après avoir étudié ces constructions où l'on peut repérer des indices, nous allons maintenant brièvement parler des autres cas où une relation de conséquence peut être exprimée: la coordination avec la conjonction de coordination et et la simple juxtaposition de deux phrases.

En présence d'une simple juxtaposition, on peut tout à fait avoir une relation de conséquence:

(4.37) Les claviers pour diverses marques et modèles de terminaux ne sont pas toujours interchangeables. On obtient parfois un clavier «incompatible» qui fonctionne en partie sur un terminal.

4. Autres moyens de signaler une relation de conséquence

 

(4.38) La mémoire vidéo à l'intérieur du terminal peut ne pas retenir les deux sessions et vous pouvez avoir besoin de rafraîchir l'écran en basculant sur l'autre session

Nous ne creuserons pour l'instant pas plus avant ces cas de juxtaposition et ce coordination: en effet, il nous semble indispensable d'avoir recours à des connaissances extra-linguistiques afin de pouvoir interprêter la relation entre deux segments de discours comme relation de conséquence.

4.7 Verbes modaux

Il existe un moyen d'exprimer l'inférence en français, moyen que nous avons aperçu à la section 2.3 : l'utilisation de verbes modaux. Le fait qu'une inférence soit marquée à l'aide de ces verbes modaux permet de renforcer l'interprétation consécutive quels que soient les indices repérés. Et même dans le cas où aucun indice n'est présent, ils permettent d'assigner une forte probabilité d'avoir une relation de conséquence entre un couple de propositions dont la deuxième est un verbe modal.

Commençons par le verbe pouvoir. Il peut aider l'interprétation consécutive, comme on le voit dans l'exemple suivant où les deux propositions qui entrent dans la composition d'une relation de conséquence sont simplement coordonnées par et:

(4.39) La mémoire vidéo à l'intérieur du terminal peut ne pas retenir les deux sessions et vous pouvez avoir besoin de rafraîchir l'écran en basculant sur l'autre session.

Le verbe devoir dans son usage modal a la même propriété, celle de nous diriger un peu plus vers une interprétation consécutive:

4. Autres moyens de signaler une relation de conséquence

 

Les modaux devoir et pouvoir peuvent également être utiles pour désambigüiser un connecteur équivoque comme alors, qui dans l'exemple suivant ne peut être interprêté temporellement:

(4.41) Le second embranchement comporte une série de branches avec des Homo sapiens «archaïques», puis l'homme moderne et la lignée néandertalienne. Tout cet ensemble de branches pourrait alors être nommé Homo sapiens.

Comme nous l'avons vu à la section 2.3, les verbes modaux ne sont pas toujours modaux et il existe un grand nombre de cas où ils n'expriment pas une inférence. Nous n'avons pas le temps dans ce mémoire d'aller plus avant pour trouver les conditions qui permettent d'interpréter de façon inférentielle ces verbes, mais nous sommes conscient qu'il sera important par la suite de les prendre en compte.

4.8 Bilan

Ce chapitre nous a montré qu'il existe d'autres moyens d'exprimer la conséquence que les connecteurs. Il s'agit alors d'un système complexe d'indices qui interagissent entre eux, mais que l'on peut réunir afin de pouvoir faire une analyse automatique de la relation de conséquence.

Nous devrons donc réunir tous ces indices ainsi que les contraintes sur les connecteurs consécutifs pour pouvoir implémenter un programme de reconnaissance automatique de la relation de conséquence. C'est ce que nous allons présenter dans le chapitre suivant.

Chapitre 5

Implémentation

Les résultats obtenus grâce à l'analyse de corpus étaient dès le départ destinés à être utilisés dans un système de repérage automatique de la relation de conséquence.

Nous proposons donc ici de décrire le fonctionnement de l'illustrateur implémentant les éléments déterminants pour l'interprétation consécutive que nous aurons préalablement réunis dans la première section de ce chapitre.

5.1 Les paramètres à prendre en compte pour l'analyse de la relation de conséquence

Dans notre mémoire de maîtrise (DRUON (2000)), nous nous étions attardé sur une façon de marquer une relation de conséquence: l'usage de connecteurs consécutifs, dont nous avons étudié quelques spécimens. Mais, nous l'avions déjà signalé, il existe d'autres moyens d'exprimer la conséquence en français, même si ce n'est pas exprimé lexicalement comme c'est le cas quand on utilise un connecteur.

Nous allons maintenant envisager les différents points qu'il est important d'analyser pour dégager ce qui permet de discriminer dans un texte une relation de conséquence.

5. Implémentation

 

5.1.1 En présence d'un connecteur

L'élément le plus facile à repérer pour analyser la relation de conséquence sont les connecteurs. Les connecteurs n'étant pas tous totalement univoques, il est nécessaire d'ajouter quelques contraintes pour désambigüiser leur usage.

5.1.1.1 Contrainte positionnelle

Selon la position qu'il occupe dans la proposition, un connecteur est susceptible d'avoir un sens différent, ou une fonction phrastique plutôt que discursive:

(5.1) Tu ne m'en a pas parlé. De ce fait, je ne suis pas au courant.

(5.2) Tu ne m'en as pas parlé. Je ne suis pas au courant de ce fait.

Ici, la position de de ce fait dans l'énoncé lui donne un sens différent: placé en début de phrase (exemple 5.1), c'est un connecteur de conséquence, alors que placé ailleurs dans l'énoncé, il occupe une fonction syntaxique dans la phrase (exemple 5.2).

5.1.1.2 Environnement immédiat

Deux types de contraintes sont à chercher dans l'environnement immédiat du connecteur:

- La ponctuation qui l'entoure;

- Des mots qui sont susceptibles de l'entourer.

Le premier cas, l'observation de la ponctuation environnante, permet d'occulter les emplois non-consécutifs de dans ce cas par exemple. En effet, dans ce cas ne peut être susceptible d'introduire une relation de conséquence que lorsqu'il est précédé d'un point:

5. Implémentation

 

(5.3) Certains terminaux possèdent une option de configuration pour

informer le terminal qu'aucune imprimante n'est présente. Dans ce cas le terminal ignorera toute commande qui redirigerait la sortie vers l'imprimante.

Le second cas nous permet d'écarter toutes les occurrences de alors ou de ainsi suivies de la conjonction que qui dans ce cas n'expriment pas la conséquence:

(5.4) La liste suivante fournit quelques liens dans cette section, ainsi

que des options de communication supplémentaires positionnées uniquement sur le terminal.

(5.5) MS Windows utilise ANSI alors qu'Internet utilise souvent Latin-

1.

5.1.1.3 Contrainte syntaxique

Il existe aussi des contraintes syntaxiques, comme par exemple l'inversion du sujet après aussi pour qu'il reçoive une interprétation consécutive:

(5.6) La contribution de l'Atlantique nord est d'environ un milliard de

tonnes, celle du Pacifique nord est mineure, mais celle de l'océan Austral restait à préciser. Pourtant cet océan occupe 20 % de la superficie de l'océan mondial, aussi devenait-il urgent de s'y intéresser.

5.1.2 En l'absence d'un connecteur

5. Implémentation

 

dice en présence duquel il est possible de trouver une relation de conséquence, et cette indice associé à d'autres facteurs permettra l'interprétation consécutive.

5.1.2.1 Repérage d'un indice

Le repérage d'un indice de la relation de conséquence, comme par exemple un participe présent, ne pose pas plus de problème que celui d'un connecteur. Un simple pattern-matching suffit.

5.1.2.2 Contrainte positionnelle

Tout comme pour les connecteurs, les indices peuvent ne participer à l'expression de la conséquence que lorsqu'ils sont dans une certaine position.

Par exemple, un participe présent devra toujours être placé en début de proposition et pas en début de phrase, auquel cas on ne pourrait avoir une relation de conséquence:

(5.7) Poussant plus loin l'investigation, les chercheurs ont trouvé des

traces de réplication du prion et de neurodégénérations spongiformes.

5.1.2.3 Contrainte sur l'aspect et le type du verbe

Une nouvelle contrainte qu'on n'avait pas rencontrée avec les connecteurs est la contrainte sur l'aspect et le type du verbe qui permet de distinguer la plupart du temps entre relation de conséquence (exemple 5.9) et relation d'élaboration (exemple 5.8):

5. Implémentation

 

rapide de la bibliothèque de Princeton du projet Tulip.

(5.9) Dans les modèles les plus courants, la résolution est plutôt de

l'ordre de quelques centaines de kilomètres. Cela permet de comptabiliser les dépressions et de les classer en fonction de leur intensité.

5.1.3 Avec l'un ou l'autre

Certains éléments dans l'entourage de l'indice (que ce soit un connecteur ou autre) permettent parfois de déterminer le choix de l'interprétation consécutive. C'est par exemple le cas des marques de l'inférence comme les verbes modaux qui permettent souvent de donner une inteprétation consécutive là on on pourrait hésiter (voir à ce sujet la section 4.7).

5.1.4 Récapitulation

Nous récapitulons dans le tableau suivant les grands types de contraintes sur les indices selon leur type:

 

avec connecteur

sans connecteur

Contrainte positionnelle

+

+

Environnement immédiat

+

-

Aspect / type du verbe

-

+

Présence d'un modal

+

+

TAB. 5.1 - Contraintes utilisées

5.2 Préalables à l'analyse automatique de la relation de conséquence: étiquetage morpho-syntaxique et lemmatisation

5.2.1 Nécessité d'un étiquetage morpho-syntaxique

Avant de pouvoir réaliser l'analyse de la relation de conséquence proprement dite, le texte d'entrée du système doit être étiqueté et lemmatisé. Cet étiquetage est nécessaire pour plusieurs raisons:

- Éviter une grande partie de la tâche de segmentation

- Pouvoir éliminer facilement certains cas. Par exemple, dans les cas où alors fait partie d'une conjonction de subordination, il est étiqueté en tant que tel:

alors CON sub part1

(5.10)

que CON sub part2

- Repérer la présence d'un verbe pour délimiter une proposition

5.2.2 Choix du système d'étiquetage

Afin de réaliser l'opération d'étiquetage morpho-syntaxique, nous avons choisi d'utiliser TreeTagger, un étiqueteur réalisé à l'IMS de Stuttgart1

Il est disponible en plusieurs langues, notamment le français. Cet étiqueteur est libre de droits et parmi les plus efficaces des étiqueteurs non-commerciaux. Il est disponible gratuitement au téléchargement à l'adresse suivante:

http://www.ims.uni-stuttgart.de/projekte/TreeTagger/

DecisionTreeTagger . html

'Voir SCHMID (1994) pour le principe.

5. Implémentation

 

De plus, nous utilisons un lemmatiseur qui reconnaît le jeu d'étiquettes de TreeTagger, ce qui fait que l'association des deux est intéressante.

Ce lemmatiseur, Flemm, est un programme PERL développé à l'université de Nancy 2 par Fiammetta Namer, et il permet de lemmatiser les mots d'un textes à partir du jeu d'étiquettes de TreeTagger.

Une page de présentation avec une courte présentation de son fonctionnement est disponible à:

http://www.univ-nancy2.fr/pers/namer/Telecharger_Flemm.htm

5.3 Choix du langage de programmation: PERL

Pour implémenter notre système, il nous fallait choisir un langage de programmation.

Nous avons opté pour PERL, qui nous semblait le plus adapté:

- C'est un langage qui permet d'obtenir rapidement un illustrateur;

- La tâche de traitement textuel que nous avons à réaliser est gran-

dement facilitée et simplifiée en utilisant ce langage qui permet une

gestion des chaînes de caractères sans obstacle et implémente les

expressions régulières;

- Il est simple de créer une interface graphique conviviale et de faire une démonstration sur Internet à l'aide des extensions CGI du langage et d'un navigateur.

5.4 Présentation du système

Le repérage d'une relation de conséquence ne se passera pas de la même manière selon qu'elle est introduite par un connecteur ou que d'autres indices sont utilisés. Néanmoins, la délimitation des arguments

de la relation passe souvent par le repérage d'une proposition.

Nous présentons dans cette section les algorithmes qui sont à la base de notre système. Il faut préciser que nous avons essayé de les simplifier au maximum afin d'en faciliter la compréhension, ce qui fait que la cohérence n'est pas toujours respectée. De plus, l'implémentation des algorithmes est souvent plus complexe que les algorithmes en question2.

signification

Nous présentons dans le tableau suivant les fonctions de base de l'illustrateur que nous utiliserons dans les algorithmes présentés par la suite : fonction

prop_G

prop_G (argument) prop_D

prop_D (argument) rel_csq(a, b)

la proposition à gauche de l'indice

la proposition à gauche de l'argument

la proposition à droite de l'indice

la proposition à droite de l'argument

affichage de la relation de conséquence entre a et b

TAB. 5.2 - Fonctions de base de l'illustrateur

5.4.1 Repérage d'une proposition complète

Nous considérons pour les besoins de notre programme, et cela est

évidemment sur-simplifié, qu'une proposition est un ensemble de mots: - situés entre l'indice que l'on traite (connecteur ou autre) et une

marque de ponctuation forte

- qui contient un verbe

Nous définissons ici les algorithmes à la base des fonction du tableau 5.2:

2Par exemple, la façon de délimiter la proposition dans laquelle se trouve un connecteur comme donc qui est libre de placement n'est pas précisée. On précise seulement qu'on cherche la proposition dans l'algorithme.

5. Implémentation

 

Algorithme 1 Algorithmes de repérage d'une proposition à droite ou à gauche de l'indice

sub prop_G (argument)

chercher une marque de ponctua-

tion forte à gauche de l'argument

si il y a un verbe entre cette marque et l'argument retourner selection

fsi

fin

sub prop_D (argument)

chercher une marque de ponctua-

tion forte à droite de l'argument

si il y a un verbe entre l'argument et cette marque retourner selection

fsi

fin

sub prop_D

prop_D (indice)

f s ub

5.4.2 Traitement des connecteurs

5.4.2.1 Donc

Repérer les relations de conséquence introduites par donc ne pose pas de problème particulier, le seul problème étant la bonne délimitation des propositions qui l'entourent (problème réglé par l'algorithme de délimitation des propositions):

Algorithme 2 Donc

sub donc

chercher "donc"

rel_csq (prop_G, prop_D) fsub

5.4.2.2 Alors

5. Implémentation

 

tion:

Algorithme 3 Alors

sub alors chercher "alors"

si "alors" n'est pas une partie de conjonction de subordination

si "quand" ou "si" n'introduisent pas prop_G rel_csq (prop_G, prop_D)

fsi

fsi

fs ub

5.4.2.3 Ainsi

Ainsi doit être distingué de ainsi que et ne pas être suivi d'un participe passé:

Algorithme 4 Ainsi

sub ainsi chercher "ainsi"

si "ainsi" n'est pas une partie de conjonction de subordination

si "ainsi" n'est pas suivi d'un participe passé si "ainsi" est situé en début de phrase rel_csq (prop_G, prop_D)

fs i

fsi

fsi

fs ub

5.4.2.4 Aussi

Le traitement de aussi est assez simple : il suffit de rechercher sa présence après un point et de voir s'il est suivi d'une virgule ou d'une inversion du sujet et du verbe.

Algorithme 5 Aussi

sub aussi

chercher "aussi" précédé d'un point

si la forme qui suit est un verbe et celle d'après

un tiret

ou la forme qui suit est une virgule

alors

rel_csq (prop_G, prop_D)

fsi

fs ub

5.4.2.5 Connecteurs «univoques» dont le placement n'a pas d'im-

portance

Il s'agit des connecteurs par conséquent et ce faisant qui expriment toujours la conséquence quel que soit l'endroit où ils se trouvent.

Algorithme 6 Connecteurs à placement libre

sub conn _libre

chercher le connecteur voulu rel_csq (prop_G, prop_D)

fsub

5.4.2.6 Connecteurs «univoques» à placement fixe

D'autres connecteurs, comme de ce fait, ce qui fait que ou pour cette raison ont toujours un sens consécutif, mais à la condition qu'ils soient placés à une place particulière dans la phrase (la recherche d'une marque de ponctuation suffit pour ce faire).

Algorithme 7 Connecteurs à placement fixe

sub conn_fixe

chercher le connecteur voulu pré-

cédé de la marque de ponctuation voulue rel_csq (prop_G, prop_D)

fsub

5. Implémentation

 

5.4.3 Traitement des autres indices

Les autres indices requièrent que l'on aille chercher autre chose que le simple environnement orthographique ou le fait que la proposition soit complète à gauche. En effet, la combinaison de ces indices associés avec un type de verbe particulier permet l'expression de la conséquence3.

5.4.3.1 Participe présent

Le participe présent doit être précédé d'une virgule et être efficient ou être suivi d'un connecteur particulier pour que l'expression de la conséquence soit possible:

Algorithme 8 Participe présent

sub part_pres

chercher un participe présent précédé d'une virgule si il est suivi d'un connecteur

{ainsi, ce faisant, de ce fait} alors

si verbe _changement_etat (participe présent) alors relation _de _consequence

fsi

fsi

fsub

5.4.3.2 Ce qui

Ce qui suit à peu près les mêmes règles sauf qu'il n'y a pas d'intervention de connecteurs possible:

5.4.3.3 Ceci / cela

Contrairement à ce qui, ceci ou cela doivent être précédés d'une marque de ponctuation forte. Sinon c'est toujours l'association avec un verbe ef-

3Ce n'est pas le cas du syllogisme qui lui requiert de trouver une marque du syllogisme et d'aller chercher deux propositions à gauche au lieu d'une pour les marques normales.

Algorithme 9 Ce qui

sub cequi

chercher une occurrence de "ce qui" précédée d'une

virgule

si la prop_G est complète alors

si verbe_changement_etat (verbe de prop_D) alors rel_csq (prop_G, prop_D)

fsi

fsi

fsub

ficient qui crée l'interprétation consécutive:

Algorithme 10 Ce qui

sub cecicela

chercher uneoccurrence de "ceci" ou "cela" précédée

d'une marque de ponctuation forte

si prop_G est complète alors

si verbe_changement_etat (verbe de prop_D) alors rel_csq (prop_G, prop_D)

fsi

fsi

fsub

5.4.3.4 Syllogisme

Voici l'algorithme permettant de repérer simplement un syllogisme et de délimiter les arguments de la relation de conséquence qu'il implique:

Algorithme 11 Syllogisme

sub syllogisme

chercher une occurrence de "or"

rel_csq(prop_G + prop_D, prop_D(prop_D)) fsub

5. Implémentation

 

5.4.4 Présence d'un type de verbe particulier

Nous avons manuellement créé une liste de verbes efficients et de verbes causatifs. Cette liste est loin d'être exhaustive et ne reflète pour l'instant que les besoins que nous avons eu pour nos corpus.

Pour créer une liste plus exhaustive, il faudra «entraîner» l'illustrateur avec d'autres corpus, les plus variés possibles et rajouter à la liste chaque nouveau verbe du type voulu qui apparaît. Cela devrait par la suite permettre d'obtenir des résultats satisfaisants : un bon taux de reconnaissance de la relation de conséquence en présence d'un indice comme ceci / cela par exemple accompagné de ce type de verbe.

Algorithme 12 Verbe efficient

sub verbe _changement _etat (verbe)

si lemme du verbe appartient à la liste des verbes efficients alors

retourner vrai

fsi

fs ub

5.5 Utilisation

En ligne de commande tout comme par l'intermédiaire d'un navigateur, notre illustrateur est très simple à utiliser, car il prend juste un fichier en entrée et affiche ou sauvegarde dans un fichier l'ensemble des relations de conséquence trouvées.

5.5.1 En ligne de commande

Notre illustrateur ne peut fonctionner seul et nécessite que le fichier qu'on lui donne à traiter soit déjà étiqueté et lemmatisé à l'aide de TreeTagger et de Flemm:

# tree-tagger-french nom_de_fichier_texte >nom_de_fi chier_tagge

# f lemm --entree nom_de_fichier_tagge --sortie nom _de _fichier _lemmatise --tagger TreeTagger

Une fois le fichier correctement taggé et lemmatisé, nous pouvons lancer notre programme:

# perl csq.pl nom _de _fichier _lemmatise

Le programme affiche à l'écran les relations de conséquence qu'il a trouvées accompagnées de statistiques concernant les moyens employés pour exprimer cette relation dans le texte donné en entrée. Nous allons maintenant montrer un exemple de sortie du programme:

5.5.2 Par navigateur

Nous avons rendu disponible une version de notre illustrateur utilisable en ligne sur internet à l'adresse suivante: http://druon.free.fr/csq

Il suffit de suivre les instructions (choisir un fichier, puis attendre que les résultats s'affichent à l'écran).

5.6 Problèmes à résoudre et fonctions à implémenter

Il reste un certain tâches à accomplir afin d'obtenir un analyseur plus performant, et ces tâches sont de deux ordres:

- soit nous n'avons pas eu le temps de tenir compte de certains éléments évoqués dans les chapitres 3 et 4;

5. Implémentation

 

[]

[cse L' examen au microscope électro-

nique confirme la

présence de manganèse sur l' électrode au carbone : cse] [csq l' électrode contenant du manga-

nèse s' est

{ donc } partiellement dissoute. csq]

[]

[cse La modification brutale du mode d'alimentation de

la tsé-

tsé peut aussi intervenir. cse] [csq { Ainsi },

dans les années 1980, il a été observé dans un village

congolais (Congo Brazzaville) que la proportion de repas de sang pris sur les humains pas-

sait de 5% à 50%

après une épizootie de peste porcine ayant décimé 96%

du cheptel. csq]

[]

Ainsi 54 33.13%

Ce qui 8 4.91%

Ceci / cela 4 2.45%

Donc 74 45.40%

Part. Prés. 23 14.11%

TOTAL 163 100.00%

FIG. 5.1 - Exemple de sortie de l'illustrateur

5. Implémentation

 

- soit l'implémentation pose des problèmes supplémentaires qui n'étaient pas apparus dans l'analyse.

5.6.1 Éléments à implémenter

Nous n'avons pas tenu compte dans l'analyseur des verbes modaux. Il faudra donc dans une prochaine version intégrer leur recherche afin de rendre plus efficace encore l'analyseur.

De plus, nous ne tenons pas non plus compte de segments plus grands que la proposition. L'illustrateur ne fait la recherche que de relations de conséquence qui relient deux propositions. Il faudra dans l'avenir tenir compte des segments plus grands.

5.6.2 Problèmes d'implémentation à résoudre

Il nous reste plusieurs points à résoudre, en particulier les points suivants:

- Notre algorithme de reconnaissance de propositions complètes reste

très simpliste, et il nécessiterait d'être grandement amélioré;

- La reconnaissance des verbes efficients est soumise à apprentissage pour chaque nouveau texte. Il faudra donc faire un apprentissage sur un nombre de corpus important pour obtenir un ensemble plus exhaustif de ce type de verbes;

- De plus, la reconnaissance des verbes efficients est plus complexe qu'un simple pattern-matching. En effet, une même forme peut avoir deux sens différents et il serait opportun de pouvoir distinguer ces sens différents pour ne pas obtenir de faux résultats;

- Il arrive parfois que plusieurs connecteurs ou indices puissent apparaître ensemble, ce qui fausse l'analyse quantitative, le système

5. Implémentation

 

comptant deux relations de conséquence au lieu d'une.

5.7 Comparaison de l'analyse quantitative manuelle et de l'analyse quantitative donnée par l'illustrateur

Dans le tableau de la page suivante nous présentons la comparaison de l'analyse quantitative manuelle que nous avons faite sur le corpus Linux-Howto et l'analyse quantitative donnée par l'analyseur.

Dans l'ensemble les connecteurs sont bien désambigüisés, ce qui est normal car en dehors de aussi et de alors, un simple pattern-matching suffit pour rendre non-ambigu le sens d'un connecteur. En revanche, les résultats sont mauvais pour alors, le système trouvant beaucoup plus de relations de conséquence introduites par ce connecteur que ce qu'il en est en réalité. Le connecteur ainsi quant à lui est relativement bien désambigüisé.

En ce qui concerne les autres indices, le système a tendance à sur- générer quelque peu des relations en présence de l'indice ceci / cela et à avoir de bons résultats autrement. Notons que le nombre de relations de conséquence en présence d'un participe présent est faible dans le corpus Linux-Howto et que les résultats en sont par conséquent médiocres. Nous obtenons des résultats très honorables sur le corpus La Recherche.

5.8 Conclusions

Notre analyseur reconnaît dans la plupart des cas la présence de relations de conséquence et il obtient des résultats relativement proches de l'analyse manuelle.

En revanche, il a une tendance sensible à surgénérer dans certains

 

Autre indice

ceci / cela

ce qui

pt. pr.

analyse manuelle

26

20,5%

7

5,5%

2

1,6%

illustrateur

36

22,1%

7

4,3%

4

2,5%

Connecteur

ainsi alors ce faisant ce qui fait que dans ce cas donc par conséquent pour cette raison

23

18,1%

11

8,7%

1

0,8%

3

2,4%

4

3,1%

42

33,0%

7

5,5%

1

0,8%

30

18,4%

27

16,6%

1

0,6%

3

1,8%

4

2,5%

42

25,8%

7

4,3%

1

0,6%

analyse manuelle

illustrateur

FIG. 5.2 - Comparaison analyse manuelle / analyse de l'illustrateur

5. Implémentation

 

cas. Il nous faudra donc résoudre les problèmes d'implémentation que nous avons soulevé (reconnaissance d'une proposition complète, gestion des verbes efficients...) et affiner l'analyse linguistique et le système informatique afin d'éviter cette surgénération et de bien délimiter les propositions que relient la relation de conséquence.

Conclusion

Dans notre mémoire de maîtrise, nous nous étions attardé sur un moyen d'exprimer une relation de conséquence : les connecteurs, dont nous avions étudié le comportement de quelques spécimens sélectionnés a priori. Partant du constat qu'il existait d'autres moyens d'exprimer une relation rhétorique que ces connecteurs, nous avons mis en place une méthode exploratoire permettant de cerner les moyens d'expression de la relation de conséquence dans un corpus. Le fait qu'il existe également des relations proches de la relation de conséquence et avec lesquelles on peut parfois confondre cette dernière nous a amené à définir précisément les notions de conséquence et de relation de conséquence. Cette étape de définition s'est avérée nécessaire pour l'approche de corpus que nous avons adoptée, notre objet d'étude devant être cerné au mieux avant son analyse en corpus.

Sur ces bases nous avons pu caractériser linguistiquement la réalisation de cette relation, en remarquant que de nombreuses marques n'étaient pas répertoriées ni citées dans la littérature. De plus nous avons montré qu'il était nécessaire d'envisager les indices de la relation de conséquence (que ce soient les connecteurs ou d'autres indices comme le participe présent) dans leur contexte afin caractériser pleinement les conditions de l'interprétation consécutive.

Nous nous sommes donc éloigné d'une approche strictement lexicale

Conclusion

 

de la relation de conséquence, perçue à travers les connecteurs comme seuls marqueurs de la relation, pour aller vers une approche prenant en compte des informations plus variées. Cette évolution nous est apparue nécessaire car se contenter de détecter les connecteurs ne permet ni de détecter à coup sûr une relation de conséquence, ni de couvrir l'ensemble des relations de conséquence d'un texte. Nous avons donc identifié des indices en présence desquels on peut avoir une relation de conséquence et nous avons circonscrit un certain nombre de contraintes supplémentaires qui permettent ou qui empêchent l'interprétation consécutive en leur présence.

Grâce aux résultats obtenus par notre approche exploratoire en corpus, nous avons pu implémenter une première ébauche d'analyseur automatique de la relation de conséquence qui donne des résultats intéressants.

Bien que notre approche de la relation de conséquence en corpus nous
ait permis de couvrir une partie plus importante des moyens d'expression
de la relation de conséquence que là où nous nous étions arrêté dans
notre mémoire de maîtrise, certaines questions restent encore ouvertes:
- Nous avons étudié la relation dans deux corpus, un manuel tech-
nique et une revue de vulgarisation scientifique. Les résultats obte-
nus sont donc propres aux corpus et il faudrait étendre cette étude
à d'autres genres discursifs (textes littéraires, juridiques, journalis-
tiques) afin d'avoir un panorama plus complet de la mise en texte de
la relation, en utilisant par exemple notre analyseur sur ces textes;
- Partant du constat que certaines constructions anaphoriques (ana-
phore propositionnelle) sont souvent un indice en présence duquel
on rencontre une relation de conséquence, et que certains connec-
teurs (comme ainsi) ont également une valeur anaphorique, il serait

Conclusion

 

intéressant de préciser les liens entre anaphore propositionnelle et relation de conséquence.

- Il faudra envisager le rapport étroit qu'entretiennent inférence et conséquence : dans un premier temps établir précisément ce qui permet d'exprimer une inférence et dans un second temps rassembler les conditions permettant l'interprétation consécutive en présence de cette inférence;

- Les temps verbaux semblent également jouer un rôle dans l'expression de la relation de conséquence. Nous n'avons pas eu le temps d'explorer cette voie mais elle semble riche;

- Il nous faudra continuer de tester dans un système informatique amélioré les résultats obtenus, ce qui nous permettra d'affiner encore plus l'analyse;

- En plus de l'analyse linguistique, il serait intéressant de rajouter un module statistique permettant d'améliorer les résultats de notre ébauche d'analyseur.

En conclusion, notre objectif est d'obtenir une caractérisation encore plus complète et précise des moyens d'expression de la relation de conséquence afin de pouvoir intégrer ces résultats dans un analyseur rhétorique automatique du français.

Bibliographie

«La recherche ». mai 2000.

AMSILI, P. et ROSSARI, C. (1998). « Tense and connective constraints on the expression of causality ».

ASHER, N. (1993). Reference to abstract objects in discourse. Kluwer Academic Publishers, Amsterdam.

AUROUX, S. (1990). « Effet ». In AUROUX, S. (Éd.), Encyclopédie philosophique universelle. II Les notions philosophiques. PUF.

CHARAUD EAU, P. (1992). Grammaire du sens et de l'expression. Hachette, Paris.

COPELAND, J. (1997). «CYC : A Case Study in Ontological Engineering ». Electronic Journal of Analytic Philosophy, 5. http://www.alanturing.net/pages/pub/cyc/cyc.pdf.

CORSTON-OLIVER, S. (1998a). « Beyond string matching and cue phrases: improving efficiency and coverage in discourse analysis ». In HOVY, E. et RADEV, D. (Éds.), Papersfrom the 1998 spring symposium of theAAAI, pages 9-15, Menlo Park. AAAI Press.

CORSTON-OLIVER, S. (1998b). Computing representations of discourse
structure
. PhD Thesis, Université de Californie à Santa Barbara.

DANLOS, L. (1988). « Connecteurs et relations causales ». Langue Française, 77 :92-127.

DENDALE, P. (1994). « Devoir épistémique, marqueur modal ou évidentiel? ». Langue française, 102 :24-40.

DENDALE, P. (2000). « Devoir épistémique à l'indicatif et au conditionnel: inférence ou prédiction? ». In ENGLEBERT, A. et ET AL. (Éds.), Actes du XII Congrès international de linguistique et de philologie romanes, Bruxelles. 23-29 juillet 1998.

Bibliographie

 

DENDALE, P. et ROSSARI, C. (2000). « Abduction et déduction, inférence et évidentialité. Le cas de devoir et de donc ». In Colloque international La médiation, marquages en langue et en discours.

DESCLÉS, J.-P., CARTIER, E., JACKIEWICZ, A., et MINEL, J.-L. (1997). « Textual processing and contextual exploration method ». In Actes de Context 97, Rio de Janeiro.

DRUON, S. (2000). « Projet de taxinomie des connecteurs du français pour le traitement automatique: l'exemple des consécutifs ». Mémoire de maîtrise, Université Bordeaux III. http://druon.free.fr/travaux/druon2000.pdf.

DUBOIS, J., GIACOMO, M., GUESPIN, L., MARCELLESI, C., MARCELLESI, J.-B., et MÉVEL, J.-P. (Éds.) (1994). Dictionnaire de linguistique et des sciences du langage. Larousse, Paris.

FORGET, D. (1984). « Quelques particularités des connecteurs de consé-

cutivité: essai polyphonique ». Semantikos, pages 17-39.

FRASER, B. (1999). « What are dicourse markers? ». Journal of pragmatics, 31(7) :931-952.

GALIOTOU, E. (1999). Modélisation de la causalité à partir de l'analyse des phénomènes temporels dans les langues naturelles: application au grec moderne. PhD Thesis, Université Paris 13.

GARCIA, D. (1998). « Exploitation, pour l'élaboration de requêtes de fiiltrage de textes, des connaissances causales détectées par COATIS ». In Actes de RIFRA '98, Sfax, Tunisie.

HYBERTIE, C. (1993). Étude des marqueurs de consécution en français contemporain. Thèse de doctorat, Université Paris III.

HYBERTIE, C. (1996). La conséquence en français. Ophrys, Paris.

ITKONEN, E. (1994). « Causation ». InASHER, R. (Éd.), TheEncyclopaedia of Language and Linguistics. Pergamon Press.

JACKIEWICZ, A. (1998). L'expression de la causalité dans les textes. Contribution au filtrage sémantique par une méthode informatique d'exploration contextuelle. Thèse de doctorat, Université Paris 4.

JAYEZ, J. et ROSSARI, C. (1997). « Connecteurs de conséquence et portée sémantique ». Cahiers de linguistique française, 19 :233-265. http://worldserver2.oleane.com/jjayez/clf19.ps.gz.

Bibliographie

 

JAYEZ, J. et ROSSARI, C. (1998). « Pragmatic connectives as predicates. The case of inferential connectives ». In Predicativeforms in natural language and in lexical knowledge bases. Kluwer Academic Publishers, Dordrecht.

http://worldserver2.oleane.com/jjayez/klu.ps.gz.

KNOTT, A. (1996). A data-driven methodology for motivating a set of

coherence relations. PhD Thesis, Université d'Edimbourg. http://www.cs.otago.ac.nz/staffpriv/alik/papers/ thesis .ps .gz.

KOZLOWSKA-HEUCHIN, R. (1996). Étude comparée des connecteurs en
français et en polonais
. Thèse de doctorat, Université Paris VII.

LABARRIÈRE, P.-J. (1990). « Résultat». In AUROUX, S. (Éd.), Encyclopédie philosophique universelle. II Les notions philosophiques. PUF.

LENAT, D. (1995). « CYC : A large-scale investment in knowledge infrastructure ». Communications of the ACM, 38(11) :33-38. http://riss.keris.or.kr:8080/pubs/citations/journals/ cacm/1995-38-11/%p33-lenat/.

MANN, W. C. et THOMPSON, S. A. (1987). «Rhetorical structure theory: a theory of text organisation ». ISI Reprint Series ISI / RS-87-190, Information Sciences Institute.

MARCU, D. (1997). The rhetoricalparsing, summarization, andgeneration of natural langage texts. PhD Thesis, Université de Toronto. http://www.isi.edu/marcu/papers/phd-thesis.ps.gz.

MINEL, J.-L., DESCLÉS, J.-P., CARTIER, E., CRISPINO, G., BEN HAZEZ, S., et JACKIEWICZ, A. (2001). «Résumé automatique par filtrage d'informations dans les textes. Présentation de la plateforme FilText ». Technique et Science informatiques, 3.

http://www.lalic.paris4.sorbonne.fr/\~minel/fichiers/ TSI .pdf.

MOESCHLER, J. (1998). « Ordre temporel, causalité et relations de discours: une approche pragmatique ». In VOGELEER, S., BORILLO, A., VETTERS, C., et VUILLAUME, M. (Éds.), Temps et discours. BCILL, Louvain la Neuve.

Bibliographie

 

MOESCHLER, J. et REBOUL, A. (1994). Dictionnaire encyclopédique de pragmatique. Seuil.

NAZARENKO, A. (2000). La cause et son expression en français. Ophrys.

PIOT, M. (1991). « Quelques problèmes inédits de constructions avec des conjonctions «Conséquentielles» ». Lingvisticæ Investigationes, 15(2) :285-303.

PLANTIN, C. (1990). Essais sur l'argumentation. Kimé, Paris.

REY, A. et REY-DEBOVE, J. (Éds.) (1993). Le Nouveau Petit Robert. Dictionnaires Le Robert, Paris.

ROSSARI, C. (1999). « Les relations de discours avec ou sans connecteurs ». Cahiers de linguistique française.

ROSSARI, C. (2001). « Les relations de discours: approches rhétoriques,
approches pragmatiques et approches sémantiques ». Verbum.

ROSSARI, C. et JAYEZ, J. (1996). « Donc et les consécutifs. Des systèmes de contraintes différentielles ». Lingvisticæ Investigationes, XX(1) :117-143.

SCHMID, H. (1994). « Probabilistic part-of-speech tagging using decision trees ». In International Conference on New Methods in Language Processing.

http://www.ims-stuttgart.de/ftp/pub/corpora/ tree-tagger1 . ps . gz.

STONE, M. (1994). « The reference argument ofepistemic must». In Actes deICWS 1, pages 117-143.

http://www.cs.rutgers.edu/\~mdstone/pubs/iwcs94.pdf.

TAMOWSKI, L. et DENDALE, P. (1994). « Pouvoir : un marqueur d'évidentialité ». Langue Française, 102 :41-55.

VENDLER, Z. (1967). Linguistics inphilosophy. Cornell University Press, Ithaca (NY).

Annexe A

# !/usr/bin/perl -w

## ##

# # # #

################################################################
# #

# Extraction automatique de la relation de conséquence #

# #

# (c) 2001 Sébastien Duon #

# #
################################################################

# # # #

## ##

# variables globales

my (@forme, @type, @lemme, @v_etat, @v_changt_etat, %stats) ; my $nbInd = 0;

# fonction principale : préparation des fichiers et

appel des fonctions de recherche

sub main()

{

my $total=0;

die "Utilisation :\nperl csq.pl nom _de _fichier _lemmatise.lem [>relations_de_conséquence.txt]\n" if ($#ARGV<0) ; $ARGV[0]=~ /^(.*)\.(.*?)$/;

$fic = $1 ;

open SRC, "./lib/verbes-etat.lst" or die "Pas de fichier de verbes d'état\n"; @v_etat=<SRC>;

chop @v_etat;

close SRC;

open SRC, "./lib/verbes-changt-etat.lst" or

die "Pas de fichier de verbes de changement d'état\n"; @v_changt_etat=<SRC>;

chop @v_changt_etat; close SRC;

open LOG, ">$fic.log";
open VER, ">$fic.ver";

open SRC, $ARGV[0] or die "Il faut spécifier un nom de fichier valide...\n";

print STDERR "Traitement du fichier $ARGV[0]\n"; print STDERR "Préparation du document.. .\n";

my $i=0 ;

while (<SRC>)

{

($forme[$i], $type[$i], $lemme[$i]) = split '\t' ;

$i++;

}

splice @tmp;

close SRC;

print STDERR "Recherche des indices... " ;

# Connecteurs

donc() ; ainsi() ; aussi() ; alors() ; parcons() ; decefait() ;

cefaisant() ;

ceqfq() ; danscecas() ;

pourcr() ; cestpq() ; cestlrpl() ;

# Autres indices

ppres() ; cequi() ; cecicela() ;

syllo() ;

close VER;
close LOG;

# affichage des statistiques stats() ;

}

sub stats()

{

my $total=0; my $totalA=0; my $totalC=0; my $lenmax=0; # calcul du nombre total de marques et de l'étiquette la plus longue

foreach $key (sort(keys %statsC))

{

$totalC+=$statsC{$key};

$lenmax=($lenmax>length($key)) ?$lenmax length($key);

}

foreach $key (sort(keys %statsA))

{

$totalA+=$statsA{$key};

$lenmax=($lenmax>length($key)) ?$lenmax length($key);

$total = $totalA + $totalC;

die "Aucune statistique possible\n" if ($total==0) ; # définition du format du tableau

$format = "@".'<' x ($lenmax+1) . "@>>>@>>>>>>%";

eval "format STDERR =\n$format\n".'$nom, $nb, $prc'."\n.\n";

# impression du tableau

print STDERR "\n\nStatistiques :\n"; print STDERR "\nConnecteurs\n";

print STDERR "-" x length($format),"\n"; foreach $key (sort(keys %statsC))

{

$nom=$key;

$nb=$statsC{$key} ;

$prc=sprintf("%.2f", $statsC{$key}/$total*100); write STDERR;

}

print STDERR "-" x length($format),"\n";

($nom, $nb, $prc) = ("TOTAL", $totalC, sprintf("%.2f", $totalC/$total*100)); write STDERR;

print STDERR "\nAutres\n";

print STDERR "-" x length($format),"\n";

foreach $key (sort(keys %statsA))

{

$nom=$key;

$nb=$statsA{$key} ;

$prc=sprintf("%.2f", $statsA{$key}/$total*100);

write STDERR;

}

print STDERR "-" x length($format),"\n";

($nom, $nb, $prc) = ("TOTAL", $totalA, sprintf("%.2f", $totalA/$total*100)); write STDERR;

print STDERR "\n", "=" x length($format),"\n";

($nom, $nb, $prc) = ("TOTAL GENERAL", $total, "100.00"); write STDERR;

}

#################
## Connecteurs ##
#################

# Donc

sub donc()

{

my $place;

my @out;

for ($i=0; $i<=$#forme; $i++)

{

if ($forme[$i] = ~ /^donc$/i)

{

if ($ttt=trouvedir("(PON |CONc)", $i, -1))

{

if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER", $ttt, $i),$i)) {

push @out, csq(pointG($ttt), $ttt, $i, $i, pointD($i)) ;

else

{

push @out, csq(pointG($ttt-2), $ttt, $i, $i, pointD($i)) ;

}

}

}

}

titre("Donc", \@out) ;

}

# Ainsi

sub ainsi()

{

my $place;

my @out;

for ($i=0; $i<=$#forme; $i++)

{

if ($forme[$i] = ~ /ainsi/i)

{

if ($type[$i] !~/CON sub/)

{

if ($forme[$i] eq "Ainsi")

{

if ($type[$i+1] = ~ /VER\(pper\)/)

{

print LOG "! ! ! [ainsi +ppassé] ", join " ", @forme[&pointG($i)..&pointD($i)], "\n--\n";

}

else

{

push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;

}

}

else

{

if (propG($i))

{

push @out, csq(pointG(pointG($i-2)-2), pointG($i-1)-1, $i, $i, pointD($i)) ;

}

else

{

push @out, csq(pointG(pointG($i-2)-2), pointG($i-1)-1, $i, $i, pointD($i)) ;

}

}

} else

{

print LOG "! ! ! [ainsi que] ", join " ", @forme[&pointG($i)..&pointD($i)], "\n--\n";

}

}

}

titre("Ainsi", \@out) ;

}

# Alors

sub alors() {

my $place; my @out;

for ($i=0; $i<=$#forme; $i++)

{

if ($forme[$i] = ~ /alors/i)

{

if ($type[$i] !~/CON sub/)

{

$place=$i;

while ($forme[$place--] ne "."){}

while ($place++<$i &&

!(

($forme[$place] = ~ /^(si|quand)$/i) ||

($forme[$place] = ~ /[Ss]\'/ && $forme[$place+1] eq "il")

)

){}

if ($place==$i+1)

{

if ($ttt=trouvedir("(PON |CONc)", $i, -1))

{

if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER", $ttt, $i),$i))

{

push @out, csq(pointG($ttt), $ttt, $i, $i, pointD($i)) ;

} else

{

push @out, csq(pointG($ttt-2), $ttt, $i, $i, pointD($i)) ;

}

}

} else

{

print LOG "! ! ! [".lc($forme[$place])."... alors] ", join " ",

@forme[$place. .&pointD($i)], "\n--\n";

}

}

else

{

print LOG "! ! ! [alors que] ", join " ", @forme[&pointG($i)..&pointD($i)], "\n--\n";

}

}

}

titre("Alors", \@out) ;

}

# Aussi

sub aussi(){

my $place;

my @out;

for ($i=0; $i<=$#forme; $i++)

{

if (($forme[$i] = ~ /[Aa]ussi/ && $type[$i+1] = ~ /VER/ && $forme[$i+2] =~ /-/) || ($forme[$i] = ~ /[Aa]ussi/ && $forme[$i-1] =~ /\./ && $forme[$i+1] = ~ /,/))

{

if ($type[$i-1] = ~ /PONsep/)

{

push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;

} else

{

push @out, csq(pointG($i), $i-1, $i, $i, pointD($i)) ;

titre("Aussi", \@out) ;

}

# Par conséquent

sub parcons()

{

my @out;

for ($i=0; $i<=$#forme; $i++)

{

if ($forme[$i] = ~ /par/i && $forme[$i+1] eq "conséquent")

{

if ($ttt=trouvedir("(PON |CONc)", $i, -1))

{

if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER", $ttt, $i),$i))

{

push @out, csq(pointG($ttt), $ttt, $i, $i+1, pointD($i)) ;

}

else

{

push @out, csq(pointG($ttt-2), $ttt, $i, $i+1, pointD($i)) ;

}

}

}

}

titre("Par conséquent", \@out) ;

}

# De ce fait

sub decefait()

{

my @out;

for ($i=0; $i<=$#forme; $i++)

{

if ($forme[$i] = ~ /de/i && $forme[$i+1] eq "ce" && $forme[$i+2] eq "fait") {

if ($ttt=trouvedir("(PON |CONc)", $i, -1)) {

if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER", $ttt, $i),$i))

{

push @out, csq(pointG($ttt), $ttt, $i, $i+2, pointD($i)) ;

}

else

{

push @out, csq(pointG($ttt-2), $ttt, $i, $i+2, pointD($i)) ;

}

}

}

}

titre("De ce fait", \@out) ;

}

# Ce faisant

sub cefaisant()

{

my @out;

for ($i=0; $i<=$#forme; $i++) {

if ($forme[$i] = ~ /ce/i && $forme[$i+1] eq "faisant")

{

if ($ttt=trouvedir("(PON |CONc)", $i, -1))

{

if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER", $ttt, $i),$i))

{

push @out, csq(pointG($ttt-1), $ttt, $i, $i+1, pointD($i)) ;

} else

{

push @out, csq(pointG($ttt-2), $ttt, $i, $i+1, pointD($i)) ;

}

}

}

}

titre("Ce faisant", \@out) ;

}

# Ce qui fait que

sub ceqfq()

{

my @out;

for ($i=0; $i<=$#forme; $i++)

{

if ($forme[$i] = ~ /ce/i && $forme[$i+1] eq "qui" && $forme[$i+2] eq "fait" && $forme[$i+3] = ~ /^qu./)

{

if ($type[$i-1] =~/PON comma/)

{

push @out, csq(pointG($i), $i-1, $i, $i+3, pointD($i)) ;

}

elsif ($type[$i-1] !~/PON/)

{

push @out, csq(pointG(pointG($i-2)-1), $i-1, $i, $i+3, pointD($i)) ;

}

}

}

titre("Ce qui fait que", \@out) ;

}

# Dans ce cas

sub danscecas()

{

my @out;

for ($i=0; $i<=$#forme; $i++) {

if ($forme[$i] = ~ /dans/i && $forme[$i+1] eq "ce" && $forme[$i+2] eq "cas")

{

if ($type[$i-1] =~/PONsep/) {

push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;

}

}

}

titre("Dans ce cas", \@out) ;

}

# Pour cette raison sub pourcr()

{

my @out;

for ($i=0; $i<=$#forme; $i++) {

if ($forme[$i] = ~ /pour/i && $forme[$i+1] eq "cette" &&

$forme[$i+2] eq "raison")

{

if ($type[$i-1] =~/PONsep/) {

push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;

}

}

}

titre("Pour cette raison", \@out) ;

}

# C'est pourquoi

sub cestpq()

{

my @out;

for ($i=0; $i<=$#forme; $i++) {

if ($forme[$i] = ~ /c'/i && $forme[$i+1] eq "est" && $forme[$i+2] eq "pourquoi") {

if ($type[$i-1] =~/PONsep/) {

push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;

}

}

}

titre("C'est pourquoi", \@out) ;

}

# C'est la raison pour laquelle

sub cestlrpl()

{

my @out;

for ($i=0; $i<=$#forme; $i++)

{

if ($forme[$i] = ~ /c'/i && $forme[$i+1] eq "est" && $forme[$i+2] eq "la" && $forme[$i+3] eq "raison" && $forme[$i+4] eq "pour" &&

$forme[$i+5] eq "laquelle")

{

if ($type[$i-1] =~/PONsep/)

{

push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;

}

}

}

titre("C'est la raison pour laquelle", \@out) ;

}

####################
## Autres indices ##
####################

# Ceci et cela

sub cecicela()

{

my @out;

for ($i=0; $i<=$#forme; $i++)

if ($type[$i-1] = ~ /PONsep/ && $forme[$i] = ~ /^(ceci|cela)$/i)

{

if (propD($i))

{

if (vcsq($tmp=trouvedir ("VER", $i, 1, \@type)))

{

push @out, csq(pointG(pointG($i)-2), $i-1, $i, $i, pointD($i)) ;

} else

{

print LOG sprintf ("[cecicela -ce]%s\n--\n", join " ", @forme[pointG(pointG($i)-2)..pointD($i)]);

}

}

else

{

print LOG sprintf (" ! ! ! [cecicela pnc] %s\n--\n",

(join " ", @forme[pointG($i)..pointD($i)]));

}

}

}

titre("Ceci / cela", \@out, 1);

}

# Ce qui

sub cequi()

{

my @out;

for ($i=0; $i<=$#forme; $i++)

{

if ($type[$i-1] = ~ /PONco/ && $forme[$i] = ~ /^ce$/i &&

$forme[$i+1] = ~ /^qui$/)

{

if (propG($i))

{

if (vcsq(trouvedir ("VER", $i, 1, \@type)))

{

push @out, csq(pointG($i), $i-1, $i, $i+1, pointD($i)) ;

} else

{

print LOG sprintf ("[ce qui -ce]%s\n--\n", join " ",
@forme[pointG(pointG($i)-2)..pointD($i)]);

}

}

else

{

print LOG sprintf (" ! ! ! [ce qui pnc] %s\n--\n",

}

(join " ", @forme[pointG($i)..pointD($i)]));

}

}

titre("Ce qui", \@out, 1);

}

# Syllogisme sub syllo()

{

my $place; my @out;

for ($i=0; $i<=$#forme; $i++)

{

if ($forme[$i] = ~ /^or$/i)

{

print STDERR ("\x8" x length $nbInd) .++$nbInd; push @out,

sprintf ("%s\n",

bcse().

join ("",@forme[&pointG(&pointG($i)-2)..$i-1]). marque ($forme[$i]).

join ("", @forme[$i+1..($tmp=&pointD($i))]). ecse()." ".bcsq().

join ("", @forme[$tmp+1..&pointD($tmp+1)]). ecsq()) ;

}

}

titre("Syllogisme", \@out, 1);

}

# Participe présent

sub ppres()

{

my $place;

my @out;

my $ok;

for ($i=0; $i<=$#forme; $i++)

{

if ($forme[$i] eq "," && $type[$i+1] =~ /VER\(ppre\)/)

{

if ($forme[$i+2] eq "ainsi" ||

$forme[$i+4] eq "fait" ||

$forme[$i+3] eq "faisant")

{

push @out, csq(propG($i), $i, $i+1, $i+1, pointD($i)) ;

}

else {

$ok=0;

foreach $j (@v_etat)

{

if ($lemme[$i+1] = ~ $j)

{

$ok=1;

}

}

if ($ok==0)

{

if ($pcmp=propG($i))

{

if (vcsq($i+1))

{

push @out, csq($pcmp, $i, $i+1, $i+1, pointD($i)) ;

} else

{

}

print LOG sprintf (" ! ! ! [ppres -ce] %s\n--\n", (join " ", @forme[pointG($i)..pointD($i)]));

print LOG sprintf (" ! ! ! [ppres pnc] %s\n--\n",

(join " ", @forme[pointG($i)..pointD($i)]));

}

}

else

{

print LOG sprintf(" ! ! ! [ppres etat] %s\n--\n",

}

}

(join " ", @forme[pointG($i)..pointD($i)]))

}

}

titre("Part. Prés.", \@out, 1);

}

##########################################
## Routines de recherche et d'affichage ##
##########################################

# recherche d'un type d'élément lexical entre deux bornes

sub trouve($$$)

{

# trouve ($chaine, $debut, $fin)

for ($bcl=$ _[1] ;$bcl <=$_[2] ;$bcl++)

{

if ($type[$bcl]=~/$_[0]/)

{

return $bcl;

}

}

return 0;

}

# recherche d'un type d'élément lexical dans un direction

sub trouvedir($$$)

{

my $place=$_[1] ;

while ($type[$place+=$ _[2]] !~ /$_[0]/) {}

return $place;

}

# recherche d'une proposition complète à droite

sub propD($)

{

my $place=$_[0] ;

while ($type[$place++] !~ /PON sep/){}

if(trouve("VER\\(", $_[0], $place)){return $_[0]} else {return 0}

}

# recherche d'une proposition complète à gauche

sub propG($)

{

my $place=$ _[0] ;

while ($type[$place--] !~ /PON sep/ && $forme[$place] ne "("){} if(trouve("VER\\(", $place+2, $ _[0])){return $place+2} else {return 0}

}

# recherche d'un point à droite sub pointD($)

my $place=$_[0] ;

while ($type[$place++] !~ /PON sep/){}

return $place-1;

}

# recherche d'un point à gauche

sub pointG($)

{

my $place=$_[0] ;

while ($type[$place--] !~ /PON sep/){}

return $place+2;

}

# définition des balises de la relation de conséquence

sub bcse()

{

return "[cse " ;

}

sub ecse()

{

return " cse]";

}

sub bcsq()

{

return "[csq " ;

}

sub ecsq()

{

return " csq]";

}

sub marque($)

{

return " { $_[0] } " ;

}

# fonctuion d'affichage de la relation extraite sub csq($$$$)

{

print STDERR ("\x8" x length $nbInd) .++$nbInd;

return

sprintf ("%s\n",

bcse().

join ("",@forme[$_[0]..$_[1]]).

ecse()." ".bcsq().

join ("",@forme[$_[1]+1..$_[2]-1]). marque (join ("", @forme[$_[2]..$_[3]])). join ("", @forme[$_[3]+1..$_[4]]). ecsq()) ;

}

# affichage du nom de la relation et mise à jour des statistiques sub titre($$)

{

my $marq="$_[0] (".($#{$_[1]}+1).")";

print "\n";

print "-" x length $marq; print "\n$marq\n";

print "-" x length $marq;

print "\n\n@{$ _[1] }" ;

if (defined($_[2]))

{

$statsA{$_[0] }=$#{$_[1] }+1;

} else

{

$statsC{$_[0] }=$#{$_[1] }+1;

}

}

# recherche d'un verbe efficient sub vcsq($)

{

print VER "$lemme[$_[0]]";

foreach $j (@v_changt_etat)

{

return 1 if ($lemme[$_[0]] = ~ /^$j/)

}

}

# execution du programme main() ;






La Quadrature du Net