WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

La désambiguà¯sation des toponymes

( Télécharger le fichier original )
par Imene BENSALEM
Université Mentouri de Constantine, Algérie - magistère en informatique 2009
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

3.5 Les connaissances

Les connaissances représentent l'ensemble des informations à propos du toponyme ambigu et ces référents candidats. Les connaissances sont les éléments de base derrière le choix du référent correcte. Sans connaissances il n'est pas possible ni pour l'homme ni pour la machine de déterminer le sens des mots ambigus (Navigli 2009) y compris les toponymes.

Nous présentons dans cette section une synthèse des connaissances manipulées dans l'état de l'art des méthodes de DT.

17 La représentation de ce tableau est inspirée de (Leidner 2007, p.116), mais la signification des heuristiques est différente de celle de (Leidner 2007) comme j'ai déjà expliqué dans la section 3.2.

3.5.1 Classification des connaissances

D'après notre point de vue, les connaissances peuvent être classifiées selon 5 critères : la cible, la source, le domaine, la nature, et la méthode d'acquisition. Le Tableau 3-4 fourni une explication de ces critère avec les classes engendrées.

Tableau 3-4. Critères de classification des connaissances utilisées pour la désambiguïsation des toponymes

Critère Classes Explication

Cible
· Connaissances à propos du toponyme

~ Connaissances à propos des référents

On veut dire par « cible » celui qui est concerné par les connaissances. Les noms des classes répondent à la question : cette connaissance est à propos de quoi ?

Sources
· Contexte

· Gazetteer (ou autre ressource qui joue le même rôle)

· Corpus

Classification selon la ressource à partir de laquelle une connaissance est obtenue. (Voir Section 3.6 pour plus de détails sur les sources de connaissances.)

Domaine
· Connaissances linguistiques

· Connaissances géographiques

Les connaissances linguistiques sont extraites du texte, tandis que les connaissances géographiques sont concrètes et concerne le monde réel.

Nature
· Valeur

· Relation

Exemple : pour un toponyme ambigu, le nombre de son apparition dans le texte (la fréquence d'occurrence) est une valeur. Cependant, les

toponymes qui apparaissent avec lui dans le même contexte (les cooccurrences) sont des relations.

Méthode d'acquisition

· Direct

· Indirect

Il y a des connaissances obtenues directement depuis les ressources c.- à-d. elles sont brutes et d'autres sont calculées à partir des connaissances brutes ( ex. la distance est calculée à partir des coordonnées spatiales), ou extraites du texte comme le type d'un toponyme (Voir H3.2 Les

patterns de type)

Le critère de classification des connaissances le plus discriminant est la cible. Selon
ce critère nous divisons les connaissances manipulées par les heuristiques de DT

en 2 classes : connaissances à propos du toponyme à résoudre et connaissances à propos des référents. Dans le reste de cette section nous présentons une vue d'ensemble sur ces deux classes de connaissances. Le schéma de la Figure 3-7 illustre cette description.

Dans cette sous-section le terme toponyme est utilisé pour désigner un mot qui représente un nom géographique mais qui n'a pas encore une représentation concrète dans le monde, tandis que le terme référent désigne un toponyme dont son sens est connu.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Là où il n'y a pas d'espoir, nous devons l'inventer"   Albert Camus