WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

La désambiguà¯sation des toponymes

( Télécharger le fichier original )
par Imene BENSALEM
Université Mentouri de Constantine, Algérie - magistère en informatique 2009
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

4.1.2 Les types de relations entre les toponymes du même contexte

En observant les heuristiques de la désambiguïsation des toponymes par le contexte, nous remarquons que derrière la plus part des heuristiques de cette classe, se cache une intuition qui consiste à supposer l'existence d'une certaine proximité géographique entre les référents des toponymes du même contexte.

H1, H5, H6 désambiguïsent les toponymes par les référents les plus proches en termes de distance, ce qui implique à faire des calculs géométriques en utilisant les coordonnées spatiales des référents. Cependant, les heuristiques H2, H9, H3.1, H7 désambiguïsent les toponymes par les référents les plus proches dans l'arbre

2 Référents et statistiques de population selon Word Gazetteer : http://world-gazetteer.com (dernière consultation le 28 septembre 2009).

hiérarchique des lieux du monde. Dans ce cas, les référents doivent être représentés par leurs chemins hiérarchiques.

Tableau 4-1. Rappel des heuristiques de l'état de l'art de désambiguïsation des toponymes

Heuristiques de
désambiguïsation par
le contexte

H1 Distance aux voisins textuels non ambigus

H2 Chevauchement entre les chemins hiérarchiques des référents et le texte

H3 L'appariement des patterns

H3.1 Les patterns de relation hiérarchique H3.2 Les patterns de type

H4 Modèle de cooccurrence

H5 Espace géométrique (polygone / distance) minimaliste

H6 Contexte géographique unifié

H7 Le chemin le plus court entre les référents

H8 Les noeuds de l'arbre couvrant maximum

H9 La densité conceptuelle

Heuristiques de
désambiguïsation par
les règles de
préférence

H10 La plus grande population

H11 Le référent de niveau supérieur

H12 Le référent le plus connu

H13 Préférer un type

H14 Ordre de préférence des ressources

H15 Le sens le plus fréquent dans un corpus

H16 Supprimer les petites places

H17 Concentration sur une zone géographique

Heuristiques H18 Un référent par discours

complémentaires H19 Attribuer les référents aux toponymes non ambigus

Nous appelons « relation spatiale » entre les référents toute relation géographique résultante de la proximité des distances, et « relation arborescente » toute relation résultante de proximités dans l'arbre hiérarchique des lieux du monde (Bensalem et Kholladi 2009b).

En outre, nous distinguons deux types de relations arborescentes: les relations hiérarchiques, et les relations non hiérarchiques (Bensalem et Kholladi 2009b).

Les relations hiérarchiques existent entre les lieux de la même branche dans l'arbre. Par exemple entre un pays et une de ses villes ; comme entre l'Algérie et Constantine dans la Figure 4-1.

Andalousie

Michigan

Marrakech Alger Constantine

Relations
hierarchiques

Séville

Alger

Relations non
hiérarchiques

Cordoue

Monde

Amérique

est meronyme de
(méronymie)

Europe

est holonyme de
(holonymie)

Afrique

USA

Espagne Maroc

Algérie

Figure 4-1. Une partie de l'arbre hiérarchique du monde (Alger est un toponyme ambigu)

Les relations non hiérarchiques sont celles qui existent entre les noeuds qui se trouvent dans des branches différentes mais qui ont une (ou plusieurs) racine commune. La racine commune peut être directe (ex. Andalousie par rapport à Séville et Cordoue) ou indirecte (ex. Afrique par rapport à Constantine et Marrakech).

Il existe deux sortes de relations hiérarchiques: la méronymie qui est la relation «est-partie-de» et l'holonymie3 qui représente la relation « contient-la-partie ». Par exemple, nous disons que `Algérie' est un holonyme de `Constantine' et `Constantine' est un meronyme de l'Algérie.

Un chemin hiérarchique d'un lieu est donc composé d'un ensemble de toponymes connectés les uns aux autres par des relations d'holonymie/méronymie. Par exemple `Alger>Algerie>Afrique' et `Alger>Michigan>USA>Amérique' sont des chemins hiérarchiques du toponyme ambigu `Alger' (voir Figure 4-1).

La Figure 4-2 résume les différents types des relations géographiques qui peuvent exister entre les lieux du même contexte.

3 L'holoymie et la méronymie sont des termes qui expriment des relations sémantiques et ils sont originaires de la discipline de la linguistique.

Holonymie Meronymie

Hiérarchiques

Arborescentes

Relations
géographiques

Non
hiérarchiques

Spatiales

Figure 4-2. Les différents types de relations géographiques qui peuvent exister entre les lieux mentionnés dans le
même contexte

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"La première panacée d'une nation mal gouvernée est l'inflation monétaire, la seconde, c'est la guerre. Tous deux apportent une prospérité temporaire, tous deux apportent une ruine permanente. Mais tous deux sont le refuge des opportunistes politiques et économiques"   Hemingway