WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

La désambiguà¯sation des toponymes

( Télécharger le fichier original )
par Imene BENSALEM
Université Mentouri de Constantine, Algérie - magistère en informatique 2009
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

2.3.3.1 Le contexte

Le contexte est le texte en langue naturelle où le toponyme à résoudre apparaît. Le contexte est la source d'évidence principale et intuitive dans les méthodes de DT. Les toponymes du contexte sont des informations souvent utilisées pour résoudre un toponyme ambigu du même contexte (voir Section 3.3 pour des informations plus amples).

2.3.3.2 Connaissances

Une connaissance -dans le contexte de la DT- est toute information qui peut aider à l'association des toponymes avec leurs référents correctes. Les connaissances peuvent être internes c.-à-d. en provenance du contexte, ou externe en provenance de sources hormis le contexte (voir Section 3.5).

2.3.3.3 Ressources

Toute source de connaissance hormis le contexte est appelée ressource.

Le Tableau 2-2 donne quelques exemples de ressources et les connaissances qu'ils fournissent (voir Section 3.6).

Tableau 2-2. Exemples des ressources utilisées dans les méthodes de DT et les connaissances qu'ils fournissent

Ressources Connaissances

Gazetteers, dictionnaires, ontologies

corpus

Relations

coordonnées spatiales définitions

Cooccurrences fréquences d'usage

2.3.4 Applications

Nous avons discuté dans le chapitre précédent l'utilité de la désambiguïsation des
toponymes dans le domaine du data mining spatial. Cependant, le DMS n'est pas le

seul champ d'application de la DT, cette dernière est une technique utile dans plusieurs applications dans multiples domaines.

Dans cette section nous présentons quelques applications de la désambiguïsation des toponymes.

2.3.4.1 Indexation géo-spatiale des documents textuels

En se basant sur l'indexation et la recherche par mots clés seulement, la requête spatiale « chercher des articles à propos de Constantine » va récupérer tous les documents qui contiennent des occurrences du mot « Constantine » quelque soit la localisation géographique de Constantine (Constantine de l'Algérie, Constantine des États-Unis...).

Cependant, l'indexation spatiale des documents -dont la désambiguïsation des toponymes se trouve parmi ses techniques principales- permet le regroupement ou le raffinement des résultats de la requête préalablement mentionnée selon la localisation géographique de Constantine.

En outre, l'indexation spatiale permet aussi de récupérer des documents qui ne mentionnent pas explicitement Constantine mais plutôt ils contiennent des toponymes qui représentent ses communes comme par exemple Zighoud Youcef, Al-Khroub...etc. Un tel résultat de recherche est impossible à obtenir par l'indexation classique basée sur les mots clés. Voir Section 2.4.1 pour plus d'informations sur ce sujet.

Exemple réel

La société MetaCarta fourni des services d'indexation spatiale des pages web (MetaCarta, Inc 2008) ; et dernièrement son site web a mis au point le service GeoSearch News5 qui est un service de recherche dans les informations de l'actualité en combinant les mots clés et les noms des lieux (Voir Figure 2-3).

5 http://geosearch.metacarta.com

Figure 2-3. La page web GeoSearch News de MetaCarta: Recherche géo-spatiale dans l'actualité du monde

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Entre deux mots il faut choisir le moindre"   Paul Valery