WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Recherche d'un processus d'historisation de base de données d'occupation des sols appliqué au référentiel géographique forestier de l'IGN

( Télécharger le fichier original )
par Romain Louvet
Université Paris Diderot - Paris 7 - M1 Géographie et Sciences des territoires 2013
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Introduction

Contexte

L'information géographique connaît un fort développement depuis les dernières décennies. L'avènement d'une nouvelle société à « l'ère de l'information » (Castells, 2001), grâce aux progrès des technologies de l'information et de la communication, et la prise de conscience générale des enjeux environnementaux (Gayte et al., 1997) expliquent en grande partie ce développement. L'accroissement d'un besoin politique et gestionnaire s'inscrivant dans le cadre du développement durable s'est traduit concrètement en outils et en informations relevant de la géomatique1.

Parmi ces outils de géomatique appliquée à l'environnement, les bases de données d'occupation du sol apparaissent primordiales. Elles fournissent des informations utiles à l'aide à la décision et à la concertation en politique d'aménagement du territoire, de prévention des risques naturels et technologiques, de mesure d'impacts des activités humaines sur l'environnement, de gestion durable des ressources naturelles, etc.

De nombreuses bases de données d'occupation du sol existent actuellement, entres autres : CLC (Corine Land Cover), la plus utilisée et couvrant l'Europe entière, et des bases régionales telles que le MOS (Mode d'Occupation du Sol, Île-de-France), CIGAL (Coopération pour l'Information Géographique en Alsace), SIGALE (Système d'Information Géographique et d'Analyse de L'Environnement, Nord-Pas-de-Calais), ou encore Ocsol PACA (Occupation du sol en Provence-Alpes-Côte-D'azur). L'échelle moyenne de CLC limite toutefois ses applications par sa trop grande généralisation. Les bases régionales, quant à elles, ne permettent pas les comparaisons entre des espaces éloignés. Elles ne couvrent pas la France entière.

Face à ces constats, un point important émerge alors : la nécessité de produire une base de données d'occupation du sol à grande échelle de l'ensemble du territoire national pour permettre un suivi plus précis et l'analyse au-delà des frontières régionales. Au niveau européen, c'est ce que la directive INSPIRE (Infrastructure for Spatial Information in the European Community2) (Parlement et Conseil européens, 2007) propose d'encadrer à l'aide d'un socle de nomenclature unique dans le but d'harmoniser les bases de données géographiques, notamment à travers l'HELM (Harmonised European Land Monitoring3).

C'est dans ce contexte que l'État a commandé à l'IGN (Institut national de l'information géographique et forestière4) la « réalisation d'un thème occupation du sol à grande échelle, par intégration des différents thèmes en partenariat » (IGN, 2010). Cette commande a donné lieu à la mise en place à l'IGN du projet OCS GE (Occupation du Sol à Grande Échelle) ayant pour objectif la production d'une base de données d'information géographique d'occupation du sol sur l'ensemble du territoire national d'une précision compatible avec d'autres produits de l'IGN, comme le RGE (Référentiel à Grande Échelle) dont elle deviendra une des composantes, et la directive INSPIRE, avec une nomenclature nationale approuvée par les utilisateurs.

1 « The expansion of information technologies occured at about the same time as political and scientific interest in global environmental change intensified » (Balstad Miller, 1996).

2 Infrastructure pour l'information spatiale dans la Communauté européenne.

3 Gestion territoriale européenne harmonisée.

4 Anciennement : Institut Géographique National.

18

Cette base de données doit permettre de répondre aux demandes des utilisateurs de mesures d'évolution de la tâche urbaine, de consommation des espaces agricoles (De Blomac, 2012), et de cartographie de la trame verte et bleue (IGN, 2010), liées aux nouvelles exigences législatives concernant l'aménagement et l'environnement5. La production de certains thèmes est déjà lancée, dont celui d'un référentiel géographique forestier, le RGFor.

Demande de la structure d'accueil

Le stage réalisé à l'IGN s'inscrit dans le projet de l'OCS GE et la production du RGFor. Intégré à l'équipe du projet, constituée de trois personnes, dont le pilote projet Thierry Touzet qui dirigea ce stage, il a été demandé d'effectuer un travail de recherche sur un thème précis : la question du temps dans les bases de données géographiques.

Il s'agissait d'étudier les processus d'historisation d'une base de données d'occupation du sol afin de proposer des solutions compatibles avec les spécificités du RGFor. Ce travail devait être fondé notamment sur la description du processus interne à l'IGN d'historisation de la base géographique centralisée, la BDUni (Base de Données Unifiée). À partir des méthodes déjà implémentées dans cette base, il a été demandé d'analyser si celles-ci étaient adaptées à une base d'occupation du sol. Ce travail a donné lieu à la rédaction de ce mémoire et d'un rapport décrivant le processus d'historisation de la BDUni.

La raison de cette demande tient au fait que la production du RGFor doit être terminée d'ici 2015. L'élaboration du processus de mise à jour est donc désormais nécessaire pour les prochaines versions. Par ailleurs, historiquement, la problématique de la mise à jour d'une base vecteur de données surfaciques est nouvelle à l'IGN. L'évolution de la technique apportant des images plus précises entre chaque campagne de collecte, la gestion de l'historique n'avait jusque-là pas de sens. Le RGFor actuel atteignant la grande échelle, avec une résolution métrique, il est acquis que ce référentiel ne devrait plus changer pour des raisons de support image. La mise à jour des données au sein d'une même base de ce type étant désormais possible, elle doit être élucidée.

L'objet du stage demande d'approfondir cette question. Il s'agit de réfléchir à la mise à jour des bases de données d'occupation du sol pour la prise en compte de la dimension temporelle des données, cette dimension étant indispensable au suivi des évolutions d'occupation du sol. En effet, la connaissance d'un territoire passe par sa description à un instant donné mais l'essentiel est d'observer et de mesurer son évolution. Intégrer la dimension temporelle aux données signifie donc qu'il faudra proposer une solution, sous la forme d'un modèle spécifique de base de données capable de répondre aux besoins temporels : dater et suivre les données dans le temps. Il doit être possible de consulter la base à une date choisie, d'évaluer et de suivre les évolutions dans le temps, montrant les dynamiques à l'oeuvre, afin de répondre aux attentes des utilisateurs.

Enfin, ce modèle doit permettre de tracer les corrections géométriques (correction de lisière), thématiques ou sémantiques (changement de nomenclature pour un objet), et de distinguer les corrections strictes des évolutions réelles, afin de produire une base de données améliorant le suivi des espaces forestiers.

5 Loi Grenelle II ; code de l'urbanisme relatif aux PLU (Plan Local d'Urbanisme), aux SCoT (SChéma de Cohérence Territorial).

19

Cadre du sujet

Le temps dans les Systèmes d'Information Géographique (SIG) est une question étudiée depuis les années 80. Les auteurs ayant écrit sur le sujet se sont attachés à décrire des modèles de bases de données spatio-temporelles. La première étude approfondie sur le sujet fut publiée au début des années 90 (Langran, 1992), puis d'autres suivirent (Peuquet, 2002 ; Ott et Swiaczny, 2001). C'est toutefois toujours un sujet de recherche d'actualité, ces modèles ne pouvant être mis en place techniquement que depuis peu et posant encore des problèmes techniques et conceptuels. La gestion de la temporalité dans les SIG manque en effet encore d'outils ; c'est une préoccupation relativement nouvelle des concepteurs de bases de données, ceux-ci s'étant d'abord concentrés sur les problèmes de collecte d'information pour la constitution des bases (Bordin, 2002, p. 90).

Le projet OCS GE a lui-même généré des travaux de recherche. Sa phase de réflexion, longue du fait de la nouveauté des problématiques traitées6, est toujours en cours. Depuis le lancement du projet, l'IGN a participé avec le CERTU (Centre d'Études sur les Réseaux, les Transports, l'Urbanisme et les constructions publiques) et DGALN (Direction Générale de l'Aménagement, du Logement et de la Nature) au groupe de travail pour la production d'une nomenclature nationale. Un état de l'art des productions d'autres pays comme l'Espagne, et l'Autriche, et sur CLC a été réalisé. Une thèse au laboratoire COGIT de l'ENSG a été réalisée sur le suivi des phénomènes géographiques (Bordin, 2006). Une thèse au laboratoire MATIS de l'IGN sur l'utilisation de différents capteurs pour la mise à jour a été lancée, de même que des tests sur l'identification automatique de la végétation en milieu urbain (De Blomac, 2012).

Ce mémoire ne propose pas de nouveaux éléments dans les recherches sur l'intégration du temps dans les SIG. Il reprend leurs modèles afin de participer à la réflexion autour du projet OCS GE dans le cadre plus restreint du RGFor. Il comportera donc également une analyse plus spécifique sur les données forestières et le suivi des espaces forestiers (Felten, 1997 ; Andrault, 1997).

Problématique

Le sujet de ce mémoire est en premier lieu une recherche en vue de résultats : fondée sur l'état de l'art et l'analyse de l'existant, elle doit aboutir à des propositions. Ces propositions décriront un processus, c'est-à-dire un modèle, une méthodologie d'historisation. Nous définissons l'historisation comme l'intégration de la dimension temporelle aux données. Pour pouvoir faire ces propositions, nous devrons décrire les aspects techniques, et analyser les aspects thématiques, propre aux bases de données d'occupation du sol : bases composées d'objets surfaciques complexes représentant des entités géographiques. Pour être appliqués au RGFor, ces aspects devront être approfondis pour la forêt en France, sa définition, sa composition, sa gestion, son évolution.

Pour répondre à cette demande, il faudra donc nous interroger sur les concepts de temps, d'objet, de suivi et d'évolution ; des procédés techniques tels que la mise à jour ; et les modèles d'intégration du temps dans les SIG.

6 L'OCS GE est un projet original, de par son échelle, sa production à partir de sources multiples aux spécifications de productions différentes (collectes, télédétection) en partenariat avec les utilisateurs, et sa nomenclature fondée sur INSPIRE qui distingue quatre aspects de l'occupation du sol : couverture, fonction/usages, morphologie et caractéristiques.

20

Ces interrogations peuvent être résumées par deux questions :

? Comment modéliser une base de données permettant de visualiser, d'interroger, un instant T, et de répondre aux requêtes spatiales « quoi, comment, où ?» et à la requête temporelle « quand ? » ?

? Et plus spécifiquement : selon quel modèle modifier le RGFor afin de pouvoir intégrer la dimension temporelle des données géographiques lors de la mise à jour ?

Ce questionnement doit résoudre la problématique de l'observation d'un territoire géographique à un instant donné dans le passé ou dans le futur. L'enjeu est le suivi environnemental. Pour l'IGN, c'est un défi technique qui a pour but de satisfaire la demande des utilisateurs (collectivités, ministères, services de l'État, ...). C'est également un enjeu conceptuel, lié à l'histoire de l'institut et à sa tradition cartographique. La prise en compte de la dimension temporelle dans la base de données implique le détachement du modèle cartographique statique vers un modèle de SIG cinématique/dynamique libéré du format papier. Enfin, il s'agit également de proposer une solution fondée sur le modèle de la BDUni afin de fournir une description absente de la documentation de l'IGN d'une part, et, d'autre part, de promouvoir le développement d'une solution interne.

Afin de répondre à ces questions, nous décrirons, dans un premier temps, le RGFor (Chapitre I), ses caractéristiques techniques et ses besoins spécifiques quant à l'intégration de la dimension temporelle. Puis, nous étudierons les réflexions sur la dimension temporelle, les processus de mise à jour des bases de données géographiques numériques ainsi que sur les méthodes conceptuelles et techniques permettant la prise en compte de la dimension temporelle dans les SIG (Chapitre II). Suite à cela, nous réaliserons une analyse des processus d'historisation des bases de données d'occupation du sol, d'abord internes à l'IGN (BDUni) puis externes (CLC, bases régionales), et des outils de gestion de la temporalité existants (Chapitre III). Enfin, à partir des spécificités du RGFor, de la théorie et de la pratique, nous proposerons des solutions concrètes, notamment afin d'adapter le processus interne pour l'historisation et la gestion de la mise à jour du RGFor (Chapitre IV).

Figure 1 : Structure du mémoire d'après un schéma de construction d'une base de données (Source : Hainaut, 2011)

21

Méthodologie, moyens

Le mémoire a été rédigé à partir des sources documentaires internes, complétées par des recherches bibliographiques et des entretiens avec les personnes ressources.

Notre sujet relevant de l'évolution d'une base de données, nous avons repris dans notre raisonnement le schéma classique de méthode de construction de base de données illustré par la Figure 1 (les cercles représentent les étapes du mémoire, les rectangles celles de la mise en place d'une base de données). Plusieurs terminologies sont employées pour décrire le contenu d'une base de données : fichiers, enregistrements, champs ; relations, n-uplets, attributs ; tables, lignes, colonnes. Par souci de cohérence et de simplicité, nous n'emploierons que la troisième terminologie, celle associée au langage SQL (Date, 2004, p. 6).

Un bureau équipé d'un ordinateur avec accès à l'Internet et à la documentation de l'IGN a été mis à disposition au cours du stage. Les logiciels PGAdmin, OpenJump, GeoConcept, et ArcGis ont été installés sur ce poste. Un jeu de données de la dernière version du RGFor et des ortho-photographies (de 2006 et de 2010) du département des Hautes-Pyrénées furent également mis à disposition.

Notre maître de stage fut la personne de référence sur le RGFor. Les informations sur la BDUni ont été recueillies lors d'entretiens réalisés avec Laurent Breton, Frank Fuchs, Bruno Bordin, Clothilde Mohsen, Fabien Gruselle et Mickaël Michaud du service des bases vecteurs, du service développement et de la MAJEC à l'IGN. Sophie Foulard, responsable du MOS à l'IAU IDF, et Marie Christine Schott, chef du Service Informations Géographiques et Statistiques (SIGS) à la Direction de l'Environnement et de l'Aménagement de la région Alsace ont été interrogées sur le processus d'historisation des bases régionales d'occupation des sols. Nous avons également interrogé, sur la modélisation du temps dans les bases de données, Ana-Maria Olteanu Raimond du laboratoire COGIT de l'IGN et Christine Plumejeaud, ayant travaillé dans le même laboratoire.

Le processus d'historisation de la BDUni a fait l'objet de la rédaction d'un rapport détaillé joint en annexe du mémoire.

Le stage s'est déroulé de février à mai 2013. Il fut prolongé d'un mois en août. L'objectif de ce mois de stage supplémentaire était d'évaluer concrètement les capacités et la faisabilité des propositions énoncées dans la première version du mémoire soutenue en juin, en montrant les résultats possibles et en identifiant les besoins d'automatisation des traitements.

22

23

CHAPITRE I - Caractéristiques techniques et besoins spécifiques du RGFor quant à l'intégration de la dimension temporelle

L'objectif de ce chapitre est de définir le référentiel géographique forestier. Nous présenterons le RGFor, son contenu, les besoins de ses utilisateurs et les évolutions de son thème au cours du temps.

I.A - Présentation

Le RGFor est la base de production des données d'occupation des sols qui sert à constituer la cartographie forestière de la BD Forêt® version 2, distribuée depuis 20077, et la couche végétation de la BD Topo®. Il est issu de la collaboration entre l'IGN et l'IFN (Inventaire Forestier National) qui étaient chargés de sa production en partenariat jusqu'à la fusion entre les deux établissements au premier janvier 2012. Depuis cette fusion, une nouvelle section environnement est en train de se mettre en place au Service des Bases Vecteurs, chargé du RGFor, de la couche végétation, et du projet OCS GE.

L'IFN était un établissement public, chargé par le ministère de l'Agriculture et de la Pêche d'assurer la permanence de l'évaluation des ressources forestières métropolitaines. De 1986 à 2006, il a assuré le fonctionnement d'un SIG permettant la réalisation des cartes forestières départementales de la BD Forêt® version 1. Cette première version possédait une nomenclature d'une précision variant de la quinzaine à la soixantaine de postes entre les départements, selon leur diversité forestière.

Depuis 2006, l'information produite a fortement évolué. La BD Forêt® version 2 (Figure 2) a été créée : sa précision est passée de 2,25 ha à 0,5 ha, avec une nomenclature nationale unique plus détaillée, un cycle de production de 10 ans, et une méthode de mise à jour qui doit évoluer.

Figure 2 : Extrait de la BD Forêt® version 2, centré sur Baud dans le département du Morbihan (Source : Plaquette de présentation BD Forêt®, IGN).

En version 1, la mise à jour consistait à relancer entièrement le processus de production, sans réutiliser les données précédentes. Cette méthodologie était due à « l'évolution des référentiels

7 « BD Forêt® version 2 », http://inventaire-forestier.ign.fr/spip/spip.php?rubrique53, consulté le 29/04/2013.

24

numériques disponibles à un instant donné, des techniques de production et de stockage de l'information, ainsi qu'en raison de l'évolution des nomenclatures utilisées8 ». Elle était consommatrice de temps de production et d'espace de stockage, puisque la base devait être entièrement recréée à chaque mise à jour.

La version 2 ne connait plus ces problèmes. Les ortho-photographies utilisées comme référentiels numériques pour la production de la cartographie ont atteint un seuil de précision permettant d'affirmer qu'une précision plus importante ne sera plus utile à la photo-interprétation. De même les outils de production et de stockage, et la nomenclature ne doivent plus changer (Source : entretien avec T. Touzet).

Il est donc désormais techniquement possible d'intégrer la mise à jour des données au sein d'une base de données unique, et donc d'élaborer un nouveau modèle de mise à jour de façon différentielle.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"L'imagination est plus importante que le savoir"   Albert Einstein