Rechercher sur le site:
             
 
Web Memoire Online

Consulter les autres mémoires    Publier un mémoire    Une page au hasard

Geomarketing : localisation commerciale multiple


par Jérôme Baray
Université de Rennes I - Doctorat
Traductions: Original: fr Source:

Disponible en mode multipage

ÉCOLE DOCTORALE

de Sciences Économiques et de Gestion

de l'Université de RENNES I

LOCALISATION COMMERCIALE MULTIPLE:

UNE APPLICATION DU TRAITEMENT DU SIGNAL ET DU MODELE P-MEDIAN AU DEVELOPPEMENT D'UN RESEAU DE MAGASINS DE PRODUITS BIOLOGIQUES

THÈSE DE DOCTORAT DE L'UNIVERSITÉ DE RENNES I

MENTION SCIENCES DE GESTION

Mention très honorable avec félicitations du jury.

Présentée et soutenue publiquement par

Jérôme BARAY

le 3 décembre 2002

JURY

Directeur de thèse

Rapporteurs

Suffragants

Gérard CLIQUET

Jacques-Marie AURIFEILLE Alain JOLIBERT

Philippe ROBERT- DEMONTROND

Alexandre STEYER

Professeur à l'Université de Rennes I

Professeur à l'Université de la Réunion

Professeur à l'Université Pierre Mendes- France de Grenoble

Professeur à l'Université de Rennes I,

Professeur à l'Université de Paris I

Centre de REcherche Rennais en Economie et en Gestion

UMR CNRS C6585

IGR-IAE : 11 Rue Jean Macé - CS 70803 - 35708 Rennes Cédex 7 France : 02 23 23 77 77 Fax : 02 23 23 78 00

LOCALISATION COMMERCIALE MULTIPLE :

UNE APPLICATION DU TRAITEMENT DU SIGNAL ET DU MODELE P-MEDIAN AU DEVELOPPEMENT D'UN RESEAU DE MAGASINS DE PRODUITS BIOLOGIQUES

Sommaire

Introduction générale...........................................................................................................1

Partie I : La localisation commerciale multiple: enjeux et théories............19

Chapitre 1 : Enjeux et pratiques de la localisation commerciale .........................................20

Chapitre 2 : Les théories de la localisation ..........................................................................57

Chapitre 3 : L'apport du traitement du signal dans le modèle p-médian ............................113

Partie II : La localisation d'un réseau .................................................................193

Chapitre 4 : Analyse d'un réseau de points de vente de produits biologiques dans l'Ouest parisien ..........................................................................................................194

Chapitre 5 : Mise au point d'un système rapide d'aide à la décision de localisation ..........240

Chapitre 6 : Comparaison et implications managériales et stratégiques ............................260

Conclusion générale .........................................................................................................300

Bibliographie.....................................................................................................................312

Table des matières ............................................................................................................332

Tables des illustrations.....................................................................................................335

Annexe A : Cartes des clients géocodés par arrondissement et communes de périphérie ...........339

Annexe B : Répertoire français-anglais des termes du traitement du signal et de

l'analyse automatique d'image ......................................................................344

Introduction générale

Les regroupements massifs des réseaux de distribution ces dernières années et la

conjoncture fluctuante et imprévisible ont rappelé que leur organisation n'était jamais figée et restait soumis à la loi impitoyable de la concurrence. De 1995 à 2000 surtout, les opérations

de fusions-acquisition se sont répandues dans l'ensemble des pays développés en atteignant la dernière année 1143 milliards de dollars, soit une progression de 49,2 % en 1999 (source www.Ipsofaxo.com). L'Union Européenne, à elle seule, a compté pour 64,4 % de ces réorganisations et les Etats-Unis pour 14,6 %. Les avantages recherchés sont en général :

1°) l'effet de taille : une entreprise de taille optimale permettrait d'atteindre une meilleure rentabilité, mais cette hypothèse est sujette à de nombreuses controverses (par exemple dans le domaine bancaire, de petits établissements centrés sur leur clientèle peuvent coexister à côté de mastodontes) 316;

2°) des économies d'échelle : une fusion permettrait de réduire les coûts de

fonctionnement même si les coûts humains et organisationnels, parfois imprévisibles, peuvent perturber le simple calcul économique des gains escomptés par une telle manoeuvre.

Mais l'avantage le plus immédiat d'une fusion est d'obtenir une part de marché plus importante sur son secteur et dans le cas de la distribution de biens ou de services, une bien meilleure présence et une couverture du marché géographique, un accès plus aisé aux grands médias et une meilleure efficience logistique317. Cela dit, certaines entreprises subissent plutôt

les fusions qu'elles ne les souhaitent réellement, sachant que celles-ci sont souvent le résultat

de la déréglementation des marchés comme dans le secteur de la banque ou de l'assurance 318

(réduction des entraves à l'accès aux services financiers de détail).

316 FILSER M. (1998) Taille critique et stratégie du distributeur. Analyse théorique et implications managériales,

Décisions Marketing, Numéro : 15, p.7-16.

317 CLIQUET G. (1998) Valeur Spatiale des Réseaux et Stratégies d'Acquisition des Firmes de Distribution, in

Valeur, Marché et Organisation, Ed. J-P. Brechet, Presses Académiques de l'Ouest.

318 UNI-Europa Finance (2000) L'impact des Fusions dans le Secteur de la Banque et de l'Assurance, Rapport

Interne d'Entreprise, janvier 2000.

Les fusions ou tout simplement les difficultés financières des entreprises ne sont pas les seules responsables des réorganisations de réseaux de distribution ou de l'appareil industriel.

Le progrès technique et l'introduction de nouvelles technologies (Internet, distributeurs automatiques) remettent périodiquement en question en particulier la pertinence des localisations commerciales. Par exemple en Belgique, alors que le nombre d'agences bancaires a diminué de 24 % de 1993 à 1998 (en passant de 17 757 à 13 444 en 5 ans), le nombre de distributeurs automatiques de billets s'est accru de 150 % (2 636 distributeurs à

6 323)319. Afin de compenser cette baisse importante du nombre d'agences, les banques

développent en parallèle les services de banque par téléphone ou sur Internet moins coûteux

en terme d'exploitation.

Ainsi, des dizaines de grandes entreprises et des centaines de filiales cherchent à ou se voient contraintes de restructurer leur mode de production dans les secteurs industriels et leur réseau de distribution pour celles dont l'activité se situe dans le domaine de la distribution des biens ou des services. Ces quelques lignes du rapport d'activité d'une grande entreprise comme France Télécom sont évocatrices : « Amorcé en 2000, un programme de relocalisation vise à implanter les agences dans les meilleures zones de chalandise. A la fin

2001, près de la moitié des agences auront été relocalisées »320. Cette société en proie à des

difficultés financières compte en effet selon d'autres propos fermer à moyen terme 10 % de

ses agences, agences qui regroupent 35 % des effectifs de l'entreprise soit près de 130 000

salariés321. De nombreux cas illustrent, de manière concrète, l'impact énorme d'une fusion sur

les implantations commerciales des sociétés. La fusion de la banque Lloyds avec le TSB Group en décembre 1995, a propulsé l'ensemble au deuxième rang des groupes bancaires britanniques, derrière le géant HSBC-Midland. Cela s'est traduit par un bénéfice avant impôt

de 31 milliards de francs en 1997 en hausse de 26 % et un profit net de 23 milliards en hausse

319 Source des données : entreprise ABB.

320 FRANCE TELECOM (2001) Rapport d'Activité de la Société, Mars 2001.

321 LES ECHOS (2001) Les Echos Magazine, parution du 28 août 2001.

de 48 % par rapport à 1996 : « deux ans après la fusion, le groupe a déjà réduit ses coûts de fonctionnement annuels de 2,2 milliards de francs et prévoit encore de réaliser 4 milliards d'économies à travers l'intégration des deux réseaux d'ici 1999. L'intégration des réseaux des deux banques devrait se traduire par la fermeture de 650 agences et 10 000 suppressions

d'emplois (sur un effectif de 82 500 salariés). » 322

Pour des entreprises comportant plusieurs centaines de points de vente ou même plusieurs milliers comme dans le cas des agences de compagnies d'assurance ou de banque, la réorganisation d'un réseau s'avère être une tâche colossale. Chaque point de vente ou agence doit être passé à la loupe, comparé en termes de rentabilité, de chiffre d'affaires et de zone de chalandise par rapport à ses plus proches voisins dans certains cas concurrents par le passé et désormais, partenaires d'un même réseau. Les sacrifices sont très souvent inévitables pour éviter le double emploi de points de vente et améliorer la rentabilité du nouvel ensemble. Cet examen en détail des situations individuelles de chaque élément du réseau doit être particulièrement bien mené afin de ne pas supprimer des points de vente ou des agences stratégiques pour la bonne rentabilité ou même pour la survie du groupe. Ce constat est tout aussi valable dans les services publics que privés. Par exemple pour la Poste Suisse soumis à une prochaine libéralisation du marché de la distribution du courrier : "dans un délai de cinq ans, l'entreprise va réduire ce réseau de 140 à 180 unités par année, pour conserver à terme

2500 à 2700 offices de poste. Cette évolution se déroulera dans des conditions sociales acceptables, et le service public restera garanti sur l'ensemble du territoire national. Les syndicats ont donné leur accord à la procédure envisagée, qui, à terme, permettra à la Poste d'économiser quelque 100 millions de francs par année.323" Les bureaux de poste avec leur

hiérarchie (bureau de poste principal ou secondaire) constituent les éléments d'un réseau dans

322 BEHBAHANI A. et HOZMAN H. (1998) La Concentration dans le Secteur Bancaire, Mémoire de maîtrise d'Economie mention Economie Internationale, Monnaie et Finance, Université des Sciences Sociales de Toulouse.

323 LA POSTE SUISSE (2001) Communiqué de Presse , http://www.poste.ch

la distribution du courrier avec les centres de tri en amont et les facteurs en aval qui acheminent le courrier à domicile. On conçoit donc aisément que la suppression d'un bureau

de Poste engendre des conséquences notables sur l'organisation de tout le réseau de distribution du courrier. Même chose pour d'autres services publics comme les réseaux de services hospitaliers qui cherchent dans la majorité des pays à rationaliser leur fonctionnement.

Parfois, ne s'agit-il pas forcément d'une suppression pure et simple, mais d'un recentrage de deux activités ou plus en une relocalisation plus optimale. Mais encore faut-il que les différentes parties impliquées de près ou de loin dans le fonctionnement de ces activités (dirigeants, salariés, clients, fournisseurs ou même hommes politiques) trouvent leur compte dans ce recentrage. Ainsi en est-il du cas de figure suivant qui illustre la réorganisation d'un ensemble de cinq sites hospitaliers dans le canton de Vaud en Suisse où il s'agissait de choisir entre le statu quo, le regroupement en deux monosites ou bien la création

d'un monosite entraînant la disparition des centres de soin initiaux324.

Introduction - Fig. 1: Scénarii de la réorganisation de sites hospitaliers dans le canton de Vaud

Les critères de sélection entre ces trois scénarii retenus étaient la taille optimale du bassin de captation, la flexibilité, l'accessibilité et la proximité des installations vis-à-vis du public, et la rentabilité ou l'efficience relative de chaque scénario.

324 CAP GEMINI / ERNST & YOUNG (2000) Etudes de Divers Scenarii d'Organisation liés aux Hôpitaux du

Chablais et de la Riviera, Rapport Final pour le Département de la Santé / Service Santé Public, p.3-16

Introduction - Fig. 2 : Notation des scénarii de la réorganisation de sites hospitaliers dans le canton de Vaud

Un système de notation pondérée a bien mis en évidence que le scénario 3 du regroupement des cinq hôpitaux en un seul était le cas le plus favorable bien que l'on puisse s'interroger sur la rationalité du système de notation non-explicité. Mais, les différents acteurs

ont tous eu des vues différentes sur le site exact d'implantation de cet hôpital unique, les dirigeants des cinq centres souhaitant chacun agrandir le leur au détriment des autres, les habitants désirant être au plus proche du futur site,... d'où un gros problème décisionnel en perspective qui ne pourra que retarder le projet ou même remettre en cause le choix du scénario du site hospitalier unique pour la région ! D'autres contraintes dans le processus de réorganisation viennent alors immédiatement à l'esprit : comment établir un processus de décision plus rationnel avec une force de démonstration telle que le scénario en découlant fasse l'unanimité entre tous les acteurs ?

D'un autre côté, on remarque depuis les années 60, une profonde mutation dans la distribution des produits et des services caractérisée par la réticulation des activités commerciales 325. Bien que l'apparition des premières chaînes de magasins date de la seconde moitié du XIXème siècle, le développement des réseaux d'agences bancaires, de supermarchés et hypermarchés, de concessionnaires automobiles, de chaînes d'hôtels s'est

considérablement accéléré. On évalue qu'à l'heure actuelle, les chaînes de magasins

325 CLIQUET G. (2000) Plural Form in Store Networks : A Model for Store Network Evolution, The

International Review of Retail, Distribution and Consumer Research, vol. 10, n°4, pp 369-387.

représentent près de la moitié du commerce du détail aux Etats-Unis 326 327. Les formes organisationnelles prises par ces groupes sont variées. L'organisation en succursales même si elle coûte cher, favorise l'opérateur du réseau en ce qui concerne son pouvoir et le contrôle

des différentes entités. Le système de franchise outre son développement à moindre coût, permet au réseau d'avoir une réactivité plus élevée sur le marché local, tout comme d'accéder

à une connaissance plus fine du marché et de responsabiliser les gérants qui possèdent alors

une affaire bien à eux 328 329. Des formes mixtes associant succursales et franchises permettent dans certains cas, de tirer profit des avantages de chaque type d'organisation en particulier par

330 331 :

? une plus grande souplesse stratégique : il est plus facile d'acquérir par exemple des hôtels individuels en proposant à l'entrepreneur une formule de rachat ou de franchise,

? une implication et une démonstration des capacités du franchiseur accrues par sa responsabilisation,

? une meilleure efficacité économique : les franchises stimulent le développement du réseau et les filiales participent beaucoup à l'amélioration des résultats financiers 332,

? une plus grande souplesse d'organisation : il est plus facile à une organisation mixte de répondre aux évolutions comportementales du client et de l'environnement juridique (loi Raffarin par exemple). L'innovation s'enrichit par un travail conjoint du franchiseur et

des franchisés tout comme l'information également de meilleure qualité.

326 BRADACH J.L. (1998) Franchise Organizations, Harvard Business School Press, Boston, Ma.

327 CLIQUET G. (2000) Plural Form in Store Networks : A Model for Store Network Evolution, The

International Review of Retail, Distribution and Consumer Research, vol. 10, n°4, pp 369-387.

328 BRICKLEY J.A., DARK F.H. (1987) The Choice of Organizational Form : The Case of Franchising, Journal

of Financial Economics, 18, 401-20.

329 CAVES R.E. , MURPHY II W.F. (1976) Franchising : Firms, Markets, and Intangible Assets, Southern

Economic Journal, 42, 572-86.

330 CLIQUET G. (2000) Plural Form in Store Networks : A Model for Store Network Evolution, The

International Review of Retail, Distribution and Consumer Research, vol. 10, n°4, pp 369-387.

331 BRADACH J.L. (1998) Franchise Organizations, Harvard Business School Press, Boston, Ma

332 BRIEC W., CLIQUET G. (1999) Plural Forms Versus Franchise and Company-owned Systems : A DEA Approach of Hotel Chain Performance, 28th EMAC Conference, Berlin, May, 11th-14th 5proceedings on CD-

ROM).

? une stimulation de la dynamique commerciale avec une concurrence plus constructrice entre les franchisés et les filiales. Au niveau local, l'animation commerciale est facilitée par l'effet synergique des efforts mis en commun de toutes les entités du réseau,

? une maîtrise de la rapidité de développement du groupe par rapport à l'assimilation du concept : le développement peut se faire rapidement par la création de franchises alors que les filiales permettent de mailler le territoire tout en assimilant graduellement le concept.

Ainsi, qu'il s'agisse de la création pure d'un réseau ou de sa réorganisation et quel que soit le mode d'organisation choisi, un choix précis de la localisation de ses différents points de vente est indispensable tout comme une certaine rapidité des prises de décision et de leur application dans ce domaine. Toute organisation commerciale doit en effet avoir une capacité

de réaction correspondante à la rapidité du changement afin d'assurer sa survie 333 334, cette

capacité de réaction se décomposant en temps de perception, temps de prise de décision et temps d'exécution. Il apparaît clair que la qualité de la décision concernant les localisations commerciales d'une chaîne dépendra étroitement de celle de son système d'information et que

la bonne exécution de la décision sera influencée par sa maîtrise. Concrètement, quelques mois de trop de fonctionnement d'un réseau "boiteux" peut aller jusqu'à représenter des millions ou des dizaines de millions d'euros de coûts supplémentaires pour un réseau d'importance moyenne (de quelques dizaines à trois cents points de vente) qui auraient été économisés si la procédure avait été plus rapide. Dans certains cas, un retard dans la restructuration d'un réseau est susceptible de pénaliser lourdement la performance d'une entreprise et de faire fléchir irrémédiablement le cours de ses actions même si ce retard n'est

pas forcément imputable au processus de restructuration lui-même. En témoignent les

333 VERAN L. (1991) La prise de Décisions dans les Organisations : Prise de Décision et Changement, Les

Editions de l'Organisation.

334 CLIQUET G. (2000) Plural Form in Store Networks : A Model for Store Network Evolution, The

International Review of Retail, Distribution and Consumer Research, vol. 10, n°4, pp 369-387.

péripéties de la réorganisation de Swiss Telecom planifiée dès sa privatisation partielle : "si Swiss Telecom n'aura pas à supporter une lourde dette, son plan de restructuration va tout de même engloutir 3 à 4 milliards de francs. Sans attendre l'issue des débats parlementaires, l'entreprise prépare déjà la réforme de ses structures et devrait annoncer sous peu les noms

de ses futurs dirigeants. Plus qu'un affrontement entre la gauche et la droite, le Parlement redoute le lancement d'un référendum. A l'origine, la Suisse voulait prendre l'Europe de vitesse. Au mieux, elle aura quelques mois d'avance. Au pire, en cas de votation populaire, deux ans de retard. Dans un tel scénario, le capital de Swiss Telecom serait considérablement dévalué. Car, en l'an 2000, le marché des télécommunications sera agité et risqué."335 La compétitivité d'une grande entreprise comme Swiss Telecom peut donc être amoindrie d'une manière irréversible si la réorganisation de son réseau commercial n'est pas effectuée en temps et en heure. Il s'agit donc non seulement de ne pas rater le train du changement quel

qu'en soient les motifs, mais aussi de savoir très vite où l'on veut diriger l'entreprise.

D'où cette problématique gestionnaire qui en découle : quel outil de réorganisation ou de déploiement d'un réseau de points de vente sur le plan de la localisation à la fois rapide, précis

et démonstratif peut-on utiliser dans un tel cas ? Il s'agit également de ne pas perdre de vue, dans cette réflexion managériale, le fonds de commerce des points de vente à savoir, leur clientèle. Les grands distributeurs, les banques, les assurances possèdent des bases de données très élaborées sur leur clientèle. Les data warehouse ou "entrepôts de données" qui rassemblent l'ensemble des données (marketing, comptables, ressources humaines, achats, production,...) de l'entreprise, mais aussi son système d'information décisionnel en sont un

exemple.

335 L'HEBDO (1998) Le "T"qui Vaut 20 Milliards de Marks, L'Hebdo N°47, 21 novembre 1996

Introduction - Fig. 3 : Schéma d'un data warehouse classique dans une entreprise336

Adossés au data warehouse, les outils de data mining ou de "forage des données" ou encore

"d'extraction de la connaissance" font apparaître les corrélations cachées qui existent au sein

du gisement de données de l'entreprise. Ces outils sont de trois types : les filtres qui sélectionnent certaines catégories de données (ex: les points de vente ayant un chiffre d'affaires inférieur à moins de 80 % de l'objectif), les outils fondés sur l'intelligence artificielle qui découvrent des relations logiques entre les variables, les agents intelligents capables de naviguer en permanence dans les différentes bases de données et élaborent ainsi

de nouvelles connaissances même en l'absence de l'utilisateur.

En particulier, les hypermarchés se sont constitués des bases de données monumentales à partir des sorties de caisse qui répertorient le type d'achats effectués par les clients (nombre d'articles, panier moyen, liste des articles par client obtenus classiquement grâce au système code barre / scanner, et également possibilités de suivi des achats de certains clients identifiés par leurs moyens de paiement ou par leur carte de fidélité,...). Les magasins d'importance plus modeste, les hôtels, les restaurants peuvent aussi se constituer ce type de données toujours grâce à un matériel informatique et des logiciels spécifiques (Ok-Gestion,

336 Source : http://www.businessdecision.com

WinCash, Gest-Mag pour les caisses individuelles, Cocktess pour les restaurants ou bars, SHS

pour les hôtels, Columbus ou Winmaster pour des caisses en réseau,...).

Les distributeurs automatiques savent également établir des statistiques très précises

sur leurs clients et peuvent même les suivre à la trace. Les sociétés de transport public, les sociétés de gestion des autoroutes ou de parking, les cinémas ont développé des cartes à puce avec et sans contact qui permettent au client de franchir péages, portillons de station de métro, parkings ou salles de cinéma (systèmes commercialisés par la société Ascom et King Products Inc.),... De la même façon, les agences bancaires possèdent un suivi des retraits d'argent à partir de leurs distributeurs automatiques de billets (ex. logiciel Prognis pour DAB).

Les cabinets d'études de marché et les organismes spécialisés dans les habitudes de consommation, eux aussi, ont entre leurs mains des millions d'adresses de clients potentiels

par secteur, par produit, par segment de marché : Consodata revendique par exemple le fait de posséder 22 millions de fiches nominatives sur les citoyens de 4 pays. Une société comme DoubleClick possède une technologie particulière lui permettant de connaître les habitudes de navigation de plusieurs millions d'internautes grâce à l'utilisation de cookies (fichiers résidents sur le disque dur rassemblant des informations personnelles du surfeur localisé sur le réseau Internet).

Les "géodonnées" sur les consommateurs ne manquent donc pas, mais les moyens de les exploiter de manière concrète font cruellement défaut. Les systèmes d'information géographique, les fameux SIG, constituent l'outil classique utilisé par un bon nombre d'entreprises pour analyser leurs données géomarketing337. Ces systèmes ne permettent malheureusement en fait que d'établir des cartographies un peu élaborées. Parmi ces SIG,

citons les principaux :

337 CLIQUET G. (2002) Le Géomarketing : Méthodes et Stratégies du Marketing Spatial, Hermès, Paris.

· MapInfo : "Reconnu comme étant l'outil cartographique le plus puissant et le plus intuitif

en environnement bureautique, MapInfo Professional est distribué dans 54 pays, en 20 langues."338 Parmi les seuls outils d'analyse marketing de MapInfo, on trouve un générateur d'isochrones, d'isodistances ou d'isocoût à partir d'un centre géographique donné (outil Chronomap).

· MacMap : "il permet de créer et d'exploiter des bases de données intégrant une représentation des éléments géographiques (points, axes, surfaces...), associées à des données de format quelconque (numérique, alphabétique, date, heure...). Il est naturellement possible d'effectuer des requêtes (géographiques ou non) à partir de cette base de données, comme par exemple, chercher les points de vente situés le long de la N20 générant plus de 4 % du CA total, et de générer de nouvelles données et

cartographies grâce à des modules de calcul."339

Il existe encore de nombreux autres SIG tels Logicarte-SIG ou Carte & Données qui tous, n'offrent qu'une solution passive de représentation de données sous forme symbolique (points, camemberts, rectangles) superposée à une cartographie (appelée image raster et constituée de pixels) agrémentée de quelques opérateurs d'analyse statistique ou de création de requêtes, sans jamais intégrer une quelconque méthode de recherche de localisations optimales. L'absence de progrès des SIG dans ce domaine vient aussi sans doute de la difficulté technique d'établir une passerelle entre le géocodage et la représentation d'informations sur une carte et les techniques classiques de calcul des localisations optimales : au contraire d'une représentation planaire, ces techniques de localisation, nous le verrons plus loin, font en général au contraire appel à une représentation en réseau constitué de points (les noeuds du réseau) et de liaisons entre ces points. Le problème surgit donc du fait de l'incompatibilité entre la représentation en deux dimensions des cartographies d'informations géocodées et la

338 http://w3.claritas.fr : site Internet de Claritas France distributeur de MapInfo

339 http://www.macmap.com : site Internet du distributeur de Macmap

représentation monodimensionnelle des réseaux (voir plus loin les modèles de localisation- allocation340).

Nous démontrerons donc qu'il est possible de faire évoluer les systèmes d'information géographique existants vers de véritables outils de préconisation dans la recherche de localisations optimales. Nous établirons ainsi pour cela une passerelle entre les représentations cartographiques de ces systèmes et les réseaux utilisés traditionnellement en recherche de localisations. De plus, toutes les données très précises de localisation des consommateurs, réels ou potentiels, doivent pouvoir être prises en compte dans un nouvel outil de décision capable d'aiguiller le manager sur les emplacements optimaux des futurs

points de vente de son réseau. Tel est en effet le but de notre présente démarche : découvrir et

démontrer la faisabilité d'un nouvel instrument de décision précis, rapide et également

démonstratif pour sélectionner les meilleurs emplacements commerciaux dans l'optique d'une

restructuration ou de la création d'un réseau de points de vente.

Il est un fait que cet outil performant ne connaît à ce jour pas réellement d'existence, chose confirmée par la lenteur des réorganisations de réseaux qui même, sans connaître de problèmes sociaux, peuvent prendre de nombreuses années. La majorité des responsables que nous avons interviewés (Chambre Syndicale des Banques Populaires, AGF, Groupe Etam, CCF, Groupe AXA) nous ont d'ailleurs généralement fait part d'un déficit de méthodes en ce

qui concerne l'optimisation de la localisation des agences ou des boutiques malgré l'énorme quantité de données disponibles : trop d'informations tue l'information pourrait-on clamer ! Qu'il s'agisse de la création pure ou bien de la réorganisation d'un réseau, le manager est constamment en proie à des doutes, à des interrogations sur la méthodologie à suivre pour localiser de la meilleure façon ses futurs centres de profit. Il se sent généralement frustré et

impuissant devant tous ces monceaux de données géomarketing qu'il n'a pas les moyens

340 WEBER A. (1909) Über den Standort der Industrien, Tübingen, Traduction Anglaise de Friedrich (1929)

Theory of the Location of Industries, University of Chicago Press, Chicago.

d'exploiter ce qui est renforcé par le fait que son Directeur lui demande de justifier très précisément tous ses choix de localisation. Cela est sans compter que les conséquences d'une mauvaise décision d'implantation ne restent jamais inaperçues et se révèlent très rapidement dans les résultats financiers désastreux engendrés. L'investissement souvent onéreux dans les surfaces commerciales, est lui-même de nature pratiquement irréversible et des erreurs de localisation risquent d'obérer à jamais la rentabilité future de l'ensemble du réseau.

Quels sont aujourd'hui brièvement les moyens à disposition du décideur pour sélectionner la (ou les) localisation(s) optimale(s) dans la perspective d'une création intégrale

ou d'une réorganisation de points de vente ? Les principales méthodes de choix de localisations se fondent sur les modèles gravitaires ou d'interaction spatiale341 et sur les modèles de localisation-allocation. D'une manière générale, ces méthodes comparent plusieurs localisations potentielles en se fondant sur différents critères. Les modèles gravitaires342 343 344 ou d'interaction spatiale se fondant sur une analogie avec la loi de la gravitation, considèrent que chaque point de vente attire à lui d'autant plus de clients que son niveau d'attractivité est élevé. Cette attractivité est fonction de la proximité géographique du magasin avec sa clientèle ou encore d'autres facteurs comme la surface de vente 345. Le

modèle MCI (multiplicative competitive interaction) ou Modèle Interactif de Concurrence346

est une généralisation des modèles d'interaction spatiale pouvant intégrer d'autres facteurs d'attractivité que la distance ou la surface de vente tels que le service de paiement par carte bancaire, le nombre d'allées du magasin, le nombre de caisses, l'emplacement à une

341 WILSON (1971) A Family of Spatial Interaction Models, and Associate Developments, Environment and

Planning A, vol. 3, 1-32.

342 REILLY W. J. (1931) The Law of Retail Gravitation, W. Reilly ed, 285 Madison Ave, New York, NY.

343 CONVERSE P.D. (1949) New Laws of Retail Gravitation, Journal of Marketing 14, p.379-384.

344 GUIDO P. (1971) Vérification Expérimentale de la Formule de Reilly en Tant que Loi d'Attraction des

Supermarchés en Italie, Revue Française de Marketing n°39, p. 101-107.

345 HUFF D. L. (1964) Defining and Estimating a Trading Area, Journal of Marketing, Vol 28, p. 38.

346 NAKANISHI M. et COOPER L.G. (1974) Parameter Estimates for Multiplicative Competitive Interaction

Models: Least Square Approach, Journal of Marketing Research 11: 303-311.

intersection347 ou même des facteurs subjectifs comme l'image du magasin348 349 dans le MCI subjectif 350 351. Ainsi, il s'agit d'abord de calculer les différents paramètres d'une formule donnant la probabilité qu'un client fréquente tel ou tel point de vente en fonction des paramètres précités le plus souvent par la méthode classique des moindres carrés 352. Mais, les méthodes d'interaction spatiale sont lourdes à mettre en oeuvre et nécessitent un découpage

géographique du territoire à analyser, découpage qui, nous le verrons, peut difficilement ainsi être établi de manière rationnelle.

La seconde catégorie de méthodes de localisation est constituée d'un autre côté par les modèles de localisation-allocation et leur résolution353. Ces modèles (représentés en général sous forme de réseaux constitués de noeuds et de segments inter-noeuds) et en particulier le modèle p-médian, sont l'un des moyens les plus rationnels à disposition pour optimiser la localisation d'un ensemble de p points de vente par rapport à un ensemble de n clients354. Mais, malgré des méthodes de résolution parfois très pointues, la mise en oeuvre de ce modèle engendre un nombre de calculs si important que des solutions même approchées sont difficilement atteignables dès que le nombre de clients atteint quelques milliers compte tenu

du nombre considérable de configurations de magasins à passer en revue. D'autre part, les

solutions avancées par les hermétiques modèles de localisation-allocation ne sont ni très

347 JAIN K. et MAHAJAN V. (1979) Evaluating the Competitive Environment in Retailing Using Multiplicative

Interactive Model, Research in Marketing, Vol. 2, Jagdish Sheth ed., Greenwich, Conn.: JAI Press.

348 NEVIN J.R. et HOUSTON M.J. (1980) Image as a Component of Attraction to Intraurban Shopping Areas,

Journal of Retailing, Vol. 56, No. 1, pp.77-93.

349 COOPER L.G. et FINKBEINER C.T. (1983) A Composite MCI Model for Integrating Attribute and

Importance Information, Advance in Consumer Research, 109-113.

350 STANLEY T.J., SEWALL M.A. (1976) Image Inputs to a Probabilistic Model: Predicting Retail Potential, Journal of Marketing, 40 (July), 48-53.

351 CLIQUET G. (1995) Implementing a Subjective MCI Model: An Application to the Furniture Market,

European Journal of Operational Research 84, 279-291.

352 NAKANISHI M. et COOPER L.G. (1974) Parameter Estimates for Multiplicative Competitive Interaction

Models: Least Square Approach, Journal of Marketing Research 11: 303-311.

353 WEBER A. (1909) Über den Standort der Industrien, Tübingen, Traduction Anglaise de Friedrich (1929)

Theory of the Location of Industries, University of Chicago Press, Chicago.

354 ACHABAL D.D., GORR W.L. et MAHAJAN V. (1982) Multiloc : A Multiple Store Location Decision

Model, Journal of Retailing, 58, 5-24.

démonstratives, ni très convaincantes pour le décideur qui n'est généralement pas un homme

de l'art en la matière.

Dans la pratique, les professionnels font souvent appel à des méthodes statistiques plus simples et rapides mais très peu précises comme la méthode par le modèle de régression multiple ou la méthode analogique355 356. En se fondant sur l'expérience, ces méthodes essayent en général dans un premier temps d'identifier quels sont les paramètres et critères socio-économiques qui influencent la performance du point de vente, et ensuite détectent les zones géographiques répondant à ces conditions pour y implanter un futur magasin. Les méthodes statistiques sont intéressantes pour cerner grossièrement les zones géographiques possédant globalement un certain potentiel commercial, mais se révèlent incapables de positionner avec soin le (ou les) futur(s) point(s) de vente. Elles ne tiennent pas compte de la

localisation exacte des clients potentiels et ignorent en général la présence d'éventuels concurrents.

Nous pensons en revanche que les méthodes d'analyse dérivées de celles du traitement

du signal et de l'analyse d'image associés au modèle p-médian peuvent répondre aux critères

de rapidité, de précision et de capacité de traitement d'informations en grand nombre pour servir le géomarketing. En effet, les algorithmes développés pour traiter les images capturées

en temps réel enregistrent les performances de vitesse les plus élevées au monde357. Conçus

pour la rapidité, ils sont également capables d'assimiler d'énormes quantités de données puisque, à une image dynamique, correspondent au minimum plusieurs mégabits de données

par seconde. Ainsi, l'apport de notre démarche est constitué par l'introduction de méthodes

originales de filtrage et de convolution destinées à accélérer le traitement des données

355 APPLEBAUM W. (1968) The Analog Method for Estimating Potential Store Sales, Guide to Store Location

Research, Addison-Wesley, Reading, Mass.

356 ROGERS D.S. (1980) 5 ways to Evaluate a Store Location, Store Location, 42-48.

357 CHESNAUD C. (2001) Activité de Simag - Développement en Recalage, Tracking et Reconstruction 3D,

Aux Frontières de l'Instrumentation et du Traitement d'Image, Journée Thématique Organisée par le Pôle

Optique et Photonique Sud, Marseille, 20 mars 2001, p.11.

géomarketing, méthodes ayant déjà fait leurs preuves dans le domaine des "sciences dures" :

le filtrage permet par une multiplication de la valeur d'un signal à une ou plusieurs dimensions d'accentuer ou de lisser certaines parties dudit signal alors que la convolution consistant à intégrer un signal en utilisant un second signal comme poids offre la possibilité d'extraire par exemple les caractéristiques fondamentales d'informations géomarketing comme le contour des zones de chalandise. Ces moyens d'analyse issus de l'analyse d'image ou visionique nous serviront à introduire un nouvel algorithme fondé sur le modèle p-médian, pour faciliter la recherche de localisations optimales de points de vente, de points de services ou même

d'entrepôts dans le domaine de la logistique.

Ainsi, nous montrons au chapitre 1 dans la première partie de notre démarche, les enjeux de la localisation commerciale et nous présentons les méthodes actuelles de localisation faisant souvent appel à la notion de zone de chalandise tout en exposant leurs inconvénients. Dans le domaine de la localisation, les théories développées par de nombreux chercheurs, et objets du chapitre 2, ont largement devancé les méthodes utilisées en pratique, sans toutefois dans leur grande majorité, réussir à devenir populaire du fait de leur difficulté

de mise en oeuvre ou simplement de leur approche trop éloignée de la réalité. Ce chapitre nous permet d'introduire les modèles de localisation-allocation et en particulier le modèle p-médian dont les méthodes de résolution, on l'a dit, sont trop peu performantes pour donner lieu à des applications répondant aux attentes des professionnels. Le chapitre 3 offre une réponse à ce déficit de méthode en montrant comment les principes du traitement du signal rappelés à ce moment, peuvent améliorer considérablement la formulation d'un problème de localisation multiple : cette approche permet, nous le verrons, de modéliser un problème de localisation en partant d'une base de données de clients potentiels, de simplifier l'approche de la recherche de

localisations et de déterminer ainsi avec précision et de façon démonstrative les localisations

optimales tout en fournissant en parallèle des informations commerciales stratégiques comme

les limites de zones de chalandise ou leur importance.

La deuxième partie de notre thèse fournit l'occasion de mettre en pratique notre méthode combinant traitement du signal et modèle p-médian pour la recherche de localisations optimales de magasins distribuant des produits bio dans l'Ouest Parisien. Le chapitre 4 présente le marché récent et en plein développement du "bio" en France ainsi que les principaux réseaux commerciaux. Une base de données d'adresses de clients potentiels vis-à-

vis des produits biologiques est géocodée et modélisée sous la forme d'un modèle p-médian grâce à certaines fonctions du traitement du signal. Le chapitre 5 est l'occasion de résoudre le modèle simplifié obtenu pour dégager les localisations optimales de points de vente de produits biologiques. Enfin, le dernier chapitre montre la supériorité de notre méthode sur le plan de la précision, de la rapidité et de la démonstrativité comparée aux pratiques courantes dans le domaine de la localisation avec un éclairage particulier sur la localisation des réseaux

de points de vente. Ce cheminement intellectuel met naturellement en lumière les nombreux autres avantages du traitement du signal associé au p-médian dans la gestion du point de vente. Les perspectives d'un apport du traitement du signal à d'autres problèmes de

localisation-allocation comme la localisation de services publics seront alors évoquées

Partie I

La localisation commerciale multiple :

enjeux et théories

Chapitre 1 :

Enjeux et pratiques de la localisation commerciale

Introduction

Quel que soit le type d'activité commerciale considérée, le choix d'une bonne localisation est sans doute l'une des décisions les plus importantes qu'un manager doive prendre. L'emplacement du point de vente est en effet un investissement fixé sur le long terme et son choix bon ou mauvais se ressentira sur le niveau des ventes, sur la part de marché et sur la rentabilité de l'activité d'une manière d'autant plus importante que le niveau local de concurrence est élevé 358 359. Les prix peuvent être réexaminés, les services réorientés, les marchandises changées, mais une mauvaise localisation est une décision pénalisante parfois irréversible pour l'entreprise.

La sélection d'un site pour l'implantation d'un point de vente s'accompagne nécessairement, dans la plupart des cas, d'une mesure quantitative et parfois qualitative du potentiel commercial au voisinage du ou des emplacements pressentis, non seulement pour décider en finalité de la localisation la plus intéressante, mais aussi pour établir des prévisions de vente et élaborer une politique marketing adéquate. Nous verrons, dans le présent chapitre, précisément quels sont les enjeux de la localisation commerciale et comment déterminer ce potentiel commercial à travers la circonscription dans l'environnement du point de vente de la part la plus représentative des clients traditionnellement dénommée «zone de chalandise». La détermination de la zone de chalandise est en effet l'étape initiale fondamentale qui va orienter

la recherche d'une localisation optimale de points de vente. Il est préférable de focaliser sa recherche dans les zones géographiques les plus porteuses, les plus riches en clients pour ne

pas risquer de trouver une "aiguille dans une botte de foin" comme le dit le dicton populaire.

358 INGENE C.A. (1984) Structural Determinants of Market Potential, Journal of Retailing, Vol.60 N°I, p.37.

359 STANLEY T.J., SEWALL M.A. (1976) Image Inputs to a Probabilistics Model : Predicting Retail Potential,

Journal of Marketing, 40, P.48

Prendre la décision d'ouvrir un point de vente présente toujours le risque financier de

ne jamais voir l'activité devenir rentable : « alors qu'une bonne localisation engendrera un chiffre d'affaires et des profits élevés, une localisation pauvre se transformera en dettes. »360

Il sera possible cependant après coup de relocaliser le point de vente, mais au prix d'une charge financière importante361. De plus, l'échec d'une implantation peut avoir des conséquences sur l'image de l'entreprise auprès de la clientèle362. Au contraire, une localisation optimisée offrant un accès aisé aux produits ou aux services proposés drainera en

effet un grand nombre de clients et induira une rentabilité élevée. La localisation d'un unique magasin se fondera beaucoup sur la sélection et sur la comparaison de plusieurs sites potentiels. Les chaînes de magasins devront prendre en considération de nombreux facteurs comme les objectifs de l'entreprise, ses ressources (financières, managériales et autres), ses capacités commerciales et logistiques, la concurrence, le marché potentiel, la démographie, le comportement des consommateurs, les facteurs environnementaux influençant la tendance économique, les transports, les lois gouvernementales (impôts et taxes) sans compter un adroit

timing363. Le niveau à long terme de l'activité et de la rentabilité d'un tel réseau de magasins

dépendra alors beaucoup des interactions et des relations entretenues entre ses différentes localisations et forces de vente.

Il n'y a pas à proprement parler de recette-miracle ou une science bien ordonnée pour choisir

au mieux sa ou ses localisations commerciales. Alors que les décisions de choix d'implantation se fondaient dans les siècles précédents essentiellement sur un jugement

360 KIMES S.E. et FITZSIMMONS (1990) Selecting Profitable Hotel Sites at La Quinta Motors Inn, Interfaces

20, Mars-Avril 12-20.

361 ACHABAL D.D., GORR W.L. et MAHAJAN V. (1982) Multiloc : A Multiple Store Location Decision

Model, Journal of Retailing, 58, 5-24.

362 GHOSH A. et McLAFFERTY S. (1987) Location Strategies for Retail and Service Firms, Lexington Books, p.10.

363 APPLEBAUM W. (1952) Store Location Strategy Classes, Preface, Addison-Wesley Publishing Co.

subjectif fondé le plus souvent sur des check-lists de critères à respecter364, les années d'après-guerre marquées par la croissance des pôles urbains et l'augmentation des revenus ont conduit à la nécessité de mieux formaliser le processus de choix à travers le développement de techniques nouvelles. Cette évolution s'est faite parallèlement à la démocratisation de l'automobile et au déploiement de grands centres commerciaux de périphérie urbaine tout d'abord aux Etats-Unis puis en Europe. On attendait de ces nouvelles techniques non seulement la possibilité de pouvoir orienter au mieux le décideur vers un emplacement sinon optimal du moins optimisé, mais aussi de prédire avec une certaine exactitude le niveau d'activité du futur point de vente. Ainsi, les ventes du futur magasin étant évaluées, on aurait

moins de mal à convaincre et à rassurer les organismes prêteurs ou les investisseurs potentiels

à participer financièrement au projet d'ouverture. D'un autre côté, ces chiffres fournissaient la possibilité de fixer des objectifs réalistes à atteindre dans le centre de profit géré par tel ou tel manager. En comparant le niveau prévu avec le niveau effectif des ventes, il devient alors possible de cerner quels facteurs jouent sur l'activité et sur la rentabilité en se posant par exemple les questions de base : « quels facteurs affectent les ventes de différents points de vente ? » ; « pourquoi les ventes de deux points de vente sont-elles différentes ? ». L'analyse des différences de potentiel entre deux magasins met en évidence les facteurs externes sur lesquels la politique marketing n'a pas de prise et ceux relatifs à un marketing inefficace365.

Un exemple de facteur externe sur lequel il n'est pas possible d'agir et mis en évidence dans

un modèle de localisation est l'augmentation du prix du carburant automobile ou d'une manière générale l'augmentation du prix des transports qui érodent le chiffre d'affaires des grands centres commerciaux366. Le manager peut alors en prenant conscience des paramètres modulant l'activité de son point de vente, réorienter sa politique marketing si nécessaire et

364 JALLAIS J., ORSONY J. et FADY A. (1994) Marketing du Commerce de Détail, Vuibert, Paris.

365 GHOSH A. et McLAFFERTY S. (1987) Location Strategies for Retail and Service Firms, Lexington Books, p.11.

366 GAUTSCHI D.A. (1981) Specification of Patronage Models for Retail Center Choice, Journal of Marketing

Research, Vol. XVIII, 162-174.

même connaître l'impact de futures réorientations stratégiques ou celui de modifications dans

la structure concurrentielle ou économique avoisinante.

Avant de procéder à toute étude de localisation, il est cependant utile de bien déterminer quelle va être la clientèle future du point de vente et de la repérer dans l'espace. La connaissance précise des caractères des zones concentrant la clientèle baptisée zones de chalandise s'avère également nécessaire, si l'on veut prévoir la performance du futur magasin

en établissant par exemple des prévisions de vente au niveau du commerce de détail.

1.1 Enjeux d'une bonne connaissance de la zone de chalandise

Même si cela constitue un défi, définir et surveiller attentivement les frontières et les caractéristiques des zones de chalandise est stratégique pour la survie de magasins existants

ou pour projeter la création de nouveaux points de vente de détail ou de service. Dans le cas des magasins existants, l'analyse des caractéristiques de la zone de chalandise est utile principalement pour adapter continuellement la politique marketing afin d'attirer autant de clients que possible tout en contrebalançant l'effort commercial des concurrents s'exerçant en sens opposé. Dans le cas des nouveaux points de vente, l'évaluation des zones de chalandise donne l'occasion de juger l'intérêt d'un investissement à un endroit géographique spécifique aussi bien que d'établir des prévisions de ventes et de déterminer une future stratégie de vente.

La délimitation précise des zones denses de clients potentiels s'insère également dans la perspective de recherche d'une localisation optimale par une modélisation de type p-médian (voir plus particulièrement le paragraphe 1.3, le chapitre III et la deuxième partie).

On parle assez souvent de la zone de chalandise primaire367 pour désigner la partie de la zone

de chalandise qui contribue le plus fortement au chiffre d'affaires du magasin, c'est-à-dire à hauteur d'au moins 75 % du chiffre d'affaires mais sur une période entière et suffisamment

367 APPLEBAUM W. (1968) The Analog Method for Estimating Potential Store Sales, Guide to Store Location

Research, Addison-Wesley, Reading, Mass.

longue. Il arrive en effet que même des professionnels du marketing fassent des erreurs sur la période de référence à prendre en compte pour évaluer la zone de chalandise. Pour exemple,

ce magasin qui fut surpris de n'assister à aucune retombée positive de ses mailings et pour cause: il n'avait retenu comme base de son chiffre d'affaires que les mois de vacances et n'avait alors considéré pour ses relances postales que des clients de passage, des consommateurs vraiment très occasionnels368.

Lorsque la zone de chalandise ou au moins la zone de chalandise primaire a été définie avec

précision pour un point de vente existant, il est alors possible de procéder à différentes analyses fondamentales destinées à évaluer et à améliorer la performance du point de vente:

A- l'analyse du taux de pénétration du marché

B- l'analyse démographique

C- l'analyse de performance statistique

D- la recherche de consommateurs cibles

E- les promotions ciblées

A- l'analyse du taux de pénétration du marché

Il est intéressant suite à la délimitation de la zone de chalandise et en se procurant les données

de consommation et les données démographiques de déterminer soit le taux de pénétration ou d'emprise, soit la part de marché du point de vente. Cette analyse peut être conduite pour le point de vente dans son ensemble, pour chaque département ou encore par catégorie de produits ou pour chaque produit. Dans le cas d'un réseau de points de vente, on comparera ensuite ces taux avec ceux des autres magasins de manière à les classer par niveaux de performance.

368 http://visionarymarketing.com/articles/

B- l'analyse démographique

On peut, avant de sélectionner les catégories de produits à inclure dans l'offre ou même plus

en amont lors du choix de l'implantation d'un commerce, comparer les caractéristiques démographiques de la zone de chalandise du point de vente avec celles d'autres zones de chalandise aux performances connues. L'hypothèse que des performances identiques s'observeront dans des régions sert de base à la méthode analogique369 de délimitation des zones de chalandise, méthode exposée plus loin au paragraphe 1.3. Par exemple, dans les zones de chalandise où le niveau d'éducation est plus élevé, il sera plus facile de vendre des livres mais moins évident de commercialiser des cigarettes. Une segmentation de la clientèle pourra aussi être élaborée en comparant ses spécificités aux caractéristiques générales de la population résidant au sein de la zone de chalandise préalablement identifiée.

C- l'analyse de performance statistique

Comme on le verra un peu loin au travers du modèle de régression, il est possible grâce à une base de données incluant, par exemple, la part de marché du magasin, les spécificités de la concurrence et les caractéristiques socio-économiques, d'identifier les paramètres ayant un lien positif ou négatif de cause à effets sur la performance du point de vente370. Néanmoins,

ce type de modèle doit être utilisé avec prudence car une faible performance peut être due à

des raisons complémentaires à celles invoquées dans l'analyse.

D- l'identification de consommateurs cibles

Une bonne délimitation de la zone de chalandise permet aussi d'enquêter dans la zone à l'aide d'entretiens téléphoniques ou d'interviews, cela afin de spécifier avec précision le profil des

369 APPLEBAUM W. (1968) The Analog Method for Estimating Potential Store Sales, Guide to Store Location

Research, Addison-Wesley, Reading, Mass.

370 LORD J.D. et OLSEN L.M. (1979) Market Area Characteristics and Branch Bank Performance, Journal of

Bank Research 10, p. 102-110.

consommateurs. Des informations complémentaires peuvent être obtenues par des enquêtes répondant à des interrogations comme371 :

· quels autres concurrents les consommateurs fréquentent-ils et pourquoi ?

· pour quelles raisons les consommateurs ne fréquentent-ils pas le point de vente ?

· quelles perceptions les consommateurs ont-ils du magasin et des magasins concurrents sur

les points stratégiques du type prix, offre et service ?

E- les promotions ciblées

Enfin, une bonne délimitation de la zone de chalandise permet de cibler efficacement le consommateur par des courriers personnalisés, des mailings, des contacts téléphoniques ou

des tracts publicitaires au sein de l'aire spécifiée372. C'est donc en premier lieu les clients

potentiels qui seront contactés ce qui aura aussi pour effet de réduire sensiblement les coûts

de promotion en ayant un meilleur rendement (meilleur succès de la campagne de communication) et moins de déchets (contacts sans objet et ratés).

1.2 Définir précisément la zone de chalandise

De multiples définitions de la zone de chalandise ont été introduites depuis une cinquantaine d'années prenant pour fondement des approches variées. Mais que cette aire géographique s'apprécie par une approche comportementale, managériale, sociale, financière, commerciale

ou géographique, la zone de chalandise est une zone de peuplement qui se différencie des aires géographiques voisines par l'importance de son potentiel de consommation.

Ainsi, si l'on se réfère à toutes les définitions avancées, la zone de chalandise est en termes de pouvoir attractif:

371 DRUMMEY G.L. (1984) Traditional Methods of Sales Forecasting, in Store Location and Store Assessment

Research, R.L. Davies and D.S. Rogers eds., Wicley, 279-299.

372 DESMET P. (2001) Marketing Direct, 2ème éd., Dunod, Paris.

Î "l'aire géographique locale d'où proviennent 90 % de la clientèle total du

commerce."373

ou:

Î "l'aire d'influence à partir de laquelle un centre commercial peut espérer attirer au

moins 85 % de son volume total des ventes " 374.

en termes de chiffre d'affaires:

Î "toute aire susceptible de fournir à un magasin un chiffre d'affaires minimum annuel

de un dollar" 375 ou au minimum 0,5 % de la part de marché 376,

en termes d'éloignement:

Î "d'une manière générale... une grande majorité des clients qui sont prêts à se déplacer

de 12 à 15 minutes jusqu'à un maximum de 25 minutes pour atteindre un centre commercial régional" 377.

en termes de concurrence:

Î "la véritable zone de chalandise est entièrement déterminée par les opérations d'attraction et de résistance des zones de chalandise en compétition... La zone de

373 ISADORE V.F. (1954) Retail Trade Analysis, University of Wisconsin, Bureau of Business Research and

Service, Madison.

374 GRUEN V. et SMITH L. (1960) Shopping Town USA: The Planning of Shopping Centers, Reinhold

Publishing Co., New York.

375 GREEN H.L. (Avril 1959) Correspondence with Applebaum W. & Cohen S.B.

376 APPLEBAUM W. et COHEN S.B. (1961) The Dynamics of Store Trading Areas and Market Equilibrium,

Annals of the Association of American Geographers n°51/1, reprinted with permission of the original publishers by Kraus Reprint Ltd Nendeln Lichtenstein in 1967.

377 GRUEN V. et SMITH L. (1960) Shopping Town USA: The Planning of Shopping Centers, Reinhold

Publishing Co., New York., p.33.

chalandise n'est pas un fait géographique mais est créée entièrement par la réponse et

le comportement des individus" 378.

Huff 379 a une approche plus statistique en définissant la zone de chalandise comme "une région délimitée géographiquement, contenant des clients potentiels pour lesquels il existe une probabilité plus grande que zéro qu'ils achètent une classe donnée de produits ou de services offerts à la vente par une firme particulière ou par un groupe particulier de firmes".

Selon Ghosh et McLafferty 380 qui ont tenté d'unifier ces définitions, la zone de chalandise est

tout simplement:

Î "le secteur géographique à partir duquel le magasin tire la plupart de ses clients et dans lequel son taux de pénétration du marché est le plus fort".

On remarque aussi que la zone de chalandise soit considère la clientèle effective d'un magasin

ou d'un service existant (définitions d'Isadore, de Ghosh et McLafferty), soit s'attache à mesurer une clientèle potentielle dans l'optique de création d'un nouveau point de vente ou avec l'objectif de conquérir des parts de marché en empiétant sur la zone de chalandise effective d'un concurrent (définitions de Gruen et Smith, d'Applebaum et Cohen, de Green, de Huff).

1.2.1 Variables façonnant l'étendue et la forme des zones de chalandise

Un grand nombre de paramètres façonnent la zone de chalandise d'un magasin ou d'une société de services. Ces paramètres sont aussi bien des facteurs intrinsèques marketing liés au magasin comme les prix, la taille du magasin, le choix des marchandises, que des facteurs

378 NELSON R.L. (1958) The Selection of Retail Locations, F.W. Dodge Corp, p.153, New York.

379 HUFF D. L. (1964) Defining and Estimating a Trading Area, Journal of Marketing, Vol 28, p. 38.

380 GHOSH A. et McLAFFERTY S. L. (1987) Location Strategies for Retail and Service Firms, Lexington

Books, Reading, Mass.

environnementaux tels l'existence de concurrents dans le voisinage ou l'environnement sociologique et économique.

1.2.1.1 Variables intrinsèques au point de vente

Une multiplicité de facteurs influence la forme, l'étendue spatiale et la nature intrinsèque de la zone de chalandise d'un point de vente parmi lesquels on recense:

· les caractéristiques propres au point de vente rigidifiées lors de la création du point de vente:

- la taille,

- les voies d'accès et les facilités de parking.

· des paramètres liés à la politique marketing:

- la promotion des ventes,

- les prix,

- l'assortiment des marchandises,

- la décoration,

- les services complémentaires offerts.

1.2.1.2 Variables environnementales

Comme on l'a mentionné, des check-lists de critères ont été établis pour choisir au mieux l'emplacement de son futur point de vente en examinant les infrastructures existantes 381 382 383

384 385 386. L'effet recherché est de réussir à centrer son point de vente dans un bassin

géographique riche en consommateurs potentiels compte-tenu bien évidemment de la

381 DELOZIER M.W. et LEWISON D.M. (1986) Retailing, 2nd ed., Merill.

382 CLIQUET G. (1992) Le Management Stratégique des Points de Vente, p.187-191, Ed. Sirey.

383 NELSON R.L. (1958) The Selection of Retail Locations, F.W. Dodge Corp, p.153, New York.

384 KANE B.J. (1966) A Systematic Guide to Supermarket Location Analysis, Fairchild, New York.

385 APPLEBAUM W. (1966) Method for determining Store Trade Areas, Market Penetration and Potential Sales,

Journal of Marketing Research, 3, 127-141.

386 GRUEN V. et SMITH L. (1960) Shopping Town USA: The Planning of Shopping Centers, Reinhold

Publishing Co., New York.

concurrence. En se référant à ces études, on peut s'apercevoir que la forme des zones de chalandise est en général conditionnée par:

· des paramètres environnementaux variés387 dont :

- l'accessibilité mesurée par la qualité et le nombre de voies de circulation automobile et piétonnière, le niveau et la fluidité du trafic, ainsi que par les dessertes de transports en commun, l'existence de stations de taxi,...,

- la qualité et le débit de la circulation piétonnière et automobile,

- la concurrence et particulièrement son importance et sa nature, la politique marketing, son éloignement au point de vente considéré,

- la complémentarité avec d'autres activités,

- les barrières physiques et psychologiques,

- l'utilisation du foncier

Plus précisément, les facteurs liés à l'infrastructure jouant sur l'accessibilité et donc influençant les caractéristiques des zones de chalandise sont:

- la structure du réseau routier ou piétonnier (sinuosité et configuration des voies),

- la qualité des infrastructures, appréhendée par leurs caractéristiques techniques (nombre et largeur des voies, aménagement des côtés, existence d'un séparateur central de chaussées, etc...),

- les contraintes topographiques (pente),

- les réglementations en vigueur (code de la route et particularités locales),

- la congestion qui perturbe le fonctionnement du système et fait ainsi varier la qualité du service selon les jours de l'année et les heures de la journée.

387 JALLAIS J., ORSONY J. et FADY A. (1994) Marketing du Commerce de Détail, Vuibert, Paris.

Egalement, la qualité des transports collectifs dégrade ou améliore sensiblement l'accessibilité

à un site en particulier concernant:

- le schéma de services en vigueur tenant compte des règles de sécurité (noeuds desservis, fréquence de la desserte et horaires de circulation),

- le taux de remplissage du véhicule qui peut en interdire l'utilisation lorsque la capacité maximale est atteinte.

Selon la clientèle ciblée, d'autres critères peuvent être examinés : économiques, esthétiques, paysagers, environnementaux, touristiques,...

Même s'il est bien évident que chaque activité recherchera plutôt une clientèle-cible particulière, d'autres études ont dégagé les paramètres environnementaux cette fois liés à la population résidente, ayant une influence sur les caractéristiques de la zone de chalandise parmi lesquels:

· des variables démographiques et socio-économiques recensées par Ingene 388 et parfois plus particulièrement étudiées par d'autres chercheurs:

- le revenu 389 390,

- l'âge de la population 391,

- l'âge du chef de famille,

- le pourcentage d'hommes dans la population,

- l'âge médian des femmes et des hommes,

388 INGENE C.A. (1984) Structural Determinants of Market Potential, Journal of Retailing, Vol.60 N°I, p.37-64.

389 FERBER R. (1958) Variations in Retail Sales Between Cities, Journal of Marketing, 22, p.295-303.

390 INGENE C. et LUSCH R. (1980) Market Selection Decisions for Department Stores, Journal of Retailing,

56, p.21-40.

391 WELLS W. et GUBAR G. (1966) The Life Cycle Concept in Marketing Research, Journal of Marketing

Research, 3, p.355-363.

- la taille des ménages 392,

- la population ou la densité de population 393,

- la mobilité394 395.

1.2.1.3 La variable temporelle

Les frontières et les caractéristiques internes des zones de chalandise ne sont pas statiques mais évoluent dans le temps396, influencées par des facteurs d'espace-temps comme la concurrence locale, la stratégie marketing, la saisonnalité ou même la mode.

Une réduction de prix (ou des soldes) réussira par l'augmentation de son attractivité à attirer

les consommateurs sur une plus grande distance, hypothèse vérifiée dans la pratique en particulier sur le marché du meuble397. De même, la taille de la zone de chalandise peut croître en fonction de la publicité et des efforts de promotion du point de vente.

1.3 Méthodes traditionnelles de délimitation des zones de chalandise

Deux classes de méthodes de délimitation, l'une subjective et l'autre normative, sont employées pour déterminer les frontières de zones de chalandise. Alors que la première catégorie de méthodes reste théorique, les méthodes normatives au contraire sont caractérisées

par leurs observations du monde réel. Elles sont donc plus précises et plus commodes à mettre

en oeuvre et peuvent même aller jusqu'à décrire les variations dynamiques des frontières des

392 INGENE C. et YU (1981) Determinants of Retail Location in SMSAs, Regional Science and Urban

Economics 11, p.529-547.

393 HALL M. et KNAPP J. et WINSTEN C. (1961) Distribution in Great Britain and North America, Oxford

University Press, London.

394 INGENE C. et LUSCH R. (1980) Market Selection Decisions for Department Stores, Journal of Retailing, 56, p.21-40.

395 INGENE C. et YU (1981) Determinants of Retail Location in SMSAs, Regional Science and Urban

Economics 11, p.529-547.

396 APPLEBAUM W. et COHEN S.B. (mars 1961) The Dynamics of Store Trading Areas and Market

Equilibrium, Annals of the Association of American Geographers, N°51/1.

397 CLIQUET G. (1995) Implementing a Subjective MCI Model: An Application to the Furniture Market,

European Journal of Operational Research 84, pp 279-291.

zones de chalandise. Nous allons d'abord passer en revue les principales méthodes subjectives.

1.3.1 Approches subjectives : la méthode du temps de conduite

Cette méthode employée par beaucoup de professionnels suppose que les clients sont disposés

à fréquenter un magasin seulement selon des critères de proximité mesurés en termes de distance ou de temps de conduite. En pratique, on trace des courbes isochrones autour du point de vente ou de son implantation envisagée. Les courbes indiquent les temps de trajet en général automobile qui les séparent du point de vente en tenant compte des voies de circulation et des obstacles (feux tricolores, croisements et inter-parties, limitations de vitesse,...). La zone de chalandise équivaut à la surface géographique intérieure à l'une de ces courbes en se fixant un temps de conduite limite au-delà duquel on pense qu'une faible

proportion de consommateurs potentiels sera prête à se déplacer jusqu'au point de vente 398.

Parmi différents paramètres déterminant les habitudes des consommateurs comme la densité

de population, le pouvoir d'achat, l'importance des réseaux de communication, on a montré en effet numériquement que les temps de conduite requis pour atteindre un ensemble de magasins a une influence forte sur le choix d'un centre commercial 399. Certaines études comportementales avaient montré en leur temps qu'à partir d'un temps de conduite supérieur à

20 minutes, les consommateurs hésitaient à se rendre dans un centre commercial 400.

Actuellement, certains clients, particulièrement dans les zones rurales, n'hésitent pas à parcourir 50 kilomètres pour faire leurs courses dans les hypermarchés qui remplacent de plus

en plus les petits commerces traditionnels de plus en plus rares401. Mais, dans les zones de

398 BRUNNER J. A. et MASON J. L. (1968) The Influence of Driving Time Upon Shopping Center Preference,

Journal of Marketing Vol. 32, p.57.

399 BRUNNER J. A. et MASON J. L. (1968) The Influence of Driving Time Upon Shopping Center Preference,

Journal of Marketing Vol. 32, p.57.

400 NELSON R.L. (1958) The Selection of Retail Locations, F.W. Dodge Corp, p.153, New York.

401 BOVET P. (2001) L'hypermarché, le Caddie et le congélateur, Le Monde Diplomatique, Mars 2001, p.32.

périphérie urbaine où les services commerciaux sont plus denses, les consommateurs deviennent plus exigeants quant à la proximité des centres commerciaux. Aux Etats-Unis, au début des années 90, on était prêt, selon Madame Yecko, une spécialiste renommée de la distribution et la présidente du groupe d'immobilier commercial Capital Realty Group, à parcourir 50 miles pour se rendre dans un hypermarché Wal-Mart402. De nos jours, une distance de 20 à 30 miles (30 à 50 kilomètres environ) semble être la limite que les gens peuvent supporter pour accéder à un tel centre commercial.

Brunner et Mason ont avancé, quant à eux, que les limites de zone de chalandise se ramenaient à un temps de conduite de 15 minutes autour du centre commercial et que ce sont l'importance de la population, le nombre de ménages et les revenus au sein de cette zone qui conditionnent les performances du centre. D'autres auteurs ont énoncé que les consommateurs sont prêts à parcourir en moyenne une distance correspondant à un temps moyen de conduite

de 10 minutes403. Même si la méthode ne prétend pas être parfaite puisqu'elle ne prend pas en

considération la puissance d'attractivité du magasin, on constate donc qu'il n'y a pas dans la littérature un temps de conduite bien défini pour mesurer les limites de la zone de chalandise. Sans doute, l'effort que les consommateurs sont prêts à fournir pour atteindre un centre commercial dépend-il d'autres facteurs que le simple temps de conduite ou que des facteurs d'attractivité. Les conditions météorologiques, l'âge, le sexe, les quartiers traversés, les facilités de parking, le pouvoir d'achat plus généralement peuvent conduire à ce que l'effort fourni ou évalué soit ressenti comme étant plus ou moins élevé par l'individu.

402 SCHOOLEY T. (2001) For some retailers, drive-time is more important than location, Pittsburgh Business

Times, American City Business Journals, march 9, 2001, p.10.

403 APPLEBAUM W. et GREEN H.L. (1974) Determining Store Trade Areas, Handbook of Marketing

Research, edited by R. Ferber NY Mac Graw Hill, pp 4.313-4.323.

1.3.2 Approches normatives

L'approche subjective de la méthode du temps de conduite décrite précédemment est facile à mettre en application et fournit des données assez fiables mais avec un degré de précision inconnue. Elle est préconisée dans le cas où les données marketing sur la clientèle ne sont pas accessibles ou lorsque cette méthode est trop longue ou trop coûteuse à mettre en oeuvre. En revanche, les méthodes normatives prennent en considération l'information sur la clientèle et/ou les performances passées du point de vente. Ces données d'observation obtenues par enquêtes s'avèrent indispensables pour évaluer une zone de chalandise existante avec une précision accrue par rapport aux méthodes subjectives qui n'utilisaient que des données environnementales.

Les méthodes normatives les plus populaires fondées sur l'expérience passée pour déterminer

les frontières de zone de chalandise sont:

- la méthode analogique

- la méthode par le modèle de régression

- la méthode par les surfaces enveloppantes

- la méthode des nuées dynamiques

Détaillons ces différentes approches dans leurs principes et leurs inconvénients.

1.3.2.1 La méthode analogique

La méthode analogique sous-tend que la géographie se répète: si un point de vente est placé à

un emplacement similaire à un autre, ou alors on s'attend à ce que la performance des deux points de vente soit identique. Supposons qu'un magasin connaisse les adresses de ses clients. Celles-ci peuvent alors être représentées sur une carte par des points dont la densité indique

grâce à un examen visuel, la taille, la forme et les caractéristiques générales de la zone de chalandise de ce magasin 404.

La délimitation des zones de chalandise s'apprécie traditionnellement en prenant des paliers

en matière de niveau de clientèle en progression linéaire 405. En première approximation, la zone de chalandise est supposée à frontière circulaire irradiant à partir du point de vente sur

un rayon r. Ainsi, on considère en général la zone de chalandise comme le disque dont le rayon a une dimension telle qu'il concentre au minimum X % de la clientèle (X=80 % par exemple). Le problème est que la zone de chalandise est loin d'avoir la géométrie parfaite d'un disque. En outre, ce mode de procédure s'avère peu précis, car il présuppose une diminution régulière du taux de pénétration selon l'éloignement au point de vente ou bien une certaine homogénéité et une bonne répartition de la clientèle sur la surface géographique compacte déterminée par cette méthode.

Fig 1.1 - Exemple de détermination d'une zone de chalandise par un logiciel commercial utilisant la méthode analogique

Or, les irrégularités socio-économiques de la population dans l'espace, les frontières géographiques, les caractéristiques de la concurrence et la politique commerciale du magasin

404 APPLEBAUM W. et GREEN H.L. (1974) Determining Store Trade Areas, Handbook of Marketing

Research, edited by R. Ferber NY Mac Graw Hill, pp 4.313-4.323.

405 APPLEBAUM W. (1968) The Analog Method for Estimating Potential Store Sales, Guide to Store Location

Research, Addison-Wesley, Reading, Mass.

font que très souvent les zones de chalandise ne sont pas totalement compactes. Les "trous"

ou discontinuités de la clientèle au sein de cette surface sont donc négligés dans la méthode précédente. On ne pense pas également à considérer la rupture pouvant être assez brusque qui s'opère entre une zone à forte densité de clients et une zone à faible densité.

1.3.2.2 La méthode par les modèles de régression

La méthode par le modèle régression cherche à mesurer un paramètre de performance en le corrélant avec diverses variables socio-économiques, environnementales et marketing. Il suppose ainsi d'avoir pour base un certain nombre de magasins ou des études commerciales antérieures à partir desquelles, on mesurera les coefficients d'une droite de régression du type:

Y = b0 + b1X1 + b2X2 + ... + bnXn

où Y est le paramètre de performance ; X1, X2, ... , Xn les variables explicatives et b0, b1, b2,

..., bn les coefficients de la droite de régression.

Les modèles de régression sont fondés sur deux hypothèses: premièrement, la performance du point de vente est fonction des caractéristiques de localisation de son emplacement, de l'environnement socio-économique, du niveau de la concurrence et des caractéristiques du magasin. Deuxièmement, les facteurs fondamentaux de performance peuvent être isolés grâce

à une analyse statistique des données.

La méthode est en particulier employée pour prévoir la performance globale projetée Y d'un magasin qui est évaluée par cette formule et l'emploi de données locales 406. Mais elle peut également être utilisée pour estimer la part du marché des zones entourant un nouveau point

de vente et délimiter alors la zone de chalandise. Il suffit pour cela de parcourir l'espace

entourant le point de vente à la recherche des populations tendant à accroître le paramètre de

406 LORD J.D. et OLSEN L.M. (1979) Market Area Characteristics and Branch Bank Performance, Journal of

Bank Research 10, p. 102-110.

performance Y du fait de leurs caractéristiques démographiques et socio-économiques entrant

en tant que variables dans le modèle de régression. On pourra considérer qu'au-dessus ou qu'en dessous d'un certain niveau de contribution à la performance, les populations considérées appartiendront ou n'appartiendront pas à la zone de chalandise.

Des difficultés peuvent cependant apparaître dans l'utilisation de la méthode lorsque apparaissent des corrélations entre des variables supposées indépendantes dans le modèle de régression. Un test simple préalable consiste à mesurer le taux de corrélation entre les données. Un taux supérieur à 0,5 ou plus est significatif d'une certaine multicolinéarité entre des variables redondantes 407 408.

On peut également utiliser le test de Fisher (ou test d'égalité des variances) qui a pour but de

comparer deux distributions de valeurs X et Y supposées suivre chacune une loi normale. Si

n1 et (S1)² respectivement la taille et la variance non biaisée du premier échantillon et n2 et (S2)² sont la taille et la variance non biaisée du second échantillon (S1 et S2 sont les écarts- types), alors le calcul de la quantité F définie par :

F = [ n1 * (S1)² / (n1 - 1) ] / [ n2 * (S2)² / (n2 - 1) ]

(dans le cas où F<1, on inverse le numérateur et le dénominateur)

permettra de savoir si les distributions sont de même nature en se fondant sur la règle de décision suivante : si F est supérieure au quantile d'une loi de Fisher de paramètres n1 et n2 au risque 0,05, les variances ne sont pas homogènes et les distributions sont de natures différentes. Dans le cas contraire, les variances sont considérées équivalentes et les distributions de même nature.

Un autre moyen pour détecter la multicolinéarité est de séparer les données en deux groupes

et de calculer pour chaque groupe un modèle de régression. L'absence de multicolinéarité se révèlera par une certaine similitude des résultats en ce qui concerne les coefficients de

407 JOHNSTON J. (1972) Econometric Methods, McGraw-Hill, New York.

408 MALINVAUD E. (1980) Statistical Methods of Econometrics, North Holland, New York.

régression et la qualité d'ajustement. Dans le cas contraire, il est souhaitable d'éliminer certaines variables parmi celles corrélées entre elles soit en examinant les variables prises 2

par 2, en pratiquant une analyse factorielle, ou mieux une régression ridge qui considère un estimateur légèrement biaisé des paramètres pour améliorer la variance des estimations (coûteux en temps de calcul) ou une régression pas à pas (stepwise) qui consiste à introduire

les variables l'une après l'autre dans le modèle (selon leur contribution partielle) et, à chaque étape, à vérifier si l'ensemble des variables déjà introduites sont encore significatives (une variable qui ne le serait plus serait rejetée).

Un autre problème pouvant surgir dans l'élaboration d'un modèle de régression est l'intégration de données difficilement quantifiables comme celles relatives à la perception du consommateur ou bien concernant l'évaluation de la concurrence ou bien l'image de marque malgré que cette difficulté ait été surmontée dans certains modèles comme le MIC subjectif409

que nous verrons plus tard (§ 2.1.5). L'objectif de ce modèle est en effet avant tout de se

fonder sur l'expérience d'un site commercial pour approcher par calcul la performance future d'un nouvel emplacement et accessoirement d'identifier ce que pourra être sa zone de chalandise.

1.3.2.3 La méthode par les surfaces enveloppantes

Les surfaces enveloppantes ont été mises en application par Peterson 410 dans la continuation

des travaux de Bucklin 411 et de McKay 412. Cette méthode consiste à représenter les taux de pénétration sur une carte quadrillée en zones de manière à obtenir un relief. La surface de ce relief épousant les variations spatiales du taux de pénétration est approximée par des courbes

409 CLIQUET G. (1995) Implementing a Subjective MCI Model: An Application to the Furniture Market,

European Journal of Operational Research 84, 279-291.

410 PETERSON R.A. (1974) Trade Area Analysis Using Trend Surface Mapping, Journal of Marketing

Research, Vol. XI, 338-42.

411 BUCKLIN L.P. (1971) Trade Areas Boundaries: Some Issues in Theory and Methodology, Journal of

Marketing Research, 30-7.

412 MCKAY D.B. (1973) Spatial Measurement of Retail Store Demand, Journal of Marketing Research, 10, 4, p.

447-453.

ou des plans et en particulier par des équations dont les coefficients sont déterminés grâce à

un modèle de régression. Ces surfaces peuvent être modélisées par des séries de Fourier surtout si elles présentent une certaine périodicité. Mais, comme cette régularité de l'espace

est plutôt rare dans le monde réel, on préfère décrire le taux de pénétration spatiale par des polynômes orthogonaux qui sont plus aptes à rendre compte de la concurrence et des irrégularités spatiales telles que les barrières naturelles (rivières, espaces verts protégés, autoroutes,...).

Il serait théoriquement possible, même si les auteurs n'effectuent pas la démonstration, de délimiter la zone de chalandise en déterminant les minima de cette courbe polynomiale par l'annulation de sa dérivée seconde. Cependant, la méthode des surfaces enveloppantes comporte des limitations notamment l'impossibilité de trouver des polynômes orthogonaux ou d'autres fonctions pas trop élaborées qui puissent suffisamment bien modéliser le relief des taux de pénétration. Peterson l'a bien compris dans son étude en faisant remarquer qu'il y avait une faible corrélation entre certains paramètres spatiaux du type socio-économique et les variations de taux de pénétration modélisé: la raison en était sans doute en particulier la présence de termes résiduels, différences entre les courbes du modèle et les taux de pénétration constatés.

1.3.2.4 La méthode des nuées dynamiques

La méthode de délimitation par les nuées dynamiques repose sur une famille d'algorithmes

dus à Diday 413. Son principe est de construire itérativement une classification d'un nuage de points.

- chaque classe étiquetée i est représentée par son noyau Ni (souvent le barycentre de la

classe, mais pas nécessairement), calculable en utilisant une fonction à partir des

413 CELLEUX G. et DIDAY E. (1980) L'analyse des Données, Bulletin de liaison de la recherche en informatique et automatique, INRIA.

représentants de la classe.

- on dispose d'une mesure de similarité d entre un point et un noyau de classe. (d est par exemple la distance euclidienne au noyau lorsque ce dernier est un point).

L'algorithme est alors le suivant:

i,

· On initialise les noyaux Ni, 1 i k à leur valeur de départ N

1 i k, la variable

booléenne STABLE à FAUX et le compteur d'itérations t à 1.

· Tant que (STABLE - FAUX) et (t < tmax), on effectue :

Î Début

i

· On affecte chacun des points à la classe dont le noyau N(t) est le plus proche au

sens de la mesure de similarité d.

i

· Pour chacune des classes, on calcule le nouveau noyau N(t+1)

avec .

· Si l'un des noyaux a été modifié, alors STABLE vaut FAUX sinon il vaut VRAI.

Î Fin

(les instructions principales de l'algorithme sont en gras).

Cette méthode consiste donc à incorporer des zones autour de centres mobiles ou centres de gravité: une nécessité est de définir au préalable le nombre k de zones. Puis, k centres de gravité supposés sont alors tirés au hasard et chaque point géographique appartenant à l'espace géographique est assigné au plus proche des k centres de gravité engendrant ainsi k cellules géographiques. Le vrai centre de gravité de chacune des k zones est calculé et le processus qui consiste à assigner chaque point géographique à l'un des nouveaux centres de gravité recommence. Cet algorithme fonctionne en boucle jusqu'à ce que les k zones et les k centres de gravité soient invariables. Un calcul de la variance à l'intérieur de chaque zone peut être effectué pour vérifier si les moyennes sont sensiblement différentes d'une classe à une autre et si le nombre de classes est exact.

La méthode a été employée pour indiquer les limites de zones de chalandise de centres commerciaux 414 avec l'exécution de fonctions spline qui consiste à réduire au minimum le

rayon de courbe de la fonction représentant les limites de la zone de chalandise f(x) pour la

rendre plus régulière (

[f(x)' ' ]² dx

minimisé). Ainsi, lors de l'application de cette méthode à

la délimitation des zones de chalandise, l'aire géographique est initialement découpée en

secteurs caractérisés par une plus ou moins forte fréquentation du point de vente considéré (l'étude de Roger415 comporte par exemple 50 secteurs). Les fréquentations obtenues auprès d'un échantillon de clients sont chacune affectées au secteur géographique de leur lieu de domicile, l'ensemble desdites fréquentations étant ensuite moyenné. Ces secteurs sont alors agglomérés en zones de fréquentation homogènes (les classes mentionnées précédemment)

par l'algorithme des nuées dynamiques ce qui permettra ultérieurement de tracer les lignes de niveau de fréquentation entourant le point de vente considéré grâce en particulier aux fonctions splines qui joignent harmonieusement les centres de gravité des secteurs. On constate que la zone de chalandise est finalement délimitée de façon assez imprécise puisqu'en général le nombre de secteurs pour définir sa frontière est faible. Ces secteurs ne correspondent d'autre part qu'à un découpage artificiel pas forcément logique le plus souvent

en quartiers ou en arrondissements dans les grandes villes. De plus, les secteurs peuvent rassembler des populations et des fréquentations inhomogènes ce qui risque de conduire à des erreurs puisqu'en considérant une fréquentation moyenne au sein de ces secteurs, on fait abstraction de cette hétérogénéité de clientèle. D'autre part, la transition de fréquentation de la clientèle entre les secteurs voisins est supposée s'effectuer de manière progressive ce qui n'est pas forcément le cas. La lourdeur de la méthode et son manque de côté pratique la rendent très

difficilement accessibles aux professionnels.

414 ROGER P. (1983) Description du Comportement Spatial du Consommateur, Thèse de Doctorat, Lille.

415 ROGER P. (1983) Description du Comportement Spatial du Consommateur, Thèse de Doctorat, Lille.

La méthode des nuées dynamiques est cependant susceptible en fait de résoudre la problématique de l'analyse typologique qui vise à chercher les principales représentants d'un nuage de points. Nous verrons au paragraphe 2.2.3 que ce type de méthode peut simplifier la recherche de localisations commerciales en particulier lors de l'utilisation du modèle p- médian. En bref, le modèle p-médian (voir § 2.2) pose le problème de positionner et d'allouer

p centres (p points de vente pour l'application à la localisation commerciale) à chacun des points d'un nuage de points (les clients) de telle manière que la somme des distances de ces points au centre correspondant atteigne un minimum, ce qui permet effectivement de rassembler les points en un certain nombre de cellules (ou clusters en anglais) de caractéristiques (souvent le niveau moyen de fréquentation) homogènes.

1.4 Inconvénients et limitations des méthodes traditionnelles de délimitation

Comme on l'a vu, les méthodes subjectives ne prennent pas en considération les caractéristiques propres du point de vente, ni celles de la clientèle pour évaluer la zone de chalandise, et s'attachent uniquement à déterminer les emplacements stratégiquement intéressants en termes d'accessibilité pour la majorité des clients potentiels. Ces méthodes rapides mais sans grande précision s'avèrent utiles principalement dans une première phase de prospection de la localisation d'un point de vente à créer. Rien ne saurait en effet remplacer une bonne connaissance des consommateurs.

Les méthodes de type normatif leur sont donc préférables si l'on dispose d'informations sur les clients existants ou potentiels d'un magasin. Il est cependant hasardeux de réduire une zone de chalandise à un disque rassemblant un pourcentage élevé de clients comme le fait la méthode analogique. La réalité est souvent différente et on peut constater l'existence d'une zone de

chalandise réduite en fragments au lieu d'une zone de chalandise compacte entourant le point

de vente416. Les caractéristiques de la population (densité, caractéristiques socio- économiques, préoccupations), l'environnement (infrastructure des routes, barrières naturelles), les facteurs commerciaux (concurrence, stratégies d'entreprise et en particulier différenciation) changent dans l'espace et, de ce fait, expliquent la répartition des clients en plusieurs secteurs parfois sans relation. Les limites des zones de chalandise sont devenues plus floues qu'autrefois également du fait du comportement plus versatile et de la plus grande mobilité417 du consommateur, et leur détermination précise nécessite désormais des analyses plus poussées : "l'approche d'une zone de chalandise est rendue plus complexe aujourd'hui

par les nouveaux comportements des consommateurs, plus mobiles et moins fidèles."418

Les surfaces enveloppantes constituent une approche intéressante bien qu'à force de vouloir trop modéliser une réalité fort complexe par des équations paramétriques, on ne fait que s'en éloigner. Il est en effet souvent indispensable d'approximer les données discrètes de clientèle

par des équations suffisamment simples pour ne pas voir les difficultés de résolutions augmenter de manière exponentielle. D'où, là encore, la naissance d'incertitudes dont il est impossible de mesurer l'importance et la portée sur les résultats de la délimitation.

La méthode par les nuées dynamiques est certes novatrice, mais aussi coûteuse en temps de calcul puisque chaque point est examiné et lié à la classe la plus proche et que l'algorithme tourne en boucle jusqu'à parvenir à une stabilité des centres de gravité et des zones. Le problème de ce processus est aussi qu'il faut au départ pressentir et fixer un nombre de types

de zone pour pouvoir choisir aléatoirement les centres de gravité puis assigner chaque point

au centre de gravité le plus proche. Un autre point est que cette méthode n'a été expérimentée que sur des zones géographiques massives bien qu'assimilées à des points, en l'occurrence sur

416 CLIQUET G., FADY A., BASSET G. (2002) Management de la Distribution, Dunod, Paris.

417 MOATI P. (2001) L'avenir de la Grande Distribution, Ed. Odile Jacob.

418 DOUARD J.P. (2002) Géomarketing et Localisation des Entreprises Commerciales, Stratégies de localisation

des Entreprises Commerciales et Industrielles : De Nouvelles Perspectives, Gérard Cliquet et Jean-Michel

Josselin éditeurs, De Boeck Université, à paraître p.120

des communes de différentes tailles telles que celles de la Communauté Urbaine de Lille419, et non sur des secteurs équidistants, de tailles égales en terme de superficie et suffisamment petits pour obtenir une précision de délimitation intéressante.

La majorité de toutes les méthodes évoquées, peu précises, font appel à un découpage initial

de l'aire analysée en secteurs géographiques qui ne peut en règle générale, on l'a dit, que se fonder que sur l'intuition ou sur des limites administratives ce qui risque fortement de compromettre la qualité de la délimitation de la zone de chalandise.

Une bonne connaissance de la zone de chalandise et de ses limites conditionne pourtant l'analyse et les résutats de la recherche de localisations commerciales, d'autant que les méthodes utilisées dans le monde professionnel font souvent appel à des notions de statistiques prenant pour cible la zone de chalandise elle-même.

1.5 Les méthodes de localisation actuellement utilisées

Une étude récente auprès des décideurs du commerce de détail a démontré que le choix d'une localisation commerciale était plutôt fondée sur l'approche intuitive et informelle autant que

sur les approches statistiques rigoureuses des analystes de la localisation420 421. Les décideurs

rechignent à utiliser les méthodes trop lourdes développées par les chercheurs, même si ces derniers sont allés jusqu'à développer des systèmes intelligents d'aide à la décision (SIAD) qui parviennent assez bien sinon à déterminer un emplacement optimal, du moins à prévoir le chiffre d'affaires du futur point de vente422. Ces derniers décideurs préfèrent souvent incorporer dans la décision leur propre vision, intuition ou expérience, rassurante et

419 ROGER P. (1983) Description du Comportement Spatial du Consommateur, Thèse de Doctorat, Lille.

420 CLARKE I., HORITA M. et MACKANESS W. (2002) Intuition et Evaluation des Sites Commerciaux : Appréhender la Connaissance des Commerçants, , Stratégies de localisation des Entreprises Commerciales et

Industrielles : De Nouvelles Perspectives, p.107, Gérard Cliquet et Jean-Michel Josselin éditeurs, De Boeck

Université, à paraître.

421 HERNANDEZ J.A. (1998) The Role of Geographical Information Systems Within Retail Location Decision

Making, PhD Thesis, The Manchester Metropolitan University Manchester.

422 LAPARRA L. (1995) L'implantation d'hypermarché : comparaison de deux méthodes d'évaluation du potentiel, Recherche et Applications en Marketing, Vol. : 10, Numéro : 1, p. 69-79

explicative. D'un autre coté, ceux-ci rechignent à utiliser des représentations spatiales alimentées en d'immenses quantités d'impalpables données et se méfient souvent des variables adoptées comme critères d'implantation trop souvent laissées au libre arbitre de l'analyste.

Dans la pratique, les professionnels utilisent des méthodes statistiques démonstratives en général assez simples qui ont aussi le bénéfice de la rapidité. Une autre étude auprès des décideurs de 226 réseaux de distribution canadiens a montré que 87 % des décideurs utilisaient l'expérience pour orienter leurs décisions de localisation, mais aussi d'autres méthodes statistiques simples comme les checklists (46 %), la méthode analogique (37 %), les méthodes statistiques du type parts de marché ou marché potentiel (34 %), le modèle de régression multiple (29 %), les modèles d'interaction spatiale (13 %), les systèmes experts (8

%). La difficulté de mettre en pratique des modèles vient souvent du fait de ne pouvoir accéder à toutes les données dont on aurait besoin. Comment connaître la performance des points de vente concurrents, mesurer la valeur de leurs managers, évaluer le pouvoir d'achat

de consommateurs potentiels, déterminer avec exactitude les limites d'une zone de chalandise

? Rogers423 de la société DSR Marketing Systems Inc. recense cinq méthodes pratiques inspirées de la recherche dans le domaine de la localisation et cependant accessibles à tout manager désireux de créer une nouvelle implantation commerciale ou d'étendre un réseau de points de vente. Ces cinq méthodes sont :

- la méthode par les parts de marché et les surfaces de vente,

- la méthode analogique,

- la méthode par le modèle de régression multiple,

- l'analyse discriminante,

- la méthode du marché potentiel.

423 ROGERS D.S. (1980) 5 ways to Evaluate a Store Location, Store Location, 42-48.

1.5.1 La méthode par les parts de marché et les surfaces de vente

Elle consiste tout d'abord à déterminer quelle peut être la zone de chalandise au sein de chacune des aires qui représente une alternative d'implantation, en tenant compte de la concurrence, de la population et de sa répartition géographique, de l'infrastructure routière et piétonnière et des barrières naturelles (ex. lacs, rivières)424. Il s'agit ensuite, de calculer le nombre de personnes habitant dans la zone de chalandise, à la fois à l'instant présent et dans le futur, puis d'estimer le potentiel du marché par individu pour le produit ou le service qui sera proposé. La multiplication du potentiel de marché individuel par le nombre d'habitants de la zone fournira le potentiel général du marché pour l'activité considérée. Une règle de trois indiquera alors la part de ce potentiel que représentera le point de vente à créer en fonction de

son importance au point de vue de sa surface de vente prévue, par rapport à celle, globale, représentée par les concurrents toujours au sein de la zone de chalandise. Il convient de sélectionner l'emplacement de la zone de chalandise qui maximise le potentiel calculé en termes de chiffre d'affaires, de marge ou de rentabilité. Cette méthode ne permet pas de cerner avec précision un emplacement, mais seulement de sélectionner les aires intéressantes de localisation. Elle ne tient compte que des surfaces commerciales en ignorant les autres facteurs d'attractivité tels que les prix pratiqués par la concurrence, les efforts de promotion,... Egalement, l'étape initiale de délimitation de la zone de chalandise qui n'est pas réputée facile, joue un rôle capital dans la tangibilité des résultats obtenus.

1.5.2 La méthode analogique

Comme nous l'avons vu au chapitre 1, le modèle analogique425 426 développé par Applebaum pour les supermarchés Kroger dans les années 50, prend l'hypothèse que la géographie se

424 GHOSH A. et McLAFFERTY S.L. (1987) Location Strategies for Retail and Service Firms, Lexington

Books, Reading, Mass, p.43.

425 APPLEBAUM W. et GREEN H.L. (1974) Determining Store Trade Areas, Handbook of Marketing

Research, edited by R. Ferber NY Mac Graw Hill, pp 4.313-4.323.

répète: si un point de vente est placé à un emplacement similaire à un autre, la performance des deux points de vente sera identique selon ce modèle. La méthode revient tout d'abord à établir une cartographie des clients potentiels représentés spatialement par des points. Il s'agit ensuite de déterminer la zone de chalandise correspondant à l'emplacement pressenti pour le point de vente, puis de chercher des points de vente analogues en termes d'accessibilité et d'environnement économique et concurrentiel. La performance du futur magasin s'inspirera de celle d'un magasin analogue en calculant pour ce dernier le chiffre d'affaires par client et en l'extrapolant à la zone de chalandise du premier. Le problème est que la notion de similitude

est subjective et dépend de l'appréciation de l'analyste. D'autre part, cette approche ne tient pas compte des interactions concurrentielles locales et est assez lourde à mettre en oeuvre dans

le cas où un grand nombre de points de vente seraient à localiser.

Lorsqu'un distributeur possède un grand nombre de magasins, une vingtaine voire plus, la méthode analogique offre une voie intéressante pour réaliser des prévisions de vente en corrélant le chiffre d'affaires par les caractéristiques des magasins (surface, nombre de départements, nombre de caisses), les caractéristiques des sites commerciaux (facilités de parking et d'accès), les caractéristiques de la population au sein de la zone de chalandise (âge, revenu, taille des ménages, niveau d'éducation) et l'importance de la concurrence (poids des concurrents et niveau de leur chiffre d'affaires).

1.5.3 La méthode par le modèle de régression multiple

La méthode par le modèle de régression multiple s'appuie sur l'analyse de points de vente existants à travers la détection de facteurs modelant leur chiffre d'affaires ou d'une manière générale une mesure de leur performance. Les données analysées par des traitements

426 APPLEBAUM W. (1968) The Analog Method for Estimating Potential Store Sales, Guide to Store Location

Research, Addison-Wesley, Reading, Mass. by Kraus Reprint Ltd Nendeln Lichtenstein in 1967.

statistiques seront en l'occurrence celles qui identifient les variables les plus en relation avec

les ventes comme :

- les ventes ou les parts de marché estimées de magasins;

- les ventes prévisionnelles;

- le niveau de concurrence mesuré par exemple par la surface totale des magasins concurrents

au sein de la zone de chalandise;

- la proportion des ménages ou des individus correspondant à la cible commerciale recherchée dans la zone de chalandise;

- le revenu moyen des ménages dans cette même zone.

La méthode par le modèle de régression a été codifiée de manière précise afin de donner au monde professionnel des moyens clairs pour évaluer une localisation, identifier des facteurs

de performance ou établir des prévisions de vente. La méthode a, en France, été baptisée méthode EVEC ou méthode d'Evaluation des Emplacements Commerciaux.

La méthode EVEC427

La méthode EVEC, mise au point par la société Gallup Poll en Grande-Bretagne en 1968, permet de tenir compte d'un très grand nombre de données pour à la fois évaluer la performance d'une chaîne de points de vente ou de l'un de ses composants ainsi que pour sélectionner les meilleurs emplacements dans le cadre de la création d'un nouveau magasin ou d'un établissement. Une application dérivée consiste également à détecter les emplacements à fermer.

Les différentes étapes de la méthode EVEC sont:

- la reconnaissance des facteurs: il s'agit de cerner quels sont les facteurs qui peuvent avoir une influence sur le chiffre d'affaires du magasin ramené à sa superficie. Ces facteurs sont

427 DELENDA J.F. (1970) EVEC : Une Méthode d'Evaluation des Emplacements Commerciaux, L.S.A. n° 335, sept. 1970, 57-61.

ensuite regroupés si possible en ensembles homogènes (facteurs de concurrence, de taille, de trafic...). Les facteurs individuels non regroupables sont dits "composants spécifiques".

- la mesure des facteurs : les facteurs préalablement identifiés sont mesurés, soit de manière objective (ex. nombre de caisses, superficie du magasin), soit plus rarement de manière subjective (ex. valeur du personnel dirigeant).

- le rassemblement des données : les données se regroupent en 3 classes:

É les statistiques internes caractérisant le point de vente étudié (ex. surface de vente, nombre de vendeurs, valeur du personnel dirigeant);

É les statistiques démographiques liées à la zone de chalandise entourant chaque point de vente (ex. population, structure d'âge, de revenus ou socioprofessionnelle);

É les statistiques externes de l'environnement qui proviennent d'études de marché (ex. nombre et type de concurrents, nombre et type de commerces influents, nombre de bureaux, importance du trafic piétonnier, facilité de parking, possibilité de transport en commun).

- l'analyse de régression: le chiffre d'affaires (CA) est alors exprimé en fonction de n facteurs

par une analyse de régression multiple (voir méthodes d'analyse au chapitre 1) et donné par l'équation de régression:

CA = ax1 + bx2 + cx3 + ...nxn + K

- l'analyse comparative par magasin : l'équation de régression sert à calculer le chiffre d'affaires attendu pour chaque magasin. Ce chiffre est ensuite comparé au chiffre réel et sa différence, positive ou négative, indique une performance élevée ou faible. Pour choisir parmi

un échantillon de localisations possibles, un emplacement pour un ou plusieurs points de vente à créer, on calcule le chiffre d'affaires théorique pour les différentes configurations possibles à partir de la même équation de régression et on sélectionne celle maximisant le

chiffre d'affaires.

La difficulté dans cette méthode de régression, comme dans la méthode précédente, est de définir la zone de chalandise dans laquelle mesurer les statistiques démographiques ou celles liées aux consommateurs potentiels du futur magasin. La méthode EVEC définit la zone de chalandise telle que l'a fait Applebaum, c'est-à-dire l'aire circulaire qui contiendra au moins

80 % de la clientèle. Cette zone se décompose en général en un certain nombre d'îlots au sein desquels il est aisé de se procurer des statistiques démographiques commercialisées par des organismes étatiques comme l'Insee. Or, comme on l'a vu au chapitre 1, les zones de chalandise ont très rarement une forme idéale de cercle mais sont plutôt constituées d'aires séparées de formes variables. Ainsi, la méthode EVEC dont la promotion en France a été assuré par l'Ifop-Etmar, convient plutôt à une recherche primaire de localisation de point de vente pas trop exigeante sur la précision des résultats obtenus. Ses promoteurs reconnaissent eux-mêmes que EVEC n'est pas applicable pour des chaînes de magasin en nombre réduit (au minimum 20 magasins) ou pour des points de vente très dissemblables comme pour un échantillon composé de petites surfaces urbaines et de grandes surfaces en pleine nature, ou bien des magasins de création récente en phase de développement et d'autres ayant atteint leur rythme de croisière. Il est donc nécessaire, pour appliquer une méthode du type modèle de régression, d'avoir à sa disposition un échantillon de points de vente suffisamment homogènes pour obtenir des résultats d'évaluation des emplacements, fiables et pertinents.

1.5.4 L'analyse discriminante

L'analyse discriminante possède des analogies méthodologiques avec le modèle de régression, mais ne débouche pas sur des prévisions de vente pour le nouvel emplacement. Alors que l'analyse de régression identifie, par une équation linéaire, les relations qui lient les variations des ventes entre différents points de vente et des facteurs explicatifs, l'analyse multidiscriminante sépare les magasins en plusieurs groupes selon leurs résultats

commerciaux, en l'occurrence les magasins ayant une performance acceptable et les autres plutôt inacceptables. L'analyse discriminante ne constitue pas à elle seule une méthode de localisation, mais aide seulement à cerner quels sont les magasins performants afin d'implanter plus en aval, une méthode du type analogique ou de régression multiple : on recherchera ainsi à créer un nouvel établissement dans un endroit ayant les caractéristiques d'une zone où est implanté un magasin performant avec éventuellement les caractéristiques de

ce type de magasins.

1.5.5 La méthode du marché potentiel

La méthode du marché potentiel découle directement du principe de gravité du commerce de détail de Reilly428 (voir § 2.1.2). Cette technique souvent utilisée par la grande distribution minimise la distance du futur emplacement aux consommateurs potentiels et la maximise par rapport à celle des concurrents. Les clients sont censés fréquenter d'autant plus le magasin qu'ils en sont proches. Les facteurs d'attraction jouant sur la fréquentation et propres aux magasins ne sont pas examinés par souci de simplicité ou tout simplement du fait de l'absence

de données disponibles : les données de performance des magasins concurrents, les caractéristiques de leurs surfaces commerciales ou de leurs produits ne sont pas, dans la majorité des cas, accessibles. Cependant, il est possible en affectant les consommateurs au point de vente situé à l'emplacement pressenti, de prévoir la part de marché du futur commerce par rapport à celle des concurrents (qui eux aussi se voient affectés les consommateurs qui leur sont les plus proches).

1.5.6 Le modèle p-médian

Le modèle p-médian est plus simpliste que les méthodes précédentes dans le sens où il ne tient compte que des critères de la distance (minimisation de la somme des distances entre les

428 REILLY W. J. (1931) The Law of Retail Gravitation, W. Reilly ed, 285 Madison Ave, New York, NY.

clients et les points de vente), de la demande et éventuellement du coût d'ouverture des points

de vente pour sélectionner les emplacements adéquats. En revanche, il sait en théorie être plus précis lorsqu'il calcule la position idéale des points de vente la plus proche en moyenne des clients car contrairement aux autres méthodes de localisation, la situation géographique des clients est examinée individu par individu, même si ensuite on effectue des regroupements par quartier ou rue dans un souci de simplification.

Dans la pratique, on localise sur le terrain les clients potentiels par leur adresse ou leur origine géographique en réalisant des enquêtes de terrain. L'auteur a lui-même effectué ce type d'enquête pour des compagnies de transport urbain : dans ce secteur d'activité, les clients sont interrogés directement dans les bus ou les tramways. On leur demande en particulier de situer

sur une carte le lieu de départ de leur trajet qui est ensuite codifié par quartier ou par cellule géographique urbaine, l'objectif étant dans ce cas d'améliorer la localisation des arrêts de transport en commun. Dans la restructuration d'un réseau d'agences bancaires, les adresses des clients sont connues, de même que dans la grande distribution lorsque la chaîne de magasins a réussi à populariser parmi ses clients un système de cartes de fidélité ou d'avantages. Pour ce

qui est de la création pure et simple d'un point de vente, c'est alors une base de données de consommateurs potentiels qu'il s'agit d'élaborer. De nombreux organismes de sondage constituent de telles bases principalement par enquête téléphonique. Dans certains pays comme au Japon, les consommateurs potentiels sont épiés dans leurs faits et gestes jusque dans la rue : ainsi en est-il de cette grande entreprise de construction automobile qui, pour créer un nouveau concessionnaire dans une ville, allait jusqu'à repérer les conducteurs de

vieilles voitures et à les suivre jusqu'à leur domicile en repérant leur adresse429.

C'est en effet du domicile que partent, en semaine, 68 % des trajets ayant une destination commerciale. Ce pourcentage croît même encore plus le week-end (73 % le samedi et 79 % le

429 Interview personnel en 1999 d'un commercial d'une grande entreprise automobile japonaise.

dimanche)430. De là, naît l'importance stratégique de réussir à se constituer une base de données d'adresses de clients potentiels ou réels pour alimenter un modèle p-médian. Ceci dit,

les pratiques actuelles d'utilisation d'un tel modèle souffrent d'approximations qui malheureusement font fléchir son intérêt commercial. Comme nous l'avons vu dans le chapitre précédent, l'examen de toutes les configurations des différentes localisations possibles des points de vente vis-à-vis des clients ne peut être fait compte tenu de leur nombre exhorbitant. Dans un premier temps, lors de la construction du modèle, on cherche donc à assigner chaque client de la base de données d'adresses à un quartier ou à un secteur urbain de manière à réduire le nombre de cellules d'analyse. Ainsi, c'est le centre de gravité de chacun

de ces secteurs qui servira de noeud au réseau du modèle. Le nombre de noeuds qui correspond chacun à un secteur, est alors considérablement réduit comparé au cas où l'on aurait créé pour chaque client un nouveau noeud. Le problème est que ce découpage en secteurs géographiques correspond plus à une logique administrative qu'à une logique commerciale. En effet, les secteurs sont le plus souvent des quartiers, des arrondissements, le découpage Insee (Iris), le découpage de la société Adde (ZAD) dans le cas de grandes villes pour lesquelles il est facile

de se procurer les statistiques démographiques mais qui forment une partition trop grossière

de la zone géographique d'analyse. De plus, l'affectation des clients à ces secteurs géographiques non homogènes, de tailles souvent inégales en population et en superficie, choisis uniquement par commodité risque de déboucher sur des choix de localisation erronés.

Il est plutôt rare de constater dans la pratique que les zones de chalandise épousent exactement les formes de ce découpage administratif artificiel. Le paragraphe 8.1 dans la deuxième partie montrera un exemple concret de cette pratique portant sur un découpage de l'Ouest parisien en arrondissements et communes de périphérie qui conduit à des solutions de

localisation de points de vente loin de l'optimal.

430 MOATI P. et POUQUET L. (1998) Stratégies de Localisation de la Grande Distribution et Impact sur la

Mobilité des Consommateurs, Collection des Rapports n°194, Crédoc, p.53.

Conclusion

Nous avons vu qu'une localisation optimisée facilitant l'accès aux produits ou aux services d'un point de vente aura tendance à attirer un grand nombre de clients et induira une rentabilité élevée à l'instar d'une localisation pauvre pouvant aller jusqu'à conduire le point de vente à la banqueroute. Le choix d'une localisation optimale doit s'accompagner de l'évaluation des caractéristiques de sa zone de chalandise, démarche stratégique pour sélectionner, entre plusieurs localisations, la plus prometteuse commercialement. L'observation de la zone de chalandise doit être suivie dans le temps car celle-ci est susceptible d'évoluer suivant les aléas des modifications du tissu économique et social. Malheureusement, les méthodes disponibles pour localiser de manière adéquate ou pour évaluer une zone de chalandise sont, soit trop simplistes et donc peu précises, soit trop complexes pour être mis en oeuvre. D'un autre côté, malgré la masse importante de données disponibles et souvent organisée dans les entreprises sous forme de datawarehouses, les systèmes d'informations géographiques n'ont pas encore réussi à devenir de véritables instruments de décision dans les problèmes d'optimisation en dépassant leurs fonctionnalités

de représentation cartographique améliorée.

Ainsi, nous nous proposons dans le prochain chapitre de présenter de manière exploratoire les différentes théories de la localisation dont une au moins, on l'espère, pourra servir de marche- pied à une véritable méthode pratique et rapide susceptible de tirer parti des grandes bases de données constituées par les entreprises concernant leur clientèle.

Chapitre 2

Les théories de la localisation

Introduction

Le processus d'ouverture d'un ou de plusieurs commerces de détail se décompose habituellement en quatre décisions fondamentales431. La société doit d'abord déterminer sur quel marché elle souhaite s'implanter. Il est ensuite nécessaire pour elle de spécifier le nombre

de points de vente qu'elle compte ouvrir en fonction de ses capacités financières et du taux de saturation du marché. Puis, la société doit examiner les localisations possibles et retenir après une étude poussée celle qui lui semble la plus convenable. En dernier lieu, il s'agit de spécifier

la taille du magasin et de ses caractéristiques (aménagement, décoration, assortiment, merchandising, ...). Les théories de la localisation s'attachent à résoudre le troisième point et tentent de modéliser à travers des concepts mathématiques plus ou moins élaborés l'espace commercial pour y détecter d'éventuelles opportunités d'implantation.

Il existe deux grandes familles de modèles de localisation représentées par :

- les modèles gravitaires et d'interaction spatiale,

- les modèles de localisation-allocation.

Alors que les modèles gravitaires dérivent de modèles physiques en postulant une interaction réciproque entre points de vente et clients, les modèles de localisation-allocation cherchent à optimiser la localisation et éventuellement le nombre de points de vente en minimisant les coûts de déplacement des clients. Nous allons examiner, dans le présent chapitre, en exposant leurs forces et faiblesses, ces modèles caractérisés le plus souvent par une approche plus ou moins théorique et simplifiée de la réalité.

Les modèles gravitaires et d'interaction spatiale comparent plusieurs localisations potentielles

en se fondant sur différents critères objectifs (éloignement à la clientèle, accessibilité, surface)

ou subjectifs (enquête d'opinion). Ils se fondent principalement sur l'analogie avec la

431 KOTLER P. (1971) Marketing Decision Making: A Model Building Approach, New York: Holt, Rinehart & Winston.

gravitation. Le territoire géographique est supposé être occupé par des espaces agrégés ou des zones qui comportent un certain nombre d'activités. Ces agrégats décrits par des attributs interagissent les uns avec les autres par l'intermédiaire de flux pouvant être des déplacements, des migrations ou encore des transports de marchandises. Les modèles d'interaction spatiale

peuvent s'écrire d'une façon très générale sous la forme432:

Tij

= K Wi

(1)W j

Cijn

(2)

où :

Tij est une mesure de l'interaction entre deux zones i et j; Wi (1) : une mesure de masse associée à la zone i;

Wj (2) : une mesure de masse associée à la zone j;

Cij : une mesure de la distance ou du coût de transport;

n : un paramètre à estimer;

k : une constante de proportionnalité.

D'autre part, il existe les modèles de localisation-allocation qui cherchent à placer un nombre défini de points de vente en les rapprochant le plus près possible de la demande. Ce dernier type de modèles pour lesquels ont été développés de nombreux algorithmes sur ordinateur, est bien adapté à la multi-localisation d'activités.

Passons tout d'abord en revue les modèles d'interaction spatiale, le premier dans l'histoire

ayant été la loi de Hotelling.

432 WILSON (1971) A Family of Spatial Interaction Models, and Associate Developments, Environment and

Planning A, vol. 3, 1-32.

2.1 Les modèles d'interaction spatiale

Comme on l'a dit, les modèles d'interaction spatiale abordent les problèmes de localisation sous l'angle de l'analogie avec certains principes physiques fondamentaux. Les principaux modèles de ce type sont :

- la loi de Hotelling,

- la loi de Reilly et la formule du point de rupture,

- la méthode des secteurs proximaux et la théorie des places centrales de Christaller,

- le modèle de Huff,

- le modèle MCI ou Modèle Interactif de Concurrence.

Les modèles d'interaction spatiale comportent certains inconvénients liés justement à leur approche un peu trop idéaliste de la réalité.

2.1.1 La loi de Hotelling

La loi de Hotelling433 n'est pas à proprement parler un modèle mais permet de prendre conscience des interactions concurrentielles. Elle part de la problématique mathématique suivante : considérons une répartition homogène de clients le long d'un segment AB. Il s'agit

de déterminer l'emplacement optimal sur ce segment de deux points de vente de même type gérés individuellement par deux managers, qui prennent leur décision sans se consulter l'un l'autre. On part du principe que les clients chercheront à fréquenter le magasin le plus proche

et que les managers voudront obtenir un profil maximal en ayant le plus de clients possibles.

Si ces clients avaient la possibilité de choisir eux-mêmes les deux emplacements ou que les managers puissent se consulter en ayant à l'esprit de se partager le marché, les deux magasins seraient placés au tiers et au deux tiers du segment AB et donc à équidistance l'un de l'autre. Dans ce cas, chaque magasin capterait une moitié des clients et ils atteindraient tous les deux

433 HOTELLING H. (1929) Stability in Competition, The Economic Journal, Vol. 39, p 41-57.

un profit identique. Mais, si chaque manager ignore la décision de son concurrent, ils auront alors la saine réaction de vouloir en premier s'installer au milieu du segment de manière à attirer en moyenne le plus de clients possibles. Ainsi, Hotelling met par là en évidence les phénomènes possibles d'interactions qui existent entre les concurrents au sein d'un même marché géographique, interactions qui conditionnent le choix des localisations commerciales. Mais, sa théorie appelée aussi principe de différenciation minimale explique aussi la tendance

de certains magasins à se regrouper. Si l'on considère à nouveaux les deux sociétés A et B identiques qui souhaitent maximiser leur profit en vendant des produits identiques au même prix en présence d'une demande inélastique et constante, en réduisant, par souci de simplification, l'éventail des localisations possibles de ces deux distributeurs à un segment de droite (xy), les entreprises vont chercher idéalement en premier lieu à se partager le marché en deux demi-segments sur lesquels elles occuperont des positions centrales (étape 1 - fig. 1).

Fig. 2.1 - Le principe de différenciation minimale434

Dans un deuxième temps, l'une d'elles deviendra plus ambitieuse et s'installera vraisemblablement à proximité de l'autre de manière à être à la fois proche de son marché et à capter une part du marché concurrent (étape 2). Ensuite, l'entreprise B se sentant menacée jouera à "saute-mouton" pour aller empiéter sur le marché de l'autre (étape 3) ce qui

434 Source : BROWN S. (1992) Retail Location : A Micro-scale Perspective, Ashgate, England.

contraindra l'entreprise A à faire de même,... On s'aperçoit qu'au bout d'un certain temps, les entreprises A et B se seront toutes les deux regroupées au centre du marché qui correspond en fait au milieu du segment (XY).

Ainsi, la loi de Hotelling offre essentiellement la possibilité de comprendre la logique de répartition des points de vente concurrents dans l'espace sans pouvoir être utilisée en pratique dans une recherche de localisations optimales au sein d'un même réseau. Cependant, là encore, les explications de ces phénomènes restent purement spéculatives. Les points de vente

ne sont généralement pas si mobiles que le laisse entendre le principe de différenciation minimale même si on assiste parfois dans la réalité à ce jeu de "saute-mouton" que Hotelling a introduit pour expliquer le regroupement des activités en groupes ou cellules. Les magasins plutôt qu'être nomades ont tendance à vouloir rentabiliser les investissements qu'ils ont consacrés à un site et à rester donc assez longtemps à un emplacement donné.

2.1.2 La loi de Reilly et la formule du point de rupture

En se fondant sur une analogie avec les propriétés de pesanteur des corps célestes, la population intermédiaire I localisée entre deux pôles urbains A et B sera attirée par chacun de

ces pôles proportionnellement à leur taille et en proportion inverse de la distance entre la zone

I et les pôles urbains A et B 435:

Va = [Pa ]

[Db ]

Vb Pb Da

Va et Vb: Proportion des ventes réalisées en A et B auprès des habitants de la zone

intermédiaire I,

Pa et Pb: population des pôles urbains A et B,

Da et Db: distance entre la zone intermédiaire I et les pôles urbains A et B,

: coefficient positif mesurant l'importance du facteur population sur le niveau des ventes,

435 REILLY W. J. (1931) The Law of Retail Gravitation, W. Reilly ed, 285 Madison Ave, New York, NY.

: coefficient positif mesurant l'impact de la distance entre clients et point de vente jouant sur

le niveau des ventes.

Comme et sont souvent pris égaux à 1 et à 2 respectivement 436 437, on obtient la formule:

Va Pa

=

Vb Pb

Db²

Da ²

Pour délimiter la frontière de la zone de chalandise de deux aires de marché éloignées, les

populations des pôles urbains A et B, Va et Vb, sont remplacées par la surface de vente des deux zones. Le point de rupture de l'attractivité commerciale issue du pôle urbain A et du pôle

B est alors indiqué par son abscisse X à partir du pôle A :

x = distance entre le pôle A et le pôle B

1+ surface de vente du pôle B

surface de vente du pôle A

Fig. 2.2 - Illustration de la Formule du Point de Rupture

Fig. 2.3 - Estimation d'une Zone de Chalandise par la Méthode du Point de Rupture

436 CONVERSE P.D. (1949) New Laws of Retail Gravitation, Journal of Marketing 14, p.379-384.

437 GUIDO P. (1971) Vérification Expérimentale de la Formule de Reilly en Tant que Loi d'Attraction des

Supermarchés en Italie, Revue Française de Marketing n°39, p. 101-107.

De nombreuses études empiriques dont celles de Reilly lui-même sont venues confirmer la validité de sa loi même s'il s'avère que l'exposant de la distance n'était pas forcément le carré. Converse438 a vérifié la loi de Reilly avec un coefficient égal à 1 et égal à 2 pour un certain nombre de centres urbains en Illinois, mais la puissance prédictive de la formule a semblé diminuer quand les centres concurrents étaient approximativement de taille égale. Elle

a également servi à localiser des agences bancaires439. La loi de Reilly, très théorique,

suppose une isotropie de l'espace, l'absence de barrières naturelles, un comportement invariable des consommateurs en tout point de l'espace ce qui n'est pas forcément le cas. Ainsi, la localisation optimale du magasin selon les hypothèses de la loi de Reilly se trouve au coeur même du bassin de population en l'absence de concurrence.

En résumé, prétendre que la forme de la zone de chalandise ne dépend que de l'importance des populations en présence et de la seule surface commerciale des points de vente est assez hasardeux alors même que les magasins ont en général une attractivité propre vis-à-vis de consommateurs éventuels qui n'ont pas forcément les mêmes attentes. Le modèle de Huff à l'approche probabiliste reprend cependant les mêmes hypothèses approximatives que la loi de Reilly à savoir que seules la distance entre le point de vente et les clients potentiels d'une part,

et la surface de vente du point de vente d'autre part influenceront l'importance de sa fréquentation.

2.1.3 La méthode des secteurs proximaux et la théorie des places centrales de

Christaller

La théorie des places centrales rend compte de la taille, de l'espacement et du nombre des villes. On considère un espace géographique non différencié, une zone homogène, où la densité de population est uniforme, où tous les habitants ont le même revenu à dépenser et où

438 CONVERSE P.D. (1949) New Laws of Retail Gravitation, Journal of Marketing 14, p.379-384.

439 JOLIBERT A., ALEXANDRE D. (1981) L'utilisation du modèle gravitaire généralisé dans la localisation des agences bancaires, Techniques Economiques, 123, 31-44.

les biens sont offerts à des prix identiques, auxquels s'ajoutent seulement les coûts de transport, lesquels ne dépendent que de la distance au centre. On fait aussi l'hypothèse d'un comportement rationnel des individus, qui cherchent à se procurer les biens et les services au meilleur coût et s'approvisionnent donc au centre le plus proche.

Selon cette théorie 440, dans cet espace physique idéal représenté par une distribution

uniforme des consommateurs pouvant se déplacer uniformément, la localisation des magasins

est régulière et occupe le sommet d'hexagones. Ces sommets correspondent aux points d'accessibilité maximale pour les consommateurs potentiels de la zone de chalandise. Christaller traite, sur une base hiérarchique, les points de vente selon leur niveau d'importance

et prouve que la localisation d'un point de vente d'un niveau plus élevé (chiffre d'affaires plus important pour plus de clients avec une exigence plus élevée) sera optimale au centre de l'hexagone constitué par six magasins élémentaires:

Fig. 2.4 - Les hexagones de la théorie des places centrales

Plus précisément, La disposition des lieux centraux qui permet de desservir toute la population en couvrant tout l'espace (pavage du territoire) varie alors selon le point de vue que l'on privilégie:

440 CHRISTALLER W. (1935) Die Zentralen Orte in Süddeutschland, G.Fischer, Germany, Jena.

Î le principe de marché: si l'on veut maximiser le nombre de lieux centraux (meilleure desserte de la population) tout en assurant un partage équitable de la clientèle entre

les centres, les villes d'un même niveau hiérarchique sont disposées au sommet de triangles équilatéraux. La limite d'influence de chaque ville passe par le milieu de chaque côté du triangle, ce qui forme autour de chaque ville une zone d'influence hexagonale. Chaque centre de niveau inférieur est partagé entre l'influence de trois centres de niveau supérieur. La superficie de la zone desservie par un centre est trois fois plus grande que celle que dessert un centre de niveau immédiatement supérieur (rapport k=3);

Î le principe de transport: si l'on déforme la configuration des villes précédentes de façon à en placer plusieurs sur un même axe de transport, afin de réduire les coûts d'infrastructures de circulation, on obtient une hiérarchie où la dimension de la zone d'influence d'un centre supérieur est quatre fois celle d'un centre de niveau immédiatement inférieur (rapport k=4);

Î le principe administratif: les fonctions d'encadrement politique et de gestion territoriale ne se partagent pas entre des centres concurrents, mais s'exercent dans des circonscriptions aux limites fixées et sans recouvrement. Chaque ville au centre d'une circonscription hexagonale contrôle six centres de niveau inférieur, et la superficie de

sa zone d'influence est sept fois celle d'un centre de niveau inférieur (rapport k=7)441.

La méthode des secteurs proximaux suppose que les consommateurs choisiront le service le plus proche d'eux selon l'hypothèse de la théorie des places centrales. Les zones de chalandise

441 CHAMUSSY H., CHAPELON L., DURAND-DASTES F., ELISSALDE B., GRASLAND C., GRATALOUP C., PUMAIN D., ROBIC M.C., SANDERS L., SAINT-JULIEN T. (2001)

http://www.cybergeo.presse.fr/

ou secteurs proximaux sont dessinés en construisant des polygones de Thiessen 442 ou de Dirichlet 443 qui représentent chacun la surface polygonale la plus proche d'un magasin particulier que de tout autre. Ces polygones se dessinent en 4 étapes élémentaires.

Premièrement, on localise les points de vente ou de services sur une carte, ensuite on lie chaque point les uns aux autres, troisièmement on trace la médiatrice à partir du point médian

de chaque segment et enfin, on prolonge les médiatrices pour former à leurs inter-parties les sommets des polynômes de Thiessen.

La méthode des secteurs proximaux essentiellement géométrique permet de repérer les lacunes spatiales représentant autant d'opportunités d'implantation en supposant qu'une saturation de l'espace commercial se note par de petits polygones contrairement à une vaste

zone polygonale dotée d'un fort potentielle.

Fig. 2.5 - Etapes pour la Détermination des Secteurs Proximaux 444

442 THIESSEN A.H. et ALTER J.C. (1911), Precipitation Averages for Large Areas, Monthly Weather Review,

39, p. 1082-1084.

443 DIRICHLET, G. L. (1850), Über die Reduktion der Positiven Quadratischen Formen mit Drei Unbestimmten

Ganzen Zahlen , Journal für die Reine und Angewandte Mathematik 40, p. 216.

444 GHOSH A. et McLAFFERTY S.L. (1987) Location Strategies for Retail and Service Firms, Lexington

Books, Reading, Mass.

En accord avec les hypothèses posées par Christaller, on sous-entend en utilisant cette méthode qu'il n'y a aucune complémentarité entre les points de vente contrairement à ce qui

est constaté pour certaines activités qui ont au contraire tendance à se regrouper pour augmenter leur pouvoir d'attractivité445 446. Ce phénomène n'est pas nouveau et a été constaté chez les confréries et guildes d'artisans et de commerçants au moyen-âge ou dans les souks

des pays du Maghreb 447.

Fig. 2.6 - Répartition des commerces et de l'artisanat par métier dans un souk marocain 448

Le problème est qu'un secteur du marché souvent composé de distributions non-isotropes de consommateurs engendre donc une distorsion de la forme de la zone de chalandise 449.

Quelques tentatives ont tout de même été réalisées pour prolonger le modèle de Christaller grâce à des transformations géographiques permettant de convertir un environnement non- isotrope en un environnement isotrope et réciproquement 450. D'autres chercheurs comme Lösch ont tenté d'expliquer la taille et l'organisation de certaines villes à partir de ce

modèle451. A peu près à la même époque que durant les recherches de Christaller, Reilly

445 HOTELLING H. (1929) Stability in Competition, The Economic Journal, vol. 39, p. 41-57.

446 DELOZIER M.W. et LEWISON D.M. (1986) Retailing, 2nd ed., Merill.

447 FOGG W. (1932) The Suq: a study in the human geography of Morocco, Geography 12, p. 257-258.

448 BROWN S. (1992) Retail Location: A Micro-Scale Perspective, Edit. Ashgate, Grande-Bretagne.

449 ISARD W. (1956) Location and Space Economy, p. 254-287, New York.

450 GETIS A. (1961) The Determination of the Location of Retail Activities with the Use of a Map

Transformation, Economic Geography, p. 12-22.

451 LÖSCH A. (1940) Die Räumlische Ordnung der Wirtschaft, Fischer, Iena.

allait, lui, introduire un modèle tenant compte de la répartition des clients et des points de vente ainsi que de leur interaction réciproque.

2.1.3 Le modèle de Huff

Huff452 a été le premier à introduire au début des années 60 un modèle d'interaction spatiale tenant compte de la concurrence. Selon lui, un consommateur n'est pas rivé irrémédiablement

à un magasin mais est susceptible d'hésiter entre plusieurs choix de lieux d'achats. Tous les magasins ont donc une chance d'être fréquentés, cette approche probabiliste tranchant avec l'approche déterministe qui prévalait à cette époque. Selon Huff, la surface de vente du commerce en particulier joue un rôle important dans son attractivité vis-à-vis des clients tout autant que sa proximité.

La probabilité qu'un consommateur au point i fréquente un magasin particulier au point j est

donnée par l'axiome de Luce453:

Pij

= Uij

U ik

k Ni

S

=

avec l'utilité du point de vente Uij

D

j ij

et Sj: la taille du point de vente j

Dij: la distance entre le consommateur en i et le magasin en j

á et â reflètent l'importance accordée à la taille et à la distance dans la décision du consommateur de fréquenter tel ou tel magasin. Etant donné que l'utilité diminue avec

la distance, le paramètre â est négatif.

Plus l'utilité est grande, plus le consommateur aura tendance à être attiré par le point de vente.

Il est à noter que dans la formule, la taille Sj du point de vente en j peut être remplacée par

452 HUFF D. L. (1964) Defining and Estimating a Trading Area, Journal of Marketing, Vol 28, p. 38.

453 LUCE R. (1959) Individual Choice Behavior, New York: John Wiley & Sons.

une quelconque autre mesure de l'attractivité du magasin comme dans le modèle MCI que nous examinerons un peu plus loin. Le modèle de Huff est approximatif de la même façon que

la loi de Reilly puisque, comme nous l'avons vu au chapitre 1, l'étendue et la forme de la zone

de chalandise conditionnant la fréquentation du point de vente dépendent de nombreux facteurs environnementaux, socio-économiques et marketing (les caractéristiques propres du magasin) autres que la distance à la clientèle ou que la surface commerciale. Le modèle de Huff a cependant, vis-à-vis de la loi de Reilly, l'avantage de pouvoir comparer entre elles plusieurs localisations potentielles par le calcul des probabilités de fréquentation. Il peut constituer une approche rapide et sommaire pour évaluer très grossièrement la qualité d'un site par rapport à un autre malgré le fait que les paramètres de puissance á et â demandent à être évalués au préalable grâce éventuellement à l'expérience tirée de points de vente existants pour lesquels on connaît les surfaces commerciales, les fréquentations et la distance moyenne des consommateurs au point de vente.

2.1.5 Le modèle MCI

Le modèle MCI ou Modèle Interactif de Concurrence (multiplicative competitive interaction)

est en fait une prolongation du modèle de comportement spatial de Huff avec l'avantage de tenir compte d'autres facteurs que la distance ou la surface de vente. Dans ce modèle, on a simplement remplacé la surface Sj dans la formule de Huff donnant la probabilité de fréquentation du magasin j par le consommateur i par une mesure plus générale de l'attractivité du magasin comportant L facteurs d'attraction Alj à la puissance ál (facteurs

d'attraction pouvant être comme nous l'avons déjà dit le service de paiement par carte

bancaire, le nombre d'allées du magasin, le nombre de caisses, l'emplacement à une

intersection 454 ou des paramètres subjectifs comme l'image du magasin 455 456) :

A

L l

lj

l =

1

)

Cette probabilité devient donc:

L L

Pij

= ( l

A

D

lj

ij

l =1

/

k Ni

l

D

(

)

lk ik

A

l =1

Ni étant le nombre d'alternatives de points de vente où les consommateurs sont susceptibles

d'effectuer leurs emplettes. Les différents paramètres du modèle MCI peuvent être calculés

par la méthode classique des moindres carrés457. Les consommateurs font effectivement appel

à leurs affections personnelles pour fréquenter tel ou tel point de vente 458. Ce phénomène a permis de distinguer MCI objectif qui ne se préoccupe que de données rationnelles le plus souvent liées au magasin (ex. surface de vente, prix, nombre de caisses), du MCI subjectif 459

qui prend en compte les perceptions des consommateurs quant aux attributs les plus déterminants pour le choix du point de vente. Le modèle MCI subjectif montre des taux d'explication de la variance dans la régression bien supérieurs du fait de l'importance de la perception dans le choix du magasin, la difficulté étant néanmoins de quantifier cette perception sur une échelle de mesure. Le MCI objectif et le modèle de Huff sous-entendent un calibrage parfait dans toutes les cellules du découpage géographique de l'analyse (ou

condition de stationnarité) avec l'incertitude non levée de savoir si les consommateurs auront

454 JAIN K. et MAHAJAN V. (1979) Evaluating the Competitive Environment in Retailing Using Multiplicative

Interactive Model, Research in Marketing, Vol. 2, Jagdish Sheth ed., Greenwich, Conn.: JAI Press.

455 NEVIN J.R. et HOUSTON M.J. (1980) Image as a Component of Attraction to Intraurban Shopping Areas,

Journal of Retailing, Vol. 56, No. 1, pp.77-93.

456 COOPER L.G. et FINKBEINER C.T. (1983) A Composite MCI Model for Integrating Attribute and

Importance Information, Advance in Consumer Research, 109-113.

457 NAKANISHI M. et COOPER L.G. (1974) Parameter Estimates for Multiplicative Competitive Interaction

Models: Least Square Approach, Journal of Marketing Research 11: 303-311.

458 WRIGHT P. et RIPS P.D. (1981) Retrospective Reports on the Causes of Decisions, Journal of Personality and Social Psychology 40, 601-614.

459 STANLEY T.J., SEWALL M.A. (1976) Image Inputs to a Probabilistic Model: Predicting Retail Potential, Journal of Marketing, 40 (July), 48-53.

ou non des réactions différentes d'une cellule à l'autre460. Ainsi, certaines personnes résidant dans les secteurs résidentiels les plus isolés peuvent par exemple être beaucoup plus sensibles

à la distance que le reste de la population en raison du manque d'accès aux transports461. Le modèle MCI a pourtant montré son efficacité en particulier sur le marché du meuble462 où des variables subjectives telles que l'influence de la promotion sur les décisions d'achat, la qualité

des produits et de l'accueil ont été prises en compte. Le modèle a alors été calibré dans chaque cellule de découpage géographique pour respecter la condition de stationnarité463 et des facteurs subjectifs comme le jugement des consommateurs ont été introduits en utilisant la transformation mathématique du zéta-carré 464. Cependant, le traitement et la détection de la non-stationnarité est difficile même s'il existe des moyens mathématiques de s'en affranchir comme la procédure du jackknife popularisée par Tukey465 et donc le modèle MCI reste

difficile à mettre en pratique pour les problématiques de localisation des professionnels.

Mais, l'approche MCI peut être adoptée, si on le souhaite, en complément du modèle analogique, pour localiser un magasin unique ou en complément du modèle de localisation- allocation dans un processus de localisation multiple466.

2.1.6 Le modèle MNL

Le modèle MNL ou Multinomial Logit est un modèle destiné à analyser le processus de choix des consommateurs. Il prend l'hypothèse que les alternatives de choix sans rapport les unes

460 GHOSH A. (1984) Parameter Nonstationarity in Retail Choice Models, Journal of Business Research 12,

425-426.

461 GHOSH A. et McLAFFERTY S. (1987) Location Strategies for Retail and Service Firms, Lexington Books, p.117.

462 CLIQUET G. (1990) La Mise en OEuvre du Modèle Interactif de Concurrence Spatiale (MICS) Subjectif,

Recherche et Applications en Marketing 5 / 7, 3-18.

463 GHOSH A. (1984) Parameter Nonstationarity in Retail Choice Models, Journal of Business Research 12,

425-426.

464 COOPER L.G. et NAKANISHI M. (1983) Standardizing Variables in Multiplicative Choice Models, Journal

of Consumer Research , 10, 96-108.

465 TUKEY (1958) Bias and Confidence in Not-Quite Large Samples, Annals of Mathematical Statistics 29, p.614.

466 ACHABAL D.D., GORR W.L. et MAHAJAN V. (1982) Multiloc: A Multiple Store Location Decision

Model, Journal of Retailing, 5-24.

avec les autres (IIA : Independence of Irrelevant Alternatives), liées à un processus aléatoire, sont des évènements indépendants et que l'introduction d'une nouvelle alternative de choix influencera la probabilité de choix de toutes les autres alternatives. La résolution du modèle s'apparente à l'analyse discriminante multiple. Si la probabilité de choix d'un magasin au point

j par un consommateur au point i est, selon l'axiome de Luce467:

Pij

= Uij

U ik

k Ni

alors le modèle MNL considère l'hypothèse que la part stochastique des fonctions d'utilité Uik

sont indépendantes et non corrélées . Le modèle MNL est surtout utilisé dans les transports, pour prévoir le choix du mode, pour analyser le choix des marques468 ou encore pour choisir l'emplacement de magasins 469. Un modèle encore plus général, le NMNL ou nested multinomial logit, suppose que le choix entre deux alternatives ne dépend pas des caractéristiques d'une quelconque autre alternative: le consommateur prend d'abord le choix

de fréquenter un point de vente et décide seulement ensuite lequel470. Le principe du NMNL

est en fait d'établir une hiérarchie de préférence dans les choix et de prendre l'hypothèse qu'un individu prendra la décision correspondant à sa préférence la plus élevée en connaissant tous

les choix de niveaux inférieurs et leurs caractéristiques471. Ainsi, on prend l'hypothèse dans ce

modèle qu'un consommateur sélectionnera le point de vente le meilleur selon ses propres critères parmi tous les points de vente qu'il connaît suffisamment pour s'en faire une opinion.

467 LUCE R. (1959) Individual Choice Behavior, New York: John Wiley & Sons.

468 HRUSCHKA H., FETTES W. et PROBST M. (2001) A Neural Net-Multinomial Logit (NN-MNL) Model to Analyze Brand Choice. In: Govaert, G., Janssen, J., Limnios, N. (eds.): Applied Stochastic Models and Data Analysis, Volume 2. ASMDA, Compiègne 2001, 555-560.

469 FOTHERINGHAM A. S. (1988) Market Share Analysis Techniques : A review and Illustration of Current

US Practice, in Store Choice, Store Location and Market Analysis, Neil Wrigley, Routlege, 120-159.

470 GUPTA I. et DASGUPTA P. (2000) Report : Demand for Curative Health Care in Rural India : Choose between Private, Public and No Care, Programme on Research Development of the National Council of

Applied Economic Research sponsored by the United Nations Development Programme, Dec. 2000.

471 DENG Y., ROSS L.S. et WATCHER S.M. (1999) Employment Access, Residential Location and

Homeownership, Lusk Center for Real Estate Report, Los Angeles.

2.2 Les modèles de localisation multiple

Pouvoir gérer en parallèle plusieurs points de vente, outre l'intérêt économique qu'une telle organisation commerciale représente, permet de réaliser des économies d'échelle sur la promotion, la main d'oeuvre et la distribution. Ce mode de gestion synergique de plusieurs implantations offrant une meilleure représentation géographique conduit également à diminuer le risque lié à l'incertitude de l'environnement économique qui pèse tant sur un magasin individuel. Ces avantages ne sont effectifs que si les localisations des différents points de vente ont été examinées avec soin, l'impact réciproque d'ouverture d'un magasin sur l'activité de l'autre étant alors connu.

La problématique de localisation multiple contraint le décideur à trouver la réponse à quatre questions472 473dont :

- sur quels marchés faut-il s'implanter ?

- combien de points de vente faut-il créer ?

- comment évaluer les localisations possibles ?

- quelles seront la taille et les caractéristiques des magasins et des sites retenus ? Parmi les instruments capables de répondre à ces questions, on trouve :

- les modèles de localisation-allocation474,

- le modèle Multiloc475,

- la méthode d'analyse de portefeuille476.

472 KOTLER Philippe (1971) Marketing Decision Making : A Model Building Approach, Holt, Rinehart et

Winston, NY.

473 CLIQUET G. (1992) Le Management Stratégique des Points de Vente, p.187, Ed. Sirey.

474 GHOSH A., RUSHTON G. (1987) Spatial Analysis and Location-Allocation Models, Van Nostrand, Rheinhold, 1987.

475 ACHABAL D.D., GORR W.L. et MAHAJAN V. (1982) Multiloc: A Multiple Store Location Decision

Model, Journal of Retailing, 5-24.

476 MAHAJAN V., SHARMA S. et SRINIVAS D. (1985) An Application of Portfolio Analysis for Identifying

Attractive Retail Locations, Journal of Retailing, vol.61, n°5, hiver 1985, 19-34.

2.2.1 les méthodes de localisation-allocation

Pour faciliter la recherche d'implantation, différents modèles baptisés modèles de localisation-allocation ont été mis au point. La question fondamentale soulevée par ces modèles est de savoir comment approvisionner ou servir au mieux une aire géographique vaste à partir d'un nombre limité de points de vente. Etant donné que les entreprises ont toutes des moyens financiers limités (coûts d'ouverture et d'exploitation), le nombre maximal de commerces de détail à ouvrir est souvent fixé au préalable et constitue une donnée de base de

ce type de modèle. Les modèles de localisation-allocation prennent d'une manière générale l'hypothèse que la probabilité d'un consommateur de fréquenter un point de vente ou de service donné est d'autant plus élevée qu'il en est plus proche, compte-tenu de son niveau d'attractivité. L'analyse tend ainsi à réduire la distance moyenne séparant l'ensemble des consommateurs au point de vente le plus proche de son domicile en maximisant l'accessibilité des localisations. Les modèles de localisation-allocation regroupent d'une manière générale

cinq composants de base dont :

- la fonction objectif : c'est une fonction qui intègre la notion de distance séparant les consommateurs aux emplacements potentiels des points d'offre ainsi éventuellement qu'une mesure de leur attractivité. Elle quantifie donc l'accessibilité globale des points d'offre vis-à-vis des clients ou bien encore une mesure de la viabilité économique des emplacements.

- les points de demande : ils représentent le niveau de la demande concernant un ensemble de marchandises ou de services concernant un certain zonage géographique

pouvant être une région, une ville ou un quartier. Les points de demande

correspondent en général à des cellules densément peuplées où réside un pouvoir d'achat intéressant pour l'activité considérée.

- les emplacements potentiels : ce sont les localisations possibles en termes de disponibilité foncière, coût, accessibilité.

- la matrice d'éloignement ou de temps : cette matrice rend compte de la distance géographique ou temporelle séparant les emplacements potentiels des points de demande. Plus précisément, ces distances peuvent être mesurées en pâtés de maison,

en distance kilométrique à vol d'oiseau, en terme de cheminement piétonnier, en temps de conduite selon la clientèle considérée et les moyens investis pour la déterminer.

- la règle d'allocation : cette règle spécifie de quelle manière les emplacements potentiels seront alloués aux points de demande. On peut par exemple considérer dans

le cas le plus simple que chaque client fréquentera le point de vente le plus proche de son domicile, la règle d'allocation étant alors la proximité géographique. Il est possible d'envisager des règles plus complexes à savoir par exemple que la fréquentation de tel ou tel point de vente dépendra de la saison et se reportera sur un autre emplacement à d'autres moments de l'année.

Ainsi, compte tenu de ces cinq facteurs décrivant entièrement un modèle de localisation- allocation donné, l'espace commercial peut être apprécié sous la forme d'un réseau constitué

de noeuds caractérisés par une certaine demande et/ou pouvant accueillir un point d'offre, les segments liant les noeuds de ce réseau représentant les éloignements. A ce réseau doit être néanmoins associé une fonction objectif qui, exprimé le plus souvent sous forme mathématique, spécifie la manière selon laquelle les clients opteront pour tel ou tel

emplacement potentiel.

Dans le cas où n'existerait qu'un seul point d'offre à localiser, le problème revient à le placer virtuellement tour à tour à l'un ou à l'autre des emplacements potentiels puis à choisir celui pour lequel la fonction objectif est la plus favorable. Tout se complique si l'on doit localiser plusieurs activités, car le nombre de noeuds étant souvent élevé, il devient pratiquement impossible physiquement, même avec des ordinateurs puissants, de calculer la fonction objectif exhaustivement pour chacune des combinaisons d'emplacements envisageables. Il a donc été développé pour cela des solutions approchées par la mise en oeuvre d'heuristiques

qui conduisent, non pas à une série de localisations optimales mais tout au moins à un niveau satisfaisant de la fonction objectif.

L'un des premiers modèles de localisation-allocation a été développé par Alfred Weber avec comme problématique la réduction du coût total de transport de matières premières à l'usine

et de l'usine au marché.

Le modèle p-médian

La recherche opérationnelle en matière de localisations d'activités a été l'une des préoccupations majeures pour beaucoup de champs d'applications (logistique, transport, grande distribution, services bancaires, assurance). En particulier, en ce qui concerne la localisation de points de vente ou de services ou même d'entrepôts, une problématique importante est de trouver les localisations pour un nombre p d'activités devant fournir n clients de telle manière que la somme de l'ensemble des distances séparant chaque activité aux clients les plus proches soit minimale. Ce problème lié à un réseau discrétisé bien identifié est classiquement connu sous le nom de p-médian477 478 qui trouve son origine au début du

477 HAKIMI S.L. (1965) Optimum Distribution of Switching Centers in a Communication Network and Some

Related Graph Theoretic Problems, Operations Research 13, 462-475.

478 REVELLE C. et SWAIN R. (1970) Central Facilities Location, Geographical Analysis, 2, 30-40.

XXème siècle dans les réflexions d'Alfred Weber 479 sur la meilleure manière de placer un centre de production par rapport aux sources de matières premières. En pratique, le problème

du p-médian (nommé en abrégé p-MP) est soulevé dans la plupart des réseaux qu'ils soient routiers, aériens ou téléphoniques 480 481. Handler et Mirchandani 482 ont dressé la liste très variée des applications potentielles du modèle p-médian comme les décisions de localisation pour les services d'urgence (police, pompiers, urgences médicales), les réseaux de communication et informatique (localisation des fichiers informatiques sur une série de serveurs identifiés), les applications militaires (centres militaires stratégiques), les activités de service public ou privé (les magasins, centres commerciaux, postes), les activités de transport (arrêts de transport en commun, entrepôts), l'intelligence artificielle et les modèles statistiques (partition de nuage de points). Mais, les applications vraiment centrées sur le domaine de la

distribution ont été mises en oeuvre dans les années 1980 avec comme objectif principal d'optimiser le nombre de points de vente et leurs emplacements, connaissant la localisation précise de consommateurs, les coûts de déplacement et éventuellement la demande 483 484 485.

Le présent exposé même s'il se concentre sur l'application à la localisation spatiale d'activités,

pourrait très bien être directement transposé aux autres domaines précédemment cités.

Il existe bien entendu de nombreux autres modèles dits de localisation-allocation que le p- médian, plus ou moins bien adaptés selon les cas. On peut citer parmi eux le modèle p- centré486 qui recherche les p localisations les plus proches de clients: créer p activités, en

479 WEBER A. (1909) Über den Standort der Industrien, Tübingen, Traduction Anglaise de Friedrich (1929)

Theory of the Location of Industries, University of Chicago Press, Chicago.

480 DASKIN M.S. (1995) Network and Discrete Location - Models, Algorithms and Applications, John Wiley and Sons, Inc., New York..

481 GALVAO R.D. (1993) Use of Lagrangean Relaxation in the Solution of Uncapacited Facility Location

Problems, Location Science 1, 57-70.

482 HANDLER G.Y. et MIRCHANDANI P.B. (1979) Locations on Networks, MIT Press, Cambridge, MA.

483 GHOSH A. et CRAIG C.S. (1984) A Location Allocation Model for Facility Planning in a Competitive

Environment, Geographical Analysis, Vol. 16, n°1, 39-51.

484 McLAFFERTY S.L. et GHOSH A. (1987) Optimal Location and Allocation with Multipurpose Shopping,

Spatial. Analysis and Location-Allocation Models, ed. Ghosh Avijit, Rushton Gerard, Van Nostrand Reinhold.

485 CLIQUET G. (1992) Le Management Stratégique des Points de Vente, p.187-191, Ed. Sirey.

486 KARIV O. et HAKIMI S.L. (1979) An algorithmic Approach to Location Problems, Part 1: The p-Centers,

SIAM J. Math. 37, 513-538.

assignant chaque client à l'une d'entre elles, de telle manière que la distance maximale de n'importe quelle activité à l'ensemble de ses clients soit minimale. Cette problématique, dénommée également minimax, cadre bien avec la localisation d'ambulances ou de stations de pompiers qui doivent être les plus proches possibles des zones d'intervention. Il existe des modèles plus élaborés et plus spécifiques à la localisation d'enseignes commerciales tels que

le MCI487 déjà évoqué et associé au modèle Multiloc488, qui intègrent la notion de

concurrence, le coût d'ouverture des points de vente ou même les attributs des magasins.

Mais, il est vrai que les caractéristiques des points de vente et des clients ne sont pas une information facile à obtenir, tâche d'autant plus ardue que le nombre de ces derniers est élevé. Rassembler des données sur les activités concurrentes s'avère également souvent particulièrement difficile pour le manager. C'est l'une des raisons pour laquelle notre thèse s'est concentrée sur le problème plus simple mais pas plus simpliste du p-médian. De plus, il

est fondamental dans la plupart des projets d'ouverture de commerces (ou même d'entrepôts) d'être le plus proche possible de ses clients potentiels et de se mettre en quête d'un emplacement commercial en étant guidé par cette logique, au moins dans un premier temps. A quoi bon tenter en effet de chercher des informations sur une clientèle trop distante pour être conquise par le service offert au sens large du terme ! D'une manière générale, on peut

distinguer deux catégories de clientèle489: l'une domiciliée dans une zone proche du point de

vente nommée zone de chalandise, est attirée par un point de vente jouant le rôle d'un pôle (attraction polaire). L'autre, ayant un caractère plus aléatoire, est induite par le flux de clientèle passant à proximité du point de vente et interceptée par ce dernier (attraction passagère). Les points de vente eux-mêmes selon le produit ou le service proposés se rangent

487 NAKANISHI M. et COOPER L.G. (1974) Parameter Estimate for Multiplicative Competitive Interactive

Model - Least Squares Approach, Journal of Marketing Research, 11, 303-311.

488 ACHABAL D.D., GORR W.L. et MAHAJAN V. (1982) Multiloc: A Multiple Store Location Decision

Model, Journal of Retailing, 5-24.

489 CLIQUET G. (1997) Attraction Commerciale, Fondement de la Modélisation en Matière de Localisation

Différentielle, Revue Belge de Géographie, 121ème année, p. 62-65.

dans l'une ou l'autre des catégories selon leur capacité à capter le flux de clients circulant à proximité (ex.: bureau de poste, agence bancaire, distributeur automatique) ou à attirer "à distance" les consommateurs selon un principe similaire à celui de la gravitation étendue au commerce de détail par Reilly490 (ex.: agence d'intérim, supermarché, charcuterie,

papeterie)491. Certaines activités possèdent un caractère mixte et comptent donc les deux types

de clientèle évoqués avec éventuellement une certaine prépondérance pour l'un ou pour l'autre

(ex.: bar-café-brasserie, épicerie, pâtisserie).

Notre recherche visera à considérer la clientèle de points de vente ou de services jouant plutôt

sur le principe de l'attraction polaire. Nous supposerons la localisation de cette clientèle au sein de zones de chalandise connue, par exemple identifiée par les adresses du domicile avec l'hypothèse que les clients seront d'autant plus fidèles (ou satisfaits) que le point de vente leur

est proche. Les termes de "points de vente" et de "clients" peuvent être pris au sens large à savoir que le raisonnement qui suit s'appliquerait de la même manière à un service de livraison à partir d'entrepôts (les points de services) devant acheminer un produit vers des centres de distribution ou vers des détaillants (ex: services de tri postal et bureaux de poste; grossistes en boissons et cafés-bars-brasseries).

Bien que le modèle p-médian ne s'appuie que sur la notion de distance (ou de coût de déplacement) entre clients et sites potentiels d'activité, compiler les données sur les localisations de ces différents acteurs pour trouver une localisation proche de l'optimal demande beaucoup d'efforts et de temps de calcul ainsi que nous le constaterons plus loin.

2.2.1.1 Formulation mathématique du p-MP

La résolution du problème p-médian n'échappe pas à sa nécessaire rationalisation consistant à l'exprimer en langage mathématique: le p-MP sous-entend l'existence d'un réseau constitué

490 REILLY W. J. (1931) The Law of Retail Gravitation, W. Reilly ed, 285 Madison Ave, New York, NY.

491 CLIQUET G. (1997) Attraction Commerciale, Fondement de la Modélisation en Matière de Localisation

Différentielle, Revue Belge de Géographie, 121ème année, p. 66.

de noeuds ou points et de liens, ces derniers étant associés à un coût de déplacement représenté

par la distance di,j (distance du point i au point j). L'objectif est ainsi de trouver un emplacement optimal pour p activités au sein des noeuds du réseau en cherchant à minimiser

la distance totale entre les p activités et les clients qui leur sont associés (un client est associé

à une activité s'il se trouve plus proche de cette dernière que de toutes les autres). Les modèles

p-médian pondérés et non-pondérés se différencient par le fait que les premiers tiennent compte de la demande ai au point i avec l'objectif de minimiser la somme totale des distances pondérées par la demande.

D'une manière générale, la formulation mathématique du p-MP s'écrit de la façon suivante492:

Minimiser

i j

ai dij xij représente la fonction objectif, (1)

avec

i

xij = 1, i, assure que tous les clients sont assignés à une activité et une seule, (2)

xij yj, i, j empêche d'assigner un client à une activité si elle n'est pas ouverte, (3)

yj = p, le nombre total d'activités est p, (4)

j

xij, yj {0,1}, i, j nature binaire des variables xij, yj (5)

ai : la demande au noeud i,

di,j : la distance du noeud i au noeud j,

p : le nombre d'activités à localiser,

xi,j = 1, si le noeud i est assigné à l'activité j et 0 autrement,

yj = 1, si l'activité j est ouverte et 0 autrement.

492 BEAUMONT J.R. (1987) Location-Allocation Models and Central Place Theory, Spatial Analysis and

Location-Allocation Models, ed. Ghosh Avijit, Rushton Gerard, Van Nostrand Reinhold.

Cette formulation suppose que tous les noeuds du réseau ont la qualité de localisation potentielle pour les activités et que les p activités seront localisées en des points distincts. Dans le cas non-pondéré, les demandes ai sont toutes égales à 1.

Le problème p-MP est réputé appartenir à la classe des problèmes connus comme étant NP-

complets493: ses solutions issues d'algorithmes linéaires deviennent insolubles au fur et à mesure que le nombre des variables (activités et clients) augmente avec une progression exponentielle de la taille du problème. En effet, selon une logique d'analyse combinatoire, le nombre de solutions à examiner est en fonction de n, le nombre de noeuds, et p, le nombre d'activités à placer:

n!

p! (n -

p)!

ce qui signifie par exemple que si l'on devait simplement chercher à placer 15 points de vente

au milieu d'un réseau de 100 clients et que l'on dispose d'un ordinateur capable de réaliser un million d'opérations par seconde, le temps requis pour parvenir à la solution optimale serait de huit millénaires494 ! Dans le cas où l'on voudrait solutionner tous les problèmes p-médian (p variant de 1 à p activités à placer) si on ne connaît que le nombre maximum p d'activités à placer, le nombre de combinaisons à étudier serait alors de:

n n!

-

=2n -1

j = 1 p! (n

j)!

Il existe donc un grand nombre d'heuristiques pour trouver une solution acceptable au

problème p-Médian malgré le fait que toutes ces solutions ne convergent que vers des optima locaux et non vers une solution globale et qu'il ne soit pas possible a priori de connaître le niveau d'optimalité de cette solution. Dans les algorithmes de résolution fondamentaux, on trouve l'algorithme flou, l'algorithme de recherche de voisinage, une heuristique de

493 KARIV O et HAKIMI S.L. (1979) An Algorithmic Approach to Network Location Problems, Part 2: The p- median", SIAM Journal of Applied Mathematics 37, 539-560.

494 DASKIN M.S. (1995) Network and Discrete Location - Models, Algorithms and Applications, John Wiley and Sons, Inc., New York.

substitution495 et ses variantes496, cette dernière catégorie étant l'une des plus robustes selon

Densham et Rushton497.

2.2.1.2 Les algorithmes de résolution du p-MP

Mais d'une façon générale, les heuristiques se rangent en deux classes498: les algorithmes de construction qui permettent de rechercher des localisations avec un degré d'optimalité faible

et les algorithmes d'amélioration destinés comme leur nom l'indique, à améliorer les résultats fournis par les algorithmes de construction. Alors que l'algorithme flou est du type construction, l'heuristique de substitution et l'algorithme de recherche de voisinage ont une approche d'amélioration. Pour clarifier la signification de ces termes, nous passerons en revue

le principe de mise en oeuvre de ces heuristiques.

Localisation d'une activité unique dans la problématique du p-MP : le 1-médian

Examinons tout d'abord la recherche de solutions dans le cas le plus simple, la localisation d'une activité unique ou problème 1-médian. Dans le cas où, plus de la moitié de la demande

ai est localisée en un point, une des solutions optimales consiste à placer l'activité en ce

i

noeud. Et si ce noeud concentre plus de la moitié de la demande, cette localisation est alors la

localisation optimale unique499.

495 TEITZ M.B. et BART P. (1968) Heuristic Methods for Estimating the Generalized Vertex Median of a

Weighted Graph, Operations Research 16, 955-961.

496 GOODSCHILD M.F. et NORONHA V. (1983), Location-Allocation for Small Computers, University of

Iowa, Monograph N°8.

497 DENSHAM P.J. et RUSHTON G. (1992) A More Efficient Heuristic for Solving Large p-median Problems,

Papers in Regional Science: The Journal of the RSAI 71/3, 307-329.

498 GOLDEN B, BODIN L., DOYLE T. et STEWART Jr. (1980) Approximate Travelling Salesman Algorithms,

Operations Research, 28, 694-711.

499 DASKIN M.S. (1995) Network and Discrete Location - Models, Algorithms and Applications, John Wiley and Sons, Inc., New York.

La résolution du cas le plus général a été donnée par Goldman500. Elle consiste à choisir aléatoirement un noeud d'extrémité de branche sur le réseau et si au moins la moitié de la demande n'est pas fixée en ce noeud à le supprimer (ainsi que le lien) et à reporter sa demande

sur le noeud suivant. Si l'un des noeuds du réseau concentre plus de la moitié de la demande, alors l'activité est à localiser en ce point et on peut calculer la distance totale pondérée par la demande.

Un exemple concret plus explicite selon Daskin501 est donné par le réseau suivant qui compte

une demande totale de 48 (la demande au point x est représenté par hx) :

Fig. 2.7 - Méthode de résolution du 1-médian : étape 1

Aucun des noeuds ne compte plus de la moitié de la demande. Si l'on considère donc le point

A dont la demande égale à 10 est inférieure à 48/2 = 24, on reporte cette demande sur le point

B en supprimant le point A, demande qui atteint alors 5 + 10 = 15:

500 GOLDMAN 1J (1971) Optimal Center Location in Simple Networks; Transportation Science 5, 212-221.

501 DASKIN M.S. (1995) Network and Discrete Location - Models, Algorithms and Applications, John Wiley and Sons, Inc., New York.

Fig. 2.8 - Méthode de résolution du 1-médian : étape 2

La demande en B égale à 15 est toujours inférieure à 24 (comme celle de tous les autres points). Supprimons alors le point D où la demande, 12, est la plus faible en la reportant sur le point adjacent C:

Fig. 2.9 - Méthode de résolution du 1-médian : étape 3

Comme les demandes de B, C et D sont toujours inférieures à 24, supprimons E et reportons

sa demande sur C. On s'aperçoit alors que la demande de C égale à 33 est supérieure à la

demande totale divisée par deux (24), ce qui signifie que C est le point optimal sur lequel doit être placée l'activité:

Fig. 2.10 - Méthode de résolution du 1-médian : étape 4

L'algorithme flou

L'algorithme flou consiste tout simplement à localiser les activités sur le réseau une par une, puis à utiliser une procédure de voisinage ou de substitution pour optimiser les localisations. Dans un premier temps, on choisit donc le meilleur emplacement pour la première activité ce

qui est facile si on calcule la fonction objectif pour chaque noeud envisagé en retenant le noeud pour lequel cette fonction objectif est la plus faible. Ensuite, on localise un deuxième point envisageant chaque noeud (sauf celui déjà occupé) et en assignant à la localisation précédente,

les noeuds qui lui sont les plus proches comparés au noeud examiné. La fonction objectif est calculée de la même manière et on retient toujours comme second emplacement le noeud pour lequel cette fonction possède la valeur minimale. Ce processus est réitéré autant de fois qu'il y

a d'activités à localiser.

Ainsi, l'organigramme de cette procédure se résume à:

Localiser la première

activité en utilisant

l'énumération totale

Avons-nous p

activités ?

Non

Localiser l'activité suivante en utilisant l'énumération totale et en fixant les autres localisations

Oui

Algorithme

d'amélioration par substitution ou de voisinage

Fin

Fig. 2.11 - Organigramme de l'algorithme flou

Résolution par les multiplicateurs de Lagrange502

Une méthode de résolution appartenant aux algorithmes de construction, plus classique mais moins performante, est représentée par les contraintes du p-médian relaxées à l'aide des multiplicateurs de Lagrange. Elle permet de transformer un problème contraint en un problème sans contraintes503. Nous la mentionnons pour mémoire. Appliquée à la relation (2)

de la formulation générale du problème du p-médian, une relaxation par les multiplicateurs de

Lagrange devient:

502 DE LAGRANGE Louis, mathématicien français né en 1736, mort en 1813.

503 DASKIN M.S. (1995) Network and Discrete Location - Models, Algorithms and Applications, John Wiley and Sons, Inc., New York.

Minimiser

i j

ai dij xij +

i

i [1 -

j

xij ] (1)

=

i j

( ai dij + i ) xij + i

i

avec

i

xij = 1, i, (2)

xij yj, i, j, (3)

yj = p, (4)

j

xij, yj {0,1}, i, j (5)

Les coefficients i considérés comme fixes sont appelés multiplicateurs de Lagrange et la nouvelle fonction objectif à minimiser devient (1). En appliquant une relation identique à la relation (3) de la formulation générale du p-médian, on démontre que les multiplicateurs de Lagrange peuvent être calculés à partir d'une formule récurrente, avec des multiplicateurs

initialisés à une valeur quelconque:

n

in+1 = max { 0, in - tn (Xij

- Yjn)}

n

avec t n =

(UB -

Ln)

( X

j

n

ij

i j

- Y n )2

tn : le pas de la procédure de Lagrange à la nième itération,

n : une constante généralement prise égale à 2,

UB : (upper bound) la plus petite limite supérieure de la fonction objectif,

Ln : la fonction objectif de Lagrange (1) ci-dessus,

Yjn : la valeur optimale de la variable de localisation Yj à la nième itération.

La méthode de résolution du p-médian par les multiplicateurs de Lagrange a été récemment utilisée dans des travaux de recherche en informatique pour déterminer sur quels serveurs en réseau il était préférable d'implanter les informations pour obtenir des traitements de calcul plus rapides au niveau de l'ensemble504. Le même algorithme a été utilisé dans le même esprit

pour améliorer la configuration des réseaux de communication505.

Une méthode de résolution générale et (presque) exacte des problèmes de localisation développée par Homberg, Rönnqvist et Yuan fait appel à l'algorithme par les multiplicateurs

de Lagrange en parallèle d'une procédure par séparation et évaluation (Branch and Bound en anglais) dans le cas où chaque noeud de demande est assigné à une activité et une seule506. La procédure par séparation et évaluation est une méthode d'énumération implicite qui repose sur

le principe de diviser les solutions en paquets. Plus précisément, on divise l'ensemble des solutions possibles d'un problème de localisation-allocation (ou plus généralement d'optimisation combinatoire) en sous-ensembles de plus en plus petits afin d'isoler dans l'un

de ces sous-ensembles une solution optimale. Le parcours est représentable par un arbre avec comme racine le problème de départ et toutes les combinaisons possibles, les branches représentant les sous-problèmes correspondant à des sous-ensembles de toutes les combinaisons admissibles. L'exploration de l'arbre se fait vers des niveaux d'optimalité des solutions obtenues croissantes et la partition des ensembles de solutions (destinée à créer des branches) est produite en allouant un ou plusieurs clients d'une activité à une autre si l'on considère la solution explorée en cours. Cette réallocation des clients se fait généralement par

un processus aléatoire. La recherche de Homberg, Rönnqvist et Yuan montre que l'utilisation

individuelle de la procédure par séparation et évaluation (grâce à l'algorithme commercial

504 CHURCH R.L. et SORENSEN P.A. (1995) A Comparison of Strategies for Data Storage Reduction in

Location-Allocation Problems, National Center for Geographic Information and Analysis, Technical Report

95-4, University of Santa Barbara, California.

505 GUPTA R. (1996) Problems in Communication Network Design and Location Planning; New Solution

Procedures, PhD, Graduate School of the Ohio State University.

506 HOLMBERG K., RÖNNQVIST M. et YUAN D. (1999) An Exact Algorithm for the Capacitated Facility

Location Problems with Single Sourcing, European Journal of Operational research 113, 544-559.

CPLEX) met jusqu'à 5 heures pour résoudre un problème de 30 activités à localiser en prenant

en compte la position de 300 clients alors que la méthode associant cet algorithme avec les multiplicateurs de Lagrange ne met qu'une heure pour obtenir des solutions généralement meilleures. On le voit, les meilleurs algorithmes de résolution même s'ils tournent sur des ordinateurs puissants (un ordinateur Sun Sparc 20/HS151 pour cette recherche) n'arrivent à résoudre dans un temps raisonnable que des problèmes de localisation-allocation de quelques centaines de noeuds. Dans certains cas (1 cas sur 71 cas étudiés), l'algorithme de Homberg, Rönnqvist et Yuan ne réussit cependant pas à trouver une solution optimale et donc cet algorithme ne peut être qualifié de méthode de résolution exacte.

Résolution par la méthode des algorithmes génétiques

Les algorithmes génétiques se fondent sur la théorie générale de l'évolution de Darwin selon laquelle les espèces vivantes progressent en organisation et en complexité par la simple sélection naturelle de leurs caractères génétiques les plus performants lors des phases de reproduction. Ainsi, ce principe qui optimiserait la configuration génétique des systèmes vivants face à un environnement hostile serait tout aussi bien capable de traiter des problèmes d'optimisation beaucoup plus généraux tels que la résolution des problèmes d'optimisation ou des modèles de localisation-allocation. Les premières applications à ces cas datent des années

70 507 508. De manière analogue pour ces modèles, un individu ou une solution se caractérise

par son empreinte génétique ou sa structure de données. Les opérations génétiques de croisement et de mutation modifient les données ou chromosomes de chaque individu ce qui permet en théorie de parcourir tout l'éventail des solutions possibles. L'algorithme génétique

va donc à chaque nouvelle génération créer de nouvelles solutions mais aussi en détruire ainsi

507 HOLLAND J.H. (1975) Adaptation in natural and artificial systems, Ann Arbor: University of Michigan

Press.

508 GOLDBERG D.E. et LINGLE R. Jr. (1985) Alleles, loci and the travelling salesman problem, Proceedings of

an International Conference on Genetic Algorithms, J.J. Grefenstette (Ed.), LEA Pub, p 154-159.

que le décrit la théorie de la sélection naturelle509. La performance de l'individu ou l'optimalité de la solution se mesure par le niveau de sa fonction objectif. Dans un premier temps, l'algorithme génétique va générer des solutions de manière aléatoire, puis il va les laisser évoluer jusqu'à obtenir les meilleures solutions possibles.

Pour utiliser avec succès un algorithme génétique, il est nécessaire :

- de réussir à coder les solutions en des ensembles de chromosomes,

- de partir d'une population ou de solutions de base,

- de disposer d'une fonction objectif qui va mesurer le niveau d'optimalité de chaque solution,

- de décider comment sélectionner les chromosomes les plus performants,

- de décrire les opérateurs génétiques ou le mode d'échange des données,

- de spécifier les paramètres de l'algorithme tels que taille de la population initiale, probabilités de croisement et de mutation,

- de donner un critère d'arrêt de l'algorithme.

Le codage d'un modèle p-médian est une succession binaire de 0 et de 1 correspondant à l'absence ou à la présence d'un point de vente dans la liste des noeuds du réseau. Les caractéristiques des solutions de départ et leur nombre (population de départ) peuvent être tirées au hasard ou bien déterminées par une autre heuristique du modèle p-médian. Dans ce dernier cas, l'algorithme génétique constituera une procédure d'amélioration de la solution.

La fonction objectif du p-médian nous conduisait à minimiser la quantité :

ai dij xij

i j

L'évaluation la plus simple de la force de l'individu ou optimalité de la solution consiste à

prendre l'inverse de la fonction objectif que l'on cherchera à maximiser :

509 HOLLAND J.H. (1992) Les algorithmes génétiques, revue Pour la Science, No 179, Sept. 1992, p. 44-51.

1 / ai dij xij

i j

La sélection ou reproduction va déterminer à partir de quels individus on va construire la

génération suivante. On utilise assez souvent la roue de Goldberg510 qui consiste à tirer les solutions sur une roue de loterie sur laquelle les individus sont représentés sur une surface proportionnelle à leur force ou optimalité. De cette façon, les individus les plus forts auront à l'étape ultérieure de croisement et de mutation, une représentativité plus forte avec un nombre

de copies plus importantes au sein de la population. Le croisement consiste alors à échanger des paquets de données (des suites de 0 et de 1 découpées dans la solution) entre des paires d'individus. La mutation consiste, elle, à basculer dans notre cas un 0 en 1 ou réciproquement

un 1 en 0 en de très rares occasions selon une probabilité de mutation fixée à l'avance. Cette procédure permettrait d'explorer tous les recoins de l'espace des solutions en évitant d'emprisonner la recherche dans un maximum local (ou un minimum pour la fonction objectif). En pratique, les chromosomes sont tirés de façon aléatoire et sont remplacés par un chromosome d'une autre valeur toujours prise aléatoirement. Enfin, le nombre maximal de générations correspond au nombre d'itérations que l'on se fixe pour stopper la procédure.

Tous les paramètres de l'algorithme génétique sont généralement fixés empiriquement. Une population de 20 à 1000 individus qui en général reste stable au fur et à mesure des générations, satisfait généralement la résolution de tous les problèmes. Une taille de population trop faible ne permettra pas d'explorer tous les champs de solutions possibles alors qu'une taille très élevée engendrera un nombre d'opérations importantes qui pourra nuire à la rapidité d'exécution. Les valeurs de moyennes des probabilités de croisement oscillent entre

0,65 et 0,9 : une probabilité élevée favorisera l'examen d'un grand nombre de solutions, mais

une probabilité de croisement excessive risque d'emprisonner la recherche dans des maxima

510 GOLDBERG D.E. (1991) Genetic Algorithms, Addison-Wesley, New York.

locaux. Une certaine probabilité de mutation511 est au contraire nécessaire pour réussir de temps en temps à générer des individus hors-normes qui sont susceptibles de constituer des super-solutions au problème. Ces solutions bien meilleures ne sauraient dans certains cas être générées par des simples transformations de croisement. Il reste que la probabilité de mutation doit rester faible, de 0,001 à 0,2 voire 0,1 à 10 pour ne pas entraver le processus normal de reproduction et d'empêcher l'algorithme de converger vers un optimum512. Outre ces paramètres fixés empiriquement, il n'existe pas à l'heure actuelle de critère de convergence efficace pour stopper le processus dès qu'une solution intéressante est atteinte. Il est donc indispensable de déterminer au départ le nombre de générations ou d'itérations au bout duquel

on arrête l'algorithme513.

Les algorithmes génétiques sont, d'une façon générale, particulièrement recommandés pour

les problèmes pour lesquels n'existe aucune autre méthode de résolution ou bien pour lesquels

les méthodes de résolution existantes n'offrent que des solutions approchées comme les modèles de localisation-allocation514.

Les algorithmes d'amélioration

Dans un second temps, on utilise l'algorithme d'amélioration de voisinage515 ou celui de substitution516.

511 GOLDBERG D.E. (1994) Algorithmes Génétique, Exploration, Optimisation et Apprentissage Automatique, Editions Addison-Wesley, 1994.

512 AURIFEILLE J.M. (2001) Les algorithmes génétiques, Conférence invitée à l'IREIMAR, Institut de

Recherche Européen sur les Institutions et les Marchés, CNRS, Mars 2001.

513 AURIFEILLE J.M. (2001) Conjoint fuzzy vs non-fuzzy clustering : some empirical evidence using a genetic algorithm optimization, Actes du 7ème congrès international SIGEF, sept. 2001.

514 ROBERT-DEMONTROND P., THIEL D. (2002) Algorithmes génétiques et stratégies spatiales des firmes de

distribution, in Stratégies de Localisation des Entreprises Commerciales et Industrielles : De Nouvelles

Perspectives, G. Cliquet et J-M. Josselin éd., De Boeck Université, Bruxelles.

515 MARANZANA F.E (1964) On the Location of Supply Points to Minimize Transport Costs, Operational

Research Quarterly, 15, 261-270.

516 TEITZ M.B. et BART P. (1968) Heuristic Methods for Estimating Generalized Vertex Median of a Weighted

Graph, Operations Research, 16, 955-961.

· L'algorithme de recherche de voisinage

Dans l'algorithme de voisinage, on considère le voisinage de chaque localisation d'activité, c'est-à-dire l'ensemble des noeuds qui lui sont le plus proche et on calcule dans ce voisinage une localisation améliorée par l'algorithme du 1-médian vu précédemment. L'algorithme de voisinage peut être utilisé comme algorithme de construction si l'on démarre la recherche de localisation avec une configuration aléatoirement choisie.

· L'heuristique de substitution

On procède à l'heuristique de substitution en supprimant tout à tour chacune des p activités déterminées dans la procédure initiale de localisation, ensuite en recherchant le meilleur autre emplacement pour cette activité supprimée par une simple énumération et en calculant la fonction objectif correspondante. La recherche d'une valeur plus faible de la fonction objectif parmi celles calculées en recherchant une nouvelle localisation pour chaque activité déjà déterminée donnera éventuellement une configuration améliorée par rapport à celle obtenue à l'étape précédente.

Les variantes des algorithmes d'amélioration

La variante très proche de l'algorithme précédent, donnée par Goodschild et Noronha517, revient à identifier le noeud d'activité et le noeud libre dont la substitution offre la fonction objectif la plus basse. Si la fonction objectif a tendance à diminuer par rapport à la solution trouvée initialement, alors ce nouvel emplacement peut être considéré comme un optimum local.

Une autre variante des algorithmes d'amélioration consiste à travailler au niveau global, puis

régional518. Considérons l'ensemble des noeuds occupés par une activité S et celui des noeuds

517 GOODSCHILD M.F. et NORONHA V. (1983), Location-Allocation for Small Computers, University of

Iowa, Monograph N°8.

518 DENSHAM P.J. et RUSHTON G. (1992) A More Efficient Heuristic for Solving Large p-median Problems,

Papers in Regional Science: The Journal of the RSAI 71/3, 307-329.

non occupés (V-S) avec V l'ensemble de tous les noeuds. Si un nouveau noeud est mis dans l'ensemble S, on appelle cette procédure ADD alors que si on retire un noeud de l'ensemble S, cette procédure est nommée DROP. Dans la première phase globale, on réalisera une séquence de DROP et d'ADD jusqu'à ce que l'on ne trouve plus d'amélioration à la fonction objectif. Dans la phase locale, on décomposera le réseau en p problèmes 1-médian que l'on résoudra par l'algorithme de voisinage explicité précédemment.

Enfin, la procédure "Tabu" (mot anglais signifiant tabou) mise au point par Rolland, Schilling

et Current519 utilise un temps dit tabou, mesuré en nombre d'itérations, durant lequel il est interdit de pratiquer une procédure DROP sur un noeud incorporé à l'ensemble S par une procédure ADD (le compteur d'itérations est initialisé dès que ce noeud est placé dans l'ensemble S). Cette durée "taboue" fixe, aléatoire ou dynamique durant le fonctionnement de l'algorithme doit être écoulée pour avoir le droit à nouveau de supprimer le noeud de l'ensemble S. Ce programme d'amélioration semble enregistrer de meilleurs résultats que les heuristiques déjà citées. Les auteurs ne s'attachent cependant à démontrer l'efficacité de l'algorithme par rapport aux autres méthodes qu'en se fondant sur un cas particulier.

En tous les cas, l'algorithme flou correspond assez bien à la logique d'implantation des chaînes de magasins : celui-ci cherche en effet dans la procédure à localiser les points de vente les uns après les autres de la même manière qu'un manager voudra la plupart du temps

en pratique les ouvrir graduellement avec une mise en puissance progressive et non d'une manière simultanée. De plus, dans un deuxième temps, l'algorithme d'amélioration s'identifie

en quelque sorte à la phase de réorganisation des points de vente déjà créés qui est marquée

par exemple soit par la suppression d'un point de vente non rentable (que se passe-t-il si je

519 ROLLAND E., SCHILLING D.A. et CURRENT J.R. (1996) An Efficient Tabu Procedure for the p-Median

Problem, European Journal of Operational Research, 329-342.

supprime un magasin ? algorithme de substitution), soit par la redistribution au niveau local des localisations ( algorithme de voisinage) .

2.2.2 Le modèle Multiloc

Supposons que l'on veuille placer r points de vente parmi un éventail de n emplacements possibles. Le modèle Multiloc520 est en fait une extension du modèle MCI qui, d'une manière générale, considère q attributs d'attractivité de ces magasins Aijk, attributs susceptibles de prendre ík valeurs: par exemple, on a pour k=1 un attribut Aij1 qui peut être la distance (í1 =1); pour k=2, Aij2 peut signifier la taille du magasin qui peut être petite, moyenne ou grande (í2

=3 et valeurs discrètes),...

Si l'on considère le nombre de combinaisons des attributs d'attractivité, le nombre de

"designs" ou de configurations possibles que peuvent prendre les magasins est : L = í1 í2 ...íq

La fonction objectif qui doit maximiser le profit est la suivante:

m n n L

Max Z = C j Ei Pij - Fjl X jl

i =1

j =1

j =1 l =1

avec

Z : le profit

Ei: Le chiffre d'affaires total par groupe i sur le marché

Fjl: les coûts fixes d'un magasin du plan l au site j

Cj: un coefficient multiplicateur

Xjl = 1 si un magasin avec le design l est implanté sur le noeud j et égale à 0 sinon

j: la localisation considérée qui varie de 1 à n l: le design considéré qui varie de 1 à L

on a aussi les conditions suivantes sur le nombre r de points de vente à localiser :

520 ACHABAL D.D., GORR W.L. et MAHAJAN V. (1982) Multiloc: A Multiple Store Location Decision

Model, Journal of Retailing, 5-24.

n L

X jl = r

j = 1l = 1

L

et X jl 1 j=1,...,n

l =1

La probabilité qu'un consommateur au point i fréquente un magasin particulier au point j est

alors:

Pij

L q n

( Akl X jl) /

L q

( Akl X jl)

n + s

q

( Akl )

=

ijkl

ijkl

+

ijkl

l =1 k =1

j =1l =1 k =1

j = n + l

k =1

Comme pour le modèle p-médian ou pour le modèle MCI, il n'est pas possible de résoudre le

modèle Multiloc par la complète énumération des combinaisons d'emplacements possibles.

En effet, si l'on doit placer r points de vente au niveau de n emplacements possibles avec L

configurations de magasin possibles, le nombre de solutions à examiner est:

W Lr n!

= r! (n

- r)!

De la même manière que pour les modèles p-médian ou MCI précités ou n'importe quel

problème d'analyse combinatoire de ce type, l'une des méthodes les plus réputées pour résoudre le modèle Multiloc est sans conteste encore l'algorithme de substitution de Teitz et Bart 521 mis en pratique dans la localisation d'agences bancaires 522.

Une alternative consiste à employer l'échantillonnage aléatoire développé par McRoberts523.

Le nombre de solutions h tirées d'une manière aléatoire à examiner pour qu'il y ait une

521 TEITZ M.B. et BART P. (1968) Heuristic Methods for Estimating the Generalized Vertex Median of a

Weighted Graph, Operations Research 16, 955-961.

522 CORNUEJOLS G., MARSHALL L.F. et NEMHAUSER G.L. (1977) Location of Bank Accounts to

Optimize Float: An Analytic Study of Exact and Approximate Algorithms, Management Science, 23 (1pril),

789-810.

523 Mc ROBERTS K.L. (1971) A Search Model for Evaluating Combinatorially Explosive Problems, Operations

Research, 19, 1331-1349.

probabilité y qu'au moins l'une des p meilleures configurations possibles soit dans cet

échantillon est de:

1

h = W 1- (1- y) pW

Ainsi, si l'on veut avoir 99 % de chance de trouver 1 % des meilleures configurations

d'emplacements et de designs possibles dans un échantillon aléatoire, il faudra un ensemble de

460 combinaisons tirées au hasard. Si l'on a 7 magasins (r = 7) de 3 designs possibles (L = 3)

à localiser sur 35 localisations potentielles (n = 35), il y a 14,7 milliards d'alternatives. La méthode de l'échantillonnage aléatoire revient donc si l'on se satisfait de la probabilité d'avoir

99 % de chance de tomber sur les 1 % des configurations les plus optimales, à tirer 460 combinaisons parmi les 105 configurations possibles d'emplacement et de design (7 emplacements x 3 designs possibles), puis à sélectionner le meilleur emplacement et le meilleur design possibles en calculant la fonction objectif qui doit être la plus importante possible524.

2.2.3 La méthode d'analyse de portefeuille

La méthode d'analyse des portefeuilles issue du monde de la finance525 puis popularisée par

les consultants de cabinets tels que le Boston Consulting Group (BCG), Mc Kinsey ou Arthur

D. Little526 a été adaptée pour cibler les localisations les plus intéressantes ou comparer plusieurs localisations entre elles527. En variations verticales, on trouve l'attrait du secteur (atractiveness en anglais) alors qu'en horizontal, on a la force concurrentielle du réseau de points de vente (competitive strenght).

524 ACHABAL D.D., GORR W.L. et MAHAJAN V. (1982) Multiloc: A Multiple Store Location Decision

Model, Journal of Retailing, 5-24.

525 MARKOWITZ H. (1952) Portfolio Selection, Journal of Finance, Vol. 7, mars, p.77-91.

526 KOENIG G. (1990) Management Stratégique : Visions, Manoeuvres et Tactiques, Nathan.

527 MAHAJAN V., SHARMA S. et SRINIVAS D. (1985) An Application of Portfolio Analysis for Identifying

Attractive Retail Locations, Journal of Retailing, vol. 61, n°4, hiver 1985, 19-34.

L'attrait du secteur, en l'occurrence le plus souvent de la zone de chalandise, est quantifiable

en prenant une combinaison de paramètres comme 528 529:

- la taille de la zone de chalandise ;

- son taux de croissance ;

- le taux de profit ;

- l'intensité de la concurrrence au sein de la zone de chalandise. Et la force concurrentielle est, elle, une combinaison de :

- la part de marché ;

- la qualité des points de vente (équivalents aux produits) ;

- la réputation des enseignes ;

- l'efficacité promotionnelle.

L'exemple ci-dessous montre l'utilisation de la matrice des portefeuilles par le groupe Lévi Strauss, fabricant de Jeans, pour renforcer sa présence dans les pays de distribution où il est le moins bien implanté.

Fig. 2.12 : La matrice de Portefeuille appliquée à l'Europe par le groupe Lévis Strauss530

Il n'y a eu cependant aucune étude qui est venue confirmer la validité et l'efficacité de la méthode d'analyse de portefeuille531. Certaines études sur les prises de décision ont montré au

528 THIETARD Raymond-Alain (1988) La Stratégie d'Entreprise, Mc Graw-Hill.

529 CLIQUET G. (1992) Le Management Stratégique des Points de Vente, Ed. Sirey., p.193

530 University of Newcastle upon Tyne, Agricultural Economics & Food Marketing Department (2001) Student

Ressources, http://www.ncl.ac.uk/aefm/student_resources/aef334/LeviStrauss.pdf

contraire que l'utilisation de cette méthode aboutissait dans 64 % des cas à la sélection d'un investissement non-rentable et dans 87 % des cas à l'un des investissements les moins rentables.

2.2.4 Les autres modèles de localisation-allocation

Il existe de nombreux autres modèles dont la fonction objectif est dérivée de celle du p- médian. Citons les modèles p-centrés et le modèle de couverture maximale. Alors que le p- médian imposait de minimiser la somme des distances entre chaque client et son point de vente assigné, le modèle p-centré cherche la configuration pour laquelle la distance entre chaque point de vente et le plus éloigné de ses clients soit minimale. Ce modèle est particulièrement indiqué pour placer des services d'urgence, des hôpitaux ou des casernes de

pompiers étant donné une population. Le modèle de couverture maximale532 vise à assurer

que la majorité des clients sont à une distance maximale au moins d'un service donné : si cette condition est bien vérifiée, on dit alors que l'ensemble des clients est couvert : les modèles de couverture sont tout indiqués pour placer des services généraux du type poste, trésorerie, services de mairie et administrations d'une manière générale. Les algorithmes de résolutions

de ces autres modèles de localisation-allocation se calquent sur ceux du p-médian.

2.3 Limitations du modèle p-médian et de ses méthodes actuelles de résolution

2.3.1 Le modèle p-médian : une réalité simplifiée

Le modèle p-médian est uniquement axé, comme nous l'avons précisé, sur les notions de distance et de demande dans le cas du modèle p-médian pondéré. Mais, même si le propos n'est pas fondamentalement de critiquer le modèle lui-même, il est évident que le

531 ARMSTRONG J.S. et BRODIE R.J. (1994) Effects of Portfolio Planning Methods on Decision Making : Experimental Results, International Research Journal in Marketing 11, North-Holland, 73-84.

532 KOLEN A. et TAMIR A. (1990) Covering Problems, Discrete Location Theory de Mirchandani & Francis

Chap. 6, Wiley & Sons.

consommateur ne se fondera pas seulement sur le seul critère de distance pour choisir son point de vente parmi un éventail de concurrents. Les autres paramètres jouant sur la décision des clients peuvent être formulés sous forme de cinq principes qui guideront la sélection des emplacements commerciaux533 534:

- le principe d'interception: le point de vente a d'autant plus de chance de capter la clientèle

que le passage de consommateurs à proximité, mesuré le plus souvent en terme de trafic piétonnier ou routier, est important.

- le principe d'attraction cumulative: le regroupement de commerces dans un environnement géographique proche d'activités similaires crée souvent une synergie d'attractivité alors supérieure à la somme des attractivités individuelles des commerces.

- le principe de compatibilité: de même, le regroupement d'activités complémentaires permet assez souvent de parvenir à ce même effet synergique des attractivités.

- le principe de suréquipement: une trop grande concentration de points de vente a tendance à avoir un effet répulsif sur la clientèle alors soumis à l'inconfort de la congestion du trafic.

- le principe d'accessibilité: l'accessibilité au point de vente, c'est-à-dire la facilité d'entrer, de pénétrer, de traverser et de sortir du site commercial doit être le plus facile possible. Une bonne signalisation, la qualité et le nombre de voies d'accès, les facilités de parking sont autant de paramètres à privilégier dans le choix d'un emplacement convenable.

Une solution que nous proposons pour intégrer tous ces critères seraient d'introduire dans le

problème p-médian un poids évaluant chaque site potentiel. Rien n'empêche en effet de

mesurer et de quantifier pour chaque emplacement potentiel des points de vente les différents critères mentionnés tels que l'ont fait Lewison et Delozier535 et Jallais, Orsony et Fady 536.

533 DELOZIER M.W. et LEWISON D.M. (1986) Retailing, 2nd ed., Merill.

534 CLIQUET G. (1992) Le Management Stratégique des Points de Vente, p.187-191, Ed. Sirey.

535 DELOZIER M.W. et LEWISON D.M. (1986) Retailing, 2nd ed., Merill.

536 JALLAIS J., ORSONY J. et FADY A. (1994) Marketing du Commerce de Détail, Vuibert, Paris.

Puis il convient d'attribuer une note globale à chaque site potentiel, note résultant d'une pondération de ces critères. A titre d'exemple, il suffirait d'attribuer des notes par exemple de

0 (emplacement vraiment médiocre) à 100 (emplacement excellent) pour chaque critère, de

les pondérer avec des coefficients positifs de manière à quantifier leur importance et d'obtenir une note globale nj. Cette note introduite dans la fonction objectif avec un signe négatif (ayant tendance à minimiser avantageusement la fonction) au même niveau que les distances dij servirait de pondération à chaque site potentiel d'activité. La distance dij en tant que critère impliquant à la fois le commerce et le client considéré devrait alors être normalisée (sur la même échelle de notes) de manière à obtenir une homogénéité au sein de la fonction objectif.

La formulation mathématique du p-médian deviendrait alors:

Minimiser

i j

ai (dij - nj) xij représente la nouvelle fonction objectif, (1)

avec

i

xij = 1, i, assure que tous les clients sont assignés à une activité et une seule, (2)

et dij - nj 0, j assure que toute activité possède un minimum d'attractivité, (2)'

xij yj, i, j empêche d'assigner un client à une activité si elle n'est pas ouverte, (3)

yj = p, le nombre total d'activités est p, (4)

j

xij, yj {0,1}, i, j nature binaire des variables xij, yj (5)

ai : est la demande au noeud i,

nj: la note positive attribuée au site potentiel du noeud j, di,j : la distance du noeud i au noeud j,

p : le nombre d'activités à localiser,

xi,j = 1, si le noeud i est assigné à l'activité j et 0 autrement,

yj = 1, si l'activité j est ouverte et 0 autrement.

On observe que logiquement dans la fonction objectif, plus l'activité au noeud j est attractive

(note nij importante), meilleure est la fonction objectif (valeur plus faible) et que l'attractivité

est un réducteur de distance, la valeur (dij - nj) pouvant être qualifiée de "distance psychologique" qui est la distance ressentie effectivement par les consommateurs et non plus seulement la distance routière ou temporelle537 538. Un autre avantage de cette nouvelle formulation que l'on pourrait qualifier de "modèle p-médian généralisé" est qu'elle est soluble

par les méthodes traditionnelles de résolution du p-médian puisque la forme de la fonction objectif est similaire (forme linéaire).

2.3.2 La complexité des méthodes de résolution du p-médian

L'autre reproche déjà évoqué au niveau du modèle p-MP concerne cette fois ses méthodes existantes de résolution. Celles-ci sont très lourdes et même souvent impossibles à mettre en oeuvre si l'on considère un réseau de plusieurs centaines de milliers de noeuds. Quelle tâche herculéenne que d'imaginer vouloir trouver une solution plus ou moins optimale à un réseau comprenant l'ensemble des clients potentiels d'une future grande surface ! Un autre problème

du même ordre, mais cette fois dans le domaine de la gestion informatique serait de considérer le réseau de communication Internet et les différents micro-ordinateurs, serveurs et réseaux Intranet le composant (soit des millions d'ordinateurs à travers le monde): sur quels serveurs (les noeuds d'activités) serait-il préférable de localiser les données pour que celles-ci soient acheminées le plus rapidement possible à destination des autres ordinateurs (les clients)

connaissant les probabilités de requête (les demandes ) ?

537 HUBBARD R. (1978) A Review of Selected Factors Conditioning Consumer Travel Behavior, Journal of

Consumer Research, vol. 5, june, p.1-21.

538 VOLLE P. (1999) Du Marketing des Points de Vente à Celui des Sites Marchands : Spécificités, Opportunités

et Questions de Recherche, Cahier n°276, Centre de Recherche DMSP, juin 1999.

Le problème classique du p-médian a pourtant fait couler beaucoup d'encre, en témoigne le

nombre d'articles où ce modèle est cité (en excluant les auto-citations):

Fig. 2.13 - Nombres d'articles traitant du p-médian par année - source: The Scientific Literature Digital Library

Les 225 articles cités sur 30 ans ne s'attaquent cependant qu'à l'affinage de la résolution du p- médian à savoir essentiellement améliorer l'optimalité des solutions à travers de nouvelles heuristiques d'amélioration (et rarement des algorithmes de résolution). Les autres publications de recherche traitent principalement des applications du p-MP en adaptant le modèle à certains cas particuliers comme l'efficacité des moteurs de recherche539, le coloriage

de graphes à l'aide du p-MP et d'un algorithme génétique540 ou encore la localisation de simulateurs de conduite de char de l'armée américaine au plus près des casernes541.

2.3.3 L'analyse typologique : une approche pour simplifier la problématique du p-MP Peu d'articles abordent vraiment la partie fondamentale, mais ô combien stratégique de la formulation ou de la modélisation même du problème p-MP. Si elle est mieux établie, elle permettra de simplifier le problème et de parvenir à une solution plus rapidement ou à une

meilleure solution en utilisant un algorithme plus lent mais plus performant capable de traiter

539 CRASWELL N. et BAILEY P. (1999) Is it fair to evaluate Web systems using TREC ad hoc, Department of

Computer Science - CSIRO, The Australian National University Pub.

540 RIBEIRO FILHO G. et NOGUEIRA LORENA L.A. (2000) Improvements On Constructive Genetic

Approaches To Graph Coloring, Sao José Dos Campos, Spain.

541 MURTY K.G. et DJANG P.A. (2000) The US Army National Guard's Mobile Training Simulator Location and Routing Problem, US Army Training and Doctrine Analysis Command, Dept. of IOE, University of

Michigan.

les modèles intégrant un très grand nombre de noeuds. Cependant, il est à noter qu'un problème assez étudié et à la mode est celui de l'analyse typologique (cluster analysis en anglais). Déjà évoqué par Aristote, cette dernière consiste à partitionner un ensemble d'entités

en sous-ensembles bien séparés et homogènes selon un certain nombre de paramètres. Dans le domaine de l'identification de classes, on peut recenser dans la littérature deux approches qui

se sont développées, la première étant celle de la reconnaissance déterministe et de décision

par sélection de distance; la seconde est statistique car elle a pour base des probabilités acquises lors d'une phase d'apprentissage et une décision par sélection de pénalisations

encourues. En particulier, la classification séquentielle utilisée par de nombreux chercheurs

dans les procédures de reconnaissance de forme se rattache à cette dernière approche542 543 544

545 546 547 548. Il existe également des méthodes de segmentation fondées sur un algorithme génétique associé à un modèle de régression549.

Fig. 2.14 - Un exemple de 3 classes , et identifiées par les variables x1, x2, x3

542 DUDA R.O. et HART P.E. (1973) Pattern Classification and Scene Analysis Editions J. Wiley, New York, N.Y.

543 TOU J.T. et GONZALEZ R.C. (1974) Pattern Recognition Principles, Edition Addison-Wesley, Reading,

Mass.

544 FU K.S. (1968) Sequential Methods in Pattern Recognition and Machine Learning, Editions Academic Press, New York, N.Y.

545 PAVLIDIS T. (1977) Structural Pattern Recognition, Editions Springer-Verlag, New York, N.Y.

546 PATRICK E.A. (1972) Fundamentals of Pattern Recognition, Edition Prentice-Hall, Englewood Cliffs, N.J.

547 POSTAIRE J.G. (1987) De l'Image à la Décision, Editions Dunod-Informatique Bordas, Paris.

548 CHEN C.H. (1973) Statistical Pattern Recognition, Editions Spartan Books, Rochelle Park, N.J.

549 AURIFEILLE J.M. (2000) A Bio-mimetic Approach to Marketing Segmentation : Principles and

Comparative Analysis, European Journal of Economic and Social Systems 14 N°1, p. 93-108.

Si l'analyse typologique intéresse principalement le domaine des mathématiques statistiques, elle recense également des applications dans le domaine de la localisation et du problème p- médian550 (voir son utilisation au § 2.4.2.4. dans la délimitation des zones de chalandise). Un exemple récent est représenté par la décomposition de la Suisse ou plutôt des 2863 principales communes suisses en 23 cellules associées chacune à un centre urbain551 selon diverses

méthodes comparées: p-médian, méthode Alt552, algorithme de décomposition553. Le

problème est en premier lieu d'identifier les 23 centres urbains et d'y affecter ensuite des communes selon le critère du plus proche voisin en terme de distance à vol d'oiseau. Selon notre point de vue, cette analyse typologique géographique peut conduire en quelque sorte à une simplification du problème p-médian, dans le sens où, plutôt que prendre comme noeuds

du réseau l'ensemble des 2863 communes au sein desquelles on rechercherait une ou plusieurs localisations optimales, on pourrait plus aisément considérer les 23 centres urbains comme étant les noeuds d'un réseau p-médian simplifié: l'étape d'analyse typologique constituerait une étape amont destinée à constituer ce réseau p-médian simplifié (avec comme noeuds les 23 centres urbains) préalablement à sa résolution.

Mais, cette manière de simplifier le problème p-médian comporterait de nombreuses limitations dont celle en premier lieu de devoir spécifier à l'avance en combien de classes (et donc de noeuds du futur réseau p-médian simplifié) il conviendrait de partitionner l'ensemble des entités de départ: ainsi, dans le problème précédent, il a été fixé d'entrée de jeu de partitionner le territoire suisse en un nombre de 23 cellules associées à 23 centres urbains sans

que ce nombre ait été ultérieurement justifié.

550 ROGER P. (1983) Description du Comportement Spatial du Consommateur, Thèse de Doctorat, Lille.

551 TAILLARD E.D. (1996) Heuristic Methods for Large Centroid Clustering Problems, Technical Report Idsia

96-96, Idsia.

552 COOPER L.G. (1963) Location-Allocation Problems, Operations Research 11, 331-341.

553 TAILLARD E.D. (1996) Heuristic Methods for Large Centroid Clustering Problems, Technical Report Idsia

96-96.

Fig. 2.15- Partition des communes suisses en 23 cellules représentées chacune par un centre urbain 554

Les exemples personnels suivants illustrent le principe de l'analyse typologique utilisée dans

le cadre du p-médian et l'erreur dans la recherche d'une localisation optimale qui peut résulter d'un nombre prédéfini de partitions. D'abord, un cas où l'approche de l'analyse typologique fonctionne bien: considérons 76 villes de même taille réparties sur un territoire, chaque ville étant représentée par un cercle :

554 TAILLARD E.D. (1996) Heuristic Methods for Large Centroid Clustering Problems, Technical Report Idsia

96-96, Idsia.

Fig. 2.16 - Les 76 villes représentées chacune par un cercle

Si l'on décide de partitionner l'espace géographique en deux par la méthode des k-plus proches voisins (k=2) par exemple, on aura deux régions A et B avec leurs centres respectifs,

les noeuds a et b:

Fig. 2.17 - Partition des 76 villes en 2 ensembles

Prenons comme poids des noeuds a et b de ce réseau pondéré, l'importance de la population représentée respectivement par le nombre de villes des deux ensembles soit 39 villes et 37 villes. Alors la localisation optimale d'une activité unique selon le problème 1-médian sera choisie au noeud a car il a un coefficient de pondération plus important. Mais, si l'on choisit un nombre de partitions égal à 4, on obtient alors la répartition suivante avec chacun des noeuds reliés aux noeuds de ceux des autres ensembles les plus proches:

Fig. 2.18 - Partition des 76 villes en 4 ensembles

Le centre optimal est alors situé sur le noeud de l'ensemble A' qui correspond bien au noeud a

de l'ensemble A précédemment. Si on considère maintenant le contre-exemple suivant avec 3

partitionsde 17 villes, la droite verticale passant par O étant la droite médiane du segment ab:

Fig. 2.19 - Partition de 17 villes en 3 ensembles

Selon le modèle 1-médian, le centre optimal est situé au noeud b. En considérant une partition

en deux ensembles, le centre optimal est cette fois situé au noeud a puisque que sa partition a

une pondération plus élevée en nombre de villes (9 villes):

Fig. 2.20 - Partition des 17 villes en 2 ensembles

De plus, on peut se poser la question de savoir si certaines villes, ou paquets de villes, très éloignées valent ou non la peine d'être prises en compte dans l'étude de localisation: quel que soit leur potentiel de clientèle même faible, leur éloignement a tendance à attirer vers elles le (ou les) site(s) à implanter sans que cela ne vaille peut-être la peine. Dans l'exemple précédent, la partition constituée des quatre villes du noeud c est d'une importance moindre devant les deux autres partitions des noeuds a (7 villes) et b (6 villes). Si le problème était de livrer un produit ou un service à partir du noeud a à un ensemble de clients, faudrait-il intégrer

les clients associés au noeud c qui, compte tenu du faible potentiel et du coût de déplacement, engendrerait une faible rentabilité ? La réponse à cette question n'est pas fournie par l'analyse typologique et ses méthodes de partition qui traitent le problème d'une manière brute et mathématique.

Outre le fait de fournir des résultats rationnels, le développement de méthodes plus

performantes dans la recherche de localisations optimales doit conduire à notre sens, à

améliorer la capacité du p-médian à traiter des réseaux de plus en plus importants afin de modéliser de manière plus précise le monde réel et pouvoir prendre en compte par exemple l'ensemble des clients d'une grande surface, le réseau Internet et ses nombreux ordinateurs, la

totalité des entrepôts d'un transporteur,...

Conclusion

Ainsi, les théories de la localisation rassemblent un certain nombre de modèles dont certains comme le modèle de Christaller ou la loi de Hotelling, deviennent plutôt des curiosités intellectuelles en présentant la réalité sous un jour très idéal, mais permettent néanmoins de prendre conscience des phénomènes non-aléatoires de répartition des activités commerciales dans l'espace. D'autres modèles dérivant de la loi de Reilly comme les modèles MCI ou MNL

ont permis d'analyser les variations de fréquentation selon les caractéristiques de l'environnement ou du point de vente considéré. Leur mise en oeuvre pour répondre aux problématiques de localisation reste cependant ardue d'une part par le fait qu'il faille identifier précisément quels sont les paramètres fondamentaux jouant sur le choix des consommateurs

de tel ou tel magasin en se fondant sur l'expérience, et d'autre part, car il est nécessaire de rassembler les données relatives à ces paramètres avant de lancer l'analyse : rien ne prouve d'un autre côté que les paramètres identifiés dans une zone soient transposables dans celle où l'on recherche un ou plusieurs emplacements commerciaux. Les modèles de localisation multiple comme le modèle p-médian jouent essentiellement sur la notion de distance en choisissant les sites les plus proches d'une clientèle potentielle. D'autres variables comme le coût d'ouverture des points de vente, les coûts de déplacement ou même une mesure de

l'attractivité des points de vente avec le modèle Multiloc555, peuvent être pris en compte dans

ces modèles ce qui est susceptible de les rendre assez intéressants pour la recherche de localisations multiples optimales. Mais, les algorithmes approchés permettant de résoudre ces problèmes élaborés, trop lents, ne sont pas suffisamment performants pour être utilisés tels quels. Partant d'une base de données de clients potentiels, le processus initial de modélisation conduisant à un réseau de localisation-allocation s'avère souvent être une tâche difficile.

555 ACHABAL D.D., GORR W.L. et MAHAJAN V. (1982) Multiloc : A Multiple Store Location Decision

Model, Journal of Retailing, 58.

Alliés au modèle le plus adapté à la localisation multiple de points de vente c'est-à-dire le modèle p-médian, les principes du traitement du signal introduits dans le chapitre suivant réussiront à surmonter ces difficultés en facilitant considérablement à la fois la modélisation d'un réseau de localisation-allocation et la résolution de ce modèle. D'autres avantages

complémentaires apparaîtront à la lecture de l'exposé.

Chapitre 3

L'apport du traitement du signal dans le modèle p-médian

Introduction

Comme nous l'avons vu au chapitre précédent, la problématique de recherche de localisations optimales mérite d'être repensée à la fois sur le plan de la modélisation et au niveau de la résolution ultérieure du modèle. Pour cela, il nous est apparu comme pratiquement logique que les informations concernant la clientèle potentielle des futurs points de vente devaient être réagencées et si nécessaire "pré-digérées" au lieu de se lancer à corps perdu dans la construction d'un modèle trop complexe à résoudre. Ce pré-traitement peut être réalisé en faisant appel à une technique de traitement de l'information assez élaborée et dénommée dans

le jargon scientifique «traitement du signal». Le traitement du signal est un domaine d'importance si l'on s'en réfère aux 50 000 ingénieurs travaillant sur ce sujet directement à travers le monde et plusieurs centaines de milliers indirectement. Cette science bien qu'inconnue il y a cinquante ans, s'est discrètement introduite dans notre vie quotidienne à travers l'électronique, l'informatique ou les télécommunications. On pourrait qualifier le traitement du signal de technique capable de réaliser des opérations variées sur une information quantifiable dont la valeur est mesurable sur une certaine période. Ces opérations peuvent être une simple conversion (par exemple entre informations analogiques et digitales), une compression de l'information pour minimiser le nombre de données qui la caractérise, une correction d'erreur, une amplification destinée à accroître l'amplitude de cette information,...

Or, malgré la richesse de la recherche en traitement du signal, sa contribution aux sciences de gestion et en particulier au géomarketing s'avère pour l'instant très mince. Nous verrons au cours de ce chapitre que le traitement du signal se combine pourtant très harmonieusement aux modèles de localisation-allocation en particulier au modèle p-médian pour faciliter la

recherche de localisations multiples.

3.1 Une nouvelle approche du p-MP par le traitement du signal : premier aperçu d'un nouvel algorithme rapide de multilocalisation d'activités

Nous avons abordé le problème de recherche de localisations optimales par une approche modélisatrice. L'approche modélisatrice passe par une attention portée à ce qui est représenté, mais aussi à la symbolisation de ce qui est représenté, donc aux fondements et aux propriétés même de la projection556. "Le système de modélisation est récursif, s'établissant dans l'interaction entre le système modélisé (le phénomène perçu comme complexe) et le système modélisant. [...] Le système de modélisation (le modélisateur concevant et interprétant le modèle d'un système complexe) se comprend comme s'auto-finalisant : il élabore ses projets,

il est projectif "557. Ainsi, le premier niveau de notre réflexion est global et peut nous conduire

à retenir une méthodologie. Ensuite, les idées vont se transformer en variables au niveau du système, "cet ensemble d'unités en interrelations mutuelles558" qui seront alors analysées et organisées pour parvenir à des conclusions en effectuant un retour vers le niveau initial (processus récursif).

Ceci nous a conduit à élaborer un algorithme du type poupées russes. Son organigramme sera d'ores et déjà présenté étant donné que certaines de ses fonctionnalités, comme la délimitation

de zones de chalandise, mériterons d'être améliorées vis-à-vis de l'état de l'art existant (cf. chapitre II). La modélisation des données a été faite par une analyse systémique de la zone de chalandise composée de la demande 'les clients). Il s'agit de définir un modèle de données de

la zone de chalandise composée d'objets c'est-à-dire les aires de la zone de chalandise denses

en clientèle (voir pages suivantes). Cette approche correspond à l'idée de modélisation

556 MABILLOT V. (2000) Mises en Scène de l'Interactivité : Représentations des Utilisateurs dans les

Dispositifs de Médiations Interactives, Thèse soutenue le 7 janvier 2000, Université de Lyon II, p.6

557 LE MOIGNE J.L. (1990) La modélisation des Systèmes Complexes, Bordas, Paris, 178p.

558 VON BERTALANFFY L. (1968) Théorie générale des systèmes, Trad. fr. par J. B. Chabrol., Dunod, Paris.

projective avancée par Le Moigne où le territoire géographique est analysée à différentes échelles 559.

Rappelons et résumons tout d'abord à nouveau la problématique à résoudre.

Problématique:

Trouver les localisations optimales pour un ensemble de p activités destinées chacune à servir

un ensemble de clients, de telle manière que la somme totale des distances de l'ensemble des activités à ses clients soit minimale, avec la contrainte que le nombre n de clients est élevé. Les données disponibles sont au minimum la localisation spatiale des clients représentée par exemple par leurs adresses, le nombre p d'activités à localiser et éventuellement le niveau de demande de chaque client quant aux services ou aux produits offerts par lesdites activités.

L'algorithme recherchera une solution globale avant de s'attaquer à la recherche d'une solution locale ce qui permettra de simplifier le problème. Voici l'organigramme de l'algorithme proposé :

559 CRAUSAZ P.A., MUSY A., MATTEI A. (1999) GESREAU : GESREAU: Ein Konzept für ein Integriertes

Management der Fliessgewässer, Rapport de l'Hydram, Suisse, p.6

Nous proposons dans ce cadre l'algorithme global suivant qui prendra en compte les données

disponibles pour les traiter dans l'optique de résoudre la problématique exposée :

Initialisation:

Echelle Globale

Géocodage: Repérer les

1 clients à l'aide de leurs coordonnées spatiales.

Délimitation: Délimiter des

zones homogènes de

2 localisation de clients à l'aide de filtres et/ou d'un

algorithme morphologique.

Identification des centres

3 de gravité: les centres de gravité constitueront les

noeuds d'un réseau.

Changement d'échelle: Echelle plus fin e, locale

Résolution du p-MP: les

4 algorithmes du p-médian sont utilisés pour trouver les

p localisations d'activités.

La résolution est-

elle suffisante ?

Non

Oui

Fin

Fig. 3.1 - Organigramme du nouvel algorithme proposé

Explicitons le fonctionnement de cet algorithme avant d'étudier plus précisément ses différentes fonctions: notre procédure de recherche de localisations optimales comprend donc quatre phases suivies d'une boucle de rétroaction. Elle fonctionne en quelque sorte par effet

loupe en s'attachant dans un premier temps à déterminer les meilleurs emplacements au niveau global, par exemple au niveau national, puis à faire une boucle pour réitérer le même processus mais au niveau local. Les noeuds du modèle p-médian sont constitués dans un premier temps des zones géographiques (zones de chalandise) dans lesquelles la densité de clients est homogène et plus importante qu'ailleurs. Les frontières de ces zones de chalandise seront déterminées, comme nous le verrons plus loin, par les méthodes classiques utilisées en traitement du signal qui rassemble en fait un ensemble d'outils mathématiques destinés à extraire de manière rapide des informations précises d'une source.

Dans un second temps, on se concentrera sur les p noeuds calculés par l'algorithme de résolution et on déterminera au sein de chacun de ces p zones géographiques à nouveau un certain nombre de noeuds constitués de la même manière de zones de clientèle homogènes mais au niveau local cette fois. Le modèle p-médian (ou un autre modèle incorporant des paramètres de coût, de concurrence ou des critères socio-économiques) sera ré-appliqué dans chacune de ces p zones locales de manière à améliorer la précision de localisation des activités.

Les dessins suivants résument le fonctionnement de ce nouvel algorithme fondé sur la délimitation de zones de chalandise.

1

La phase 1 consiste à codifier les adresses de clients potentiels ou réels

en termes de coordonnées géographiques, adresses tirées d'une base de données. On pourra alors obtenir une représentation cartographique des différentes localisations de la clientèle, chaque client étant représenté par un point.

2

La phase 2 correspond à la délimitation des "paquets" de clients ou aires appartenant à la zone de chalandise. Nous utiliserons dans cette optique les techniques de traitement du signal qui font aussi l'originalité

de notre démarche.

3

On calculera dans la phase 3 les coordonnées des centres de gravité

de chaque aire délimitée dans la phase précédente de manière à modéliser un réseau: les noeuds du réseau seront représentés par les centres de gravité et les segments par les distances routières ou par un indicateur d'éloignement (temporel, kilométrique, généralisé...). Des localisations potentielles supplémentaires pourront d'autre part être introduites comme noeud même si elles ne comptent pas de clients. Ce réseau peut être, si nécessaire, pondéré et dans ce cas, à chaque noeud sera affecté un poids représentatif de l'importance de la clientèle ou de son potentiel.

4

Dans la phase 4, le réseau sera résolu sur la base du modèle p-médian grâce aux algorithmes classiques de résolution et d'amélioration. On aboutira donc au choix de certains noeuds comme localisations optimales.

Rétroaction et changement d'échelle: après avoir identifié les p noeuds optimaux par l'algorithme du p-médian, on pourra, si un degré de précision supplémentaire s'avère nécessaire, réitérer le processus en se concentrant cette fois au niveau de chaque noeud. L'examen d'aires de plus en plus petites pour améliorer la finesse du choix de localisation pourra se faire autant de fois que souhaité sous réserve de l'existence d'un nombre suffisant de clients ou d'emplacements potentiels à cette échelle.

Ainsi, la partie centrale et novatrice de cette méthode est constituée par la délimitation des

aires de chalandise (zones denses de clientèle appartenant à la zone de chalandise) au niveau

desquelles il sera possible de définir un centre de gravité caractérisant la localisation spatiale

de ladite aire. Ces centres de gravité constitueront les noeuds d'un modèle p-médian. Il est donc fondamental de définir avec précision les contours de ces aires de chalandise: une évaluation grossière des frontières induira nécessairement un repérage des centres de gravité entachés d'erreurs ce qui ne manquera pas de se répercuter sur le résultat final de localisation des p centres au niveau global et plus encore au niveau local. La deuxième innovation découle

du fait que l'on simplifie le problème en l'appréhendant de manière globale grâce à l'identification de "paquets" de clients, et qu'ensuite seulement, on pousse l'analyse dans le détail en recherchant dans les zones intéressantes des emplacements plus précis toujours en utilisant la délimitation d'aires de chalandise caractérisées par leurs centres de gravité et le modèle p-médian. Cette technique utilise à la fois des principes de la localisation discrète (à travers le modèle p-médian) et celles du modèle planaire (à travers le calcul de centres de gravité).

Le prochain paragraphe donnera tout d'abord l'occasion de récapituler les techniques existantes de traitement du signal, puis de montrer leur capacité à s'intégrer dans une problématique de multilocalisation d'activités du type p-médian.

3.2 Méthodes de délimitation fondées sur le traitement du signal et l'analyse d'image

La première étape de l'algorithme introduit précédemment et destiné à localiser un ensemble

de points de vente avec un bon niveau d'optimalité consiste à délimiter les zones de chalandise. Or, comme on l'a vu au chapitre 1, les méthodes actuelles de délimitations comportent un grand nombre de lacunes et d'imprécisions.

3.2.1 Introduction au traitement du signal et à l'analyse d'image

Les limitations précédentes se devaient d'être surmontées en introduisant une nouvelle approche pour délimiter les aires composant la zone de chalandise ou même toute autre zone géographique possédant des caractéristiques commerciales, économiques, sociologiques propres. Cette nouvelle solution devait à la fois être rapide, précise et pouvoir être convertie

en algorithmes de manière à pouvoir être mise en application sur ordinateur et de préférence sur les calculateurs les plus courants du marché, c'est-à-dire les micro-ordinateurs.

Pour répondre à ces exigences, il est un fait que les algorithmes nécessitant la plus grande vitesse d'exécution sont ceux fonctionnant en dynamique. Dans ce cas, les informations issues

de capteurs sont fournies en temps réel au calculateur qui les traite au même rythme que les données sont prélevées. Outre les applications purement électroniques, les domaines qui utilisent ce genre de traitement d'information ne sont pas légion et se rassemblent essentiellement autour du traitement du signal. Le traitement du signal vise à interpréter une information possédant une certaine continuité soit dans le temps, soit dans l'espace. Il s'agit ainsi d'arriver à distinguer, dans la masse de données, les informations non-aléatoires, et de caractériser ces données atypiques pour éventuellement les reconnaître à chaque fois qu'elles

se présenteront à nouveau. De nombreuses applications utilisent les principes du traitement du signal dont la plus élaborée est la vision artificielle, une technique complémentaire de la robotique. D'autres disciplines font largement appel au traitement du signal comme toutes les sciences désireuses de rendre de façon automatique le résultat de leurs observations. Ainsi,

ont procédé la cristallographie et la biologie en microscopie électronique, la médecine en échographie et radiographie, la géographie et la géologie pour traiter les images prises d'avion

ou de satellite, l'acoustique pour les signaux sonores, la climatologie dans l'interprétation des

images radars, la physique pour l'examen des spectrographes, etc... Les premières études sur

la vision artificielle furent menées à partir de 1950 par Gibson 560 à Boston puis dans les années 60 dans le domaine de la recherche spatiale en particulier pour tout ce qui concerne le traitement des images provenant des sondes et des satellites. Plus tard, la robotique, avec les travaux de Binford 561 et de Horn 562 563, a pris le relais dans le développement de ce domaine récent qui allait désormais s'appeler visionique ou computer vision en anglais.

On observe une grande similitude entre les données issues de capteurs électroniques ou optiques et les données géomarketing. Ces données, quelle qu'en soit la source, sont en effet variables dans l'espace et dans le temps. D'autre part, les capteurs ou les moyens d'obtention des informations marketing n'étant pas parfaits, elles comportent toutes des erreurs de mesure soit aléatoires du type neige, soit de type absences d'information, soit encore de type perturbations hautes ou basses fréquences liées à des interférences dans le cas de capteurs "physiques" ou liées au mode de collecte des données dans le cas de données géomarketing.

McKay 564, de l'Université d'Indiana, fut le premier à avoir noté que les données géomarketing

comportaient un signal de base avec une perturbation, le bruit, à éliminer par un filtrage approprié. Son travail s'est malheureusement limité à un filtre médian de base sans explorer toutes les possibilités qu'offre la science du signal.

Il y a quatre étapes fondamentales qui se succèdent d'une façon générale dans le processus d'analyse du signal et qui sont dans l'ordre:

%o l'acquisition des données par un capteur, dans le cas du géomarketing, ce capteur prenant la forme d'une enquête auprès d'une population donnée de clients effectifs, de

clients potentiels, de non-clients ou de toutes autres informations commerciales

560 GIBSON J.J. (1950) The Perception of the Visual World, Editions Houghton-Miffin, Mass., Boston.

561 BINFORD T. (1971) Visual Perception by Computer, IEEE Systems Science & Cybernetics Conference, FA, Miami.

562 HORN B.K.P. (1975) The Psychology of Computer Vision, Editeur P.Winston, NY.

563 HORN B.K.P. (1986) Robot Vision, Editions MIT, Press Mc Graw-Hill, NY.

564 MCKAY D.B. (1973) Spatial Measurement of Retail Store Demand, Journal of Marketing Research, 10, 4, p.

447-453.

quantifiées et liées à une localisation géographique précise. Dans le cas de données d'adresses, celles-ci sont géocodées afin d'obtenir une cartographie représentant l'ensemble des clients potentiels.

%o le pré-traitement des données destiné à éliminer les imperfections du capteur ou de

la source d'information à savoir dans le cas d'une enquête marketing, les non-réponses

ou l'absence de réponse, les fausses réponses, les erreurs d'échantillonnage ou les biais,

%o le traitement à proprement parler qui s'attache dans notre problématique à détecter par des algorithmes les frontières de la zone de chalandise,

%o l'exploitation des résultats qui vise à caractériser les informations extraites de la masse des données, ici, en l'occurrence, il s'agit de donner les caractères propres à la zone de chalandise, c'est-à-dire les paramètres géométriques qui vont nous servir à construire le modèle p-médian tels que les coordonnées des centres de gravité (noeuds

du réseau) de chaque aire composant la zone de chalandise ou éventuellement la surface de ces aires (qui pourra constituer une possibilité de mesure de la demande).

Nous allons maintenant décrire plus précisément les étapes de pré-traitement et de délimitation des zones de chalandise sachant que nous supposons avoir obtenu à ce stade une cartographie des données d'adresses clients. Les deux étapes suivantes seront illustrées par des exemples concrets de délimitation de zones de chalandise théoriques. A noter que la répartition de clients dans l'espace va être prise en considération à titre d'exemple, mais on aurait aussi bien pu, en suivant les mêmes méthodes, s'attacher à la délimitation de zones d'implantation de commerces ou d'activités de services.

3.2 2 Le géocodage et la représentation des données géomarketing

La première phase de notre algorithme consiste donc à repérer les coordonnées géographiques des clients: leur localisation conditionnera en effet le choix d'une (ou de plusieurs) localisation(s) d'activités. Supposons qu'on connaisse la localisation géographique de la clientèle d'un point de vente. Une base de données d'adresses peut être construite grâce à l'information obtenue à partir:

1- des cartes de fidélité (grands magasins, chaînes)

2- des modes de paiement comme les chèques (magasins, banques)

3- des bulletins d'un jeu-concours spécialement organisé pour l'occasion

4- d'un repérage des immatriculations des véhicules sur le parking

s)

5- d'une enquête directe (questionnaire auprès des client

.

En utilisant en premier lieu, la méthode empirique, on représente chaque adresse client par un

point sur un graphique correspondant au plan géographique 2D (géocodage), on obtient un nuage de points dont la densité varie dans le plan en fonction de la concentration de la clientèle. Les amas de points figurent les zones de chalandise à partir desquelles le point de vente tire l'essentiel de sa clientèle. L'oeil humain réussit assez bien, en visualisant une telle carte, à délimiter les frontières de ces amas grâce à ses fonctions performantes d'analyse spectrale. Ceci dit, la vision humaine n'est pas parfaite et un examen visuel, outre le fait que

ce mode de procédure, pour délimiter les zones de chalandise, est long et fastidieux, risque de

conduire à des erreurs d'interprétation.

La délimitation analytique des aires denses s'avère aussi difficile sur le plan mathématique mais nécessaire néanmoins si l'on veut non seulement bien connaître sa clientèle, par exemple pour de futures opérations promotionnelles (mailing par quartier), mais aussi pour s'assurer de

la bonne localisation de ses points de vente.

Y

O X

Fig. 3.2 - Exemple de représentation de clients sous forme de pixels

Si l'on revient au cas précédent, l'analyse peut porter sur les données d'adresses clients précédemment évoquées ou bien encore sur les données de fréquentation du point de vente. A chacun des k clients C1,...Ck , recensés, on peut associer une fréquentation du point de vente respectivement f1,...,fk sur une période T qui est choisie de manière adéquate (une semaine, un mois, un an,...) selon le type de point de vente considéré.

Les données d'enquête sont de type discret tout comme les données graphiques numériques,

ce qui facilite leur représentation visuelle (Le présent exposé mathématique pourrait être établi sans mise en parallèle avec une quelconque représentation visuelle, mais cette approche

en facilite la compréhension).

Chaque adresse d'un client Ci correspond à un point allumé soit un pixel noir de coordonnées

(xi, yi) dans une base orthonormée (OX,OY) : i variant de 1 à n et j de 1 à m pour un découpage de la région géographique analysée en n x m petites zones (xi,yi). Le pixel noir (présence d'au moins un client) ou blanc (absence de client) correspond dans ce cas à un élément de l'espace géographique quadrillé sous forme d'un réseau carré. Ceci dit, le réseau carré (matriciel), bien que très pratique, n'est pas forcément la partition la plus adéquate de l'espace géographique, car celle-ci ne conserve pas les propriétés topologiques du monde réel,

et en particulier la propriété de connexité (contrairement au réseau hexagonal).

Pour améliorer la représentativité de la zone de chalandise, on peut faire correspondre à chaque pixel un niveau linéaire de gris (ou de couleur) en fonction soit du nombre de clients dans la zone (xi,yi), soit de la somme f = fij des fréquentations du point de vente par l'ensemble des clients de la zone (xi,yi) sur une période T. Ce codage est souhaitable lorsque

le quadrillage de la zone géographique possède une faible résolution (peu de pixels). D'autres

variables peuvent être bien sûr prises en compte selon les préoccupations de l'analyse, comme

le chiffre d'affaires (ou la rentabilité) lié à chaque client sur une période de temps. Si l'on considère par exemple chaque pixel d'une matrice carrée 512 x 512, formé d'une information codée sur 8 bits, on a alors 256 niveaux de valeurs disponibles pour chaque point pour un encombrement mémoire sur 256 k octets. Le dessin suivant montre une possibilité de représentation des points-clients sur une carte bidimensionnelle.

Y

O X

Fig. 3.3 - Exemple de localisation de clients associés à leur fréquentation, sous forme d'un nuage de pixels en niveaux de gris

Il existe cependant de nombreuses possibilités différentes de représentations graphiques des

données géomarketing que par des points comme :

%o la projection cavalière qui est une représentation en 3 dimensions des données géomarketing (exemple: niveau de fréquentation des clients d'un magasin) dans l'espace géographique:

Fig. 3.4 - Exemple de projection cavalière

%o les lignes de Niveau délimitant les frontières de zones possédant des valeurs homogènes

(exemple: niveaux d'équi-fréquentation):

Fig. 3.5 - Exemple de lignes de niveaux

%o le code Ternaire qui est une simplification de la représentation ponctuelle. Ce code de représentation ne possède que 3 valeurs possibles avec par exemple, si l'on considère les différents types de zones d'une ville en termes de fréquentations d'un point de vente, les zones comptant au moins un client (point foncé), les zones comptant uniquement des

habitants non-clients (point clair) et les zones urbaines sans habitants (en blanc):

Fig. 3.6 - Exemple de représentation en code ternaire

Après avoir vu les modes de représentation possible des données géomarketing et la manière d'obtenir les adresses, l'étape suivante consiste à délimiter les aires denses en terme de clients dont le regroupement est appelé communément "zone de chalandise" (la zone concentrant au mieux le meilleur du potentiel commercial). Après avoir rappelé les différentes approches de

ces aires dans la littérature, nous nous proposons d'introduire de nouvelles méthodes de délimitation pour pallier le manque de précision et de rapidité des méthodes actuelles.

3.2.3 Le prétraitement des données par filtrage

Le prétraitement des données d'enquête est destiné à faciliter l'analyse des données sans réduire la qualité de l'information disponible, bien au contraire. En traitement du signal, la principale méthode consiste en un filtrage ondulatoire (une image ou une enquête sur un secteur géographique étant une onde bidimensionnelle). On cherchera ainsi non seulement à accentuer le crénelage (accentuation des contours entre les zones de différentes caractéristiques à peu près homogènes), mais aussi à s'affranchir de la pollution par des données atypiques (bruit) dues par exemple à des erreurs d'enquête (ex. mauvaise administration ou saisie), aux fausses réponses (ex. fausse adresse) ou tout simplement à des réponses marginales au sein de la zone de caractéristiques homogènes.

Comme on l'a déjà vu, McKay est le premier à avoir utilisé la technique du filtrage sur des

données de localisation spatiale d'un échantillon de clients 565 en constatant que ces informations étaient composées d'un signal fondamental de base et d'un signal perturbateur ou bruit dont il fallait s'affranchir. Mais, cette imperfection des données n'était pour lui que le fait

de fortes différences comportementales entre des consommateurs habitant à proximité les uns des autres, alors que le bruit trouve aussi son origine dans des informations erronées ou manquantes. Etudiant un échantillon d'une centaine de clients seulement, le traitement des données s'était limité à l'utilisation d'un filtre binomial (filtrage en moyenne pondérée) du

type:

1 / 16

C = [cmn]= 2 / 16

1 / 16

2 / 16

4 / 16

2 / 16

1 / 16

2 / 16

1 / 16

avec, si Zij représente la valeur mesurée au point de localisation (Xi, Yi), une nouvelle valeur

Wij modifiée par ce filtre est donnée par :

M N

W ij

=

m = -M n = -N

cmn Z i + m, j + n

le filtre ayant pour dimension 2M+1 par 2N+1 (c'est-à-dire M= et N =1 pour le filtre binomial

précédent). Comme on va le voir, le filtre binomial bien qu'éliminant le bruit lié par exemple à des erreurs d'enquête n'est pas le plus recommandé pour conserver les contours.

Le filtrage spatial repose d'une manière générale sur des opérations ponctuelles appliquées de manière itérative sur chaque valeur ou agrégat de valeurs d'une matrice ou d'une image (en quelque sorte des opérations portant sur les aires géographiques regroupant des clients d'un niveau moyen de fréquentation homogène). Les filtres spatiaux les plus courants sont:

565 McKAY D.B. (1973) Spatial Measurement of Retail Store Demand, Journal of Marketing Research, 10, 4, p.

447-453.

- le filtre en moyenne

- le filtre médian

- le filtre sigma

- le filtre Nagao

Il est également intéressant d'utiliser la transformation de dilatation lorsque les points représentant les clients sont assez éloignés les uns des autres et qu'il n'y alors pas possibilité

de distinguer de forme claire de la zone de chalandise.

Le filtre en moyenne

Ce traitement revient à traiter la matrice de données en prenant comme nouvelle valeur de chaque point, la moyenne du point considéré aggloméré avec ses voisins. Il correspond en fait

au filtre binomial avec des coefficients de pondération égaux à 1. Dans une matrice, chaque élément (excepté sur les bords) compte 8 voisins adjacents de même que sur une image à matrice carrée.

Fig. 3.7- 8 voisins adjacents à un point central

Ainsi, la nouvelle valeur f 'i,j de fi,j est :

f 'i,j = [fi,j + fi+1,j+1 + fi+1,j + fi,j+1 + fi-1,j-1 + fi-1,j + fi,j-1 + fi+1,j-1 + fi-1,j+1] / 9

Ce procédé comme tous les filtres binomiaux en général a l'inconvénient de lisser les données mais lisse aussi les transitions (les bords d'objets à fort gradient d'intensité deviennent souvent

flous). Très simple, rapide, il n'est à utiliser que lorsque la densité des clients dans les aires de chalandise est faible afin d'obtenir un effet de lissage fort.

le filtre médian

Le filtrage en moyenne compte tenu de ses inconvénients peut être avantageusement remplacé

par le filtrage médian, un filtre passe-bas qui a tendance à accentuer les intensités sans lisser

les bords. La médiane M d'une variable x vérifie par définition les probabilités suivantes: P(x M) 1/2 et P(M x) 1/2

Le filtrage médian élimine le bruit de type neige (erreur dispersée de façon aléatoire) mais au

détriment d'une légère perte de résolution.

L'exemple suivant représente la même représentation des localisations de clients virtuels selon leurs niveaux de fréquentation d'un point de vente (les points foncés représentent les clients fréquentant assidûment le magasin, les points plus clairs les clients moins fidèles). Le dessin

à côté montre cette cartographie traitée par deux filtres médians successifs: les aires de chalandise à forte fréquentation de clients apparaissent plus nettement (zones foncées) ce qui facilitera la délimitation des frontières :

Fig. 3.8 - Adresses clients associées aux fréquentations Fig. 3.9 - La représentation traitée par 2 filtres médians

Comme vu précédemment (§ 1.4), nous remarquons que les zones denses de clientèle ne

forment pas un ensemble géographique compact 566, mais se répartissent en différentes aires

de chalandise (nous dirons que la zone de chalandise se compose en fait de plusieurs aires de chalandise).

le filtre sigma

Le filtre sigma est surtout un filtre de débruitage. A tout point (i, j) de la zone image active de niveau de fi,j est affectée la moyenne de ses voisins dont le niveau appartient à l'intervalle centré en fi,j de demi-largeur 2 sigma, sigma étant la variance locale dans la fenêtre. Toutefois, si le nombre de voisins appartenant à cet intervalle est inférieur ou égal au nombre

de voisins V=2L+1, alors f i,j sera remplacé par la moyenne de ses huit voisins immédiats.

Ce traitement est bien adapté au filtrage d'un bruit impulsionnel (erreur très forte, répétée mais localisée, cas de réponses totalement erronées mais rares), en choisissant <2 et L=1 (V=2L+1=3, correspondant à un voisinage 3x3) ce qui peut être le cas si les données géomarketing présentent des erreurs importantes mais espacées.

le filtre de Nagao

Un des filtrages spatiaux les plus utilisés et les plus intéressants de nos jours est celui de Nagao 567. On considère cette fois le voisinage d'un pas de deux éléments (ou plus généralement de e éléments) autour du point (i, j) considéré, soit une sous-matrice de 5 x 5 =

25 éléments. On calcule ensuite pour 9 configurations compactes d'éléments de 3 types différents (voir dessin suivant), la moyenne et la variance des valeurs des éléments les

composant.

566 CLIQUET G., FADY A., BASSET G. (2002) Management de la Distribution, Dunod, Paris.

567 NAGAO M., (1979) Edge Preserving Smoothing, CGIP, vol. 9, p.394-407.

1 du type (1) + 4 du type (2) + 4 du type (3)

Fig. 3.10 - Les 3 catégories des 9 configurations du filtrage de Nagao sur lesquelles porte le calcul des moyennes et des variances

La nouvelle valeur choisie pour le point (i, j) est alors celle de la moyenne correspondant à la plus faible variance. Ce traitement est réalisé en considérant tour à tour tous les points de la matrice des données de fréquentation.

Les contours sont ainsi bien conservés car le lissage ne se fait que dans sa direction tangentielle c'est-à-dire dans la direction où la modification est la moins visible 568. C'est la raison pour laquelle on dit que le filtre de Nagao est qualifié de lissage avec conservation et même accentuation des contours. Ce filtrage peut être réitéré plusieurs fois sur la matrice déjà traitée. On observe que ce filtre est pratiquement idempotent: au bout de quelques itérations, l'image (ou la matrice) ne se modifie presque pas. On arrête alors le processus de traitement. L'exemple suivant montre la même représentation des localisations de clients virtuels selon leur niveau de fréquentation d'un point de vente (les points foncés représentent les clients fréquentant assidûment le magasin, les points plus clairs les clients moins fidèles). Le dessin

à côté montre cette cartographie traitée par deux filtres successifs: on distingue beaucoup plus nettement les frontières des aires de chalandise à forte fréquentation de clients (zones foncées

plus homogènes que pour les filtres précédents):

568 ORSTOM (1998) Image Satellite et Milieux Terrestre en Régions Arides et Tropicales, Editions de l'Orstom, Bondy.

Fig. 3.11- Adresses clients associées aux fréquentations Fig. 3.12 - La représentation traitée par 2 filtres Nagao

Il existe encore de nombreux autres filtres capables d'améliorer la qualité de l'image cela afin

de faciliter dans l'étape suivante, le processus de délimitation des contours des aires. En particulier, de la même façon que sur une photo de mauvaise qualité, les données géomarketing sont susceptibles de comporter soit des perturbations basses fréquences aléatoires et stationnaires (ex: données manquantes, échantillon d'enquête trop faible ou base

de données d'adresses clients incomplète) qui influent négativement sur les frontières de zone

de chalandise en les rendant floues. Un deuxième type d'interférences est constitué par les perturbations hautes fréquences liées plus spécifiquement au mode de collecte des données: il peut par exemple arriver dans une enquête que tous les 100 questionnaires, il y ait une ou plusieurs réponses fantaisistes (clients donnant une fausse adresse ou bien surestimant son taux de fréquentation ou d'achat dans le magasin). Même si les filtres précédents ont tendance

à lisser ces erreurs, il existe des filtrages de fréquence spécifiques dont le rôle est d'assurer la suppression de ces fréquences non désirées. Le premier type s'atténue avec les filtres passe- haut (laissant passer les hautes fréquences) alors que le deuxième s'estompe grâce à des filtres

passe-bas (laissant passer les faibles fréquences).

La transformation de dilatation

Elle consiste en résumé à grossir les points représentatifs des clients jusqu'à ce que ceux-ci se touchent et que l'on distingue les formes pleines de la zone de chalandise. En effet, dans certains cas, les clients d'un point de vente représentés sur une carte à la suite d'une phase de géocodage, apparaissent si éloignés les uns des autres qu'il est impossible de percevoir les formes de la zone de chalandise, la dilatation permettant alors de résoudre ce problème. La dilatation tend donc à connecter les parties disjointes et à lisser les contours. Nous reviendrons plus précisément sur cette transformation dite "morphologique" dans le paragraphe suivant

qui montre comment délimiter de cette manière les zones de chalandise (la dilatation sera également utilisée dans la deuxième partie pour lisser les zones de chalandise constituées par

les clients potentiels de l'Ouest parisien intéressés par les produits biologiques).

3.2.4 La délimitation des zones de chalandise par traitement du signal

Après avoir lissé les données par un filtrage approprié pour obtenir une cartographie plus nette des données géomarketing, on choisit une méthode parmi celles disponibles, méthodes toujours inspirées du traitement du signal ou de l'analyse d'image, pour procéder à la délimitation de la zone de chalandise. Les méthodes de délimitation possibles sont:

- une méthode empirique (le seuillage d'histogramme),

- la méthode par masquage et convolution: gradient, laplacien, Sobel, Prewitt,

- la méthode par analyse morphologique.

· Délimitation par seuillage d'histogramme

La délimitation par seuillage d'histogramme consiste en premier à comptabiliser chaque valeur discrète que les éléments de la matrice f'i,j des fréquentations préalablement obtenues peut prendre puis de les tracer sous la forme d'un histogramme. On tente alors de déterminer une valeur seuil T qui permette de séparer le groupe appartenant à l'objet et celui appartenant

au fond. Ainsi, pour toute valeur de l'image ou de la matrice f'i,j supérieure ou égale à T, le point correspondant appartiendra à la zone de chalandise au contraire des valeurs inférieures à

T.

Fig. 3.13 - Exemple de représentation sous forme d'un histogramme des valeurs f(x,y) des points d'une image

Dans le cas plus général, on peut réussir à distinguer plusieurs seuils T1,...Ts sur l'histogramme avec donc plusieurs types de zones de fréquentation du point de vente considéré par la clientèle :

si f'i,j < T1, fréquentation quasi nulle

si T1 f'i,j < T2, fréquentation faible

. .

. .

. .

si Ts f'i,j, fréquentation élevée

Le seuillage T1,...Ts déterminé peut être soit global (valable pour tout l'espace géographique analysé), soit local (les valeurs du seuil varie selon les régions du plan),

Mais, dans beaucoup de cas, l'histogramme ne présente pas de seuils distinctifs de zones bien nets comme dans l'exemple ci-dessous.

Fig. 3.14 - Détermination d'un seuil de valeurs sur un histogramme

Une première méthode, empirique, consiste à tenter de définir un seuil T par tâtonnements successifs en observant la pertinence de l'image seuillée. Il est également possible de rechercher un seuil T en considérant que l'histogramme H(f) est la somme de deux densités de probabilité :

H(f) = H1 x h1(f) + H2 x h2(f)

h1(f) et h2(f) sont les fonctions de densité de probabilité et H1 et H2 sont les probabilités d'existence de 2 groupes de valeurs dans la matrice (ou des 2 types de niveaux de gris dans l'image).

Fig. 3.15 - Exemples d'un histogramme et de son enveloppe comportant plusieurs valeurs de seuils

La probabilité de classement par erreur d'un point à fréquentation faible dans la zone 2 à forte fréquentation (zone de chalandise) s'exprime par :

T

E1(T) = h2(f)df

-

Et inversement, la probabilité de classement par erreur d'un point à fréquentation importante

(appartenant à la zone de chalandise) dans la zone 1 à faible fréquentation s'exprime par :

+

E2(T) = h1(f)df

T

La probabilité d'erreur totale est donnée par : E(T) = H2 E1(T) + H1 E2(T)

Celle-ci doit être minimisée et en conséquence la dérivée de E(T) par rapport à T est nulle. On

a donc H1 h1(T) = H2 h2(T). Le seuil T qui permet de départager les deux densités de

probabilité h1(T) et h2(T) correspond ainsi à la valeur du minimum de l'histogramme

correspondant à la densité h1(T) c'est-à-dire :

1 2

P1

T = 2 ( + )+ 1 -2 Ln(P2 )

1 2

1 et 2 étant les luminances des densités de probabilité p1(f) et p2(f),

1 et 2 étant les écarts-types de ces mêmes densités de probabilité.

· Délimitation par le gradient

La méthode par le gradient et celle par le laplacien décrite dans le paragraphe suivant, utilisent les différences de valeur entre les points proches pour déterminer les frontières. Le vecteur gradient qui traduit les variations de fréquentation des clients dans le sens vertical (composante de l'abscisse sur la cartographie) et dans le sens horizontal (composante de l'ordonnée sur la cartographie) a pour expression dans l'espace f'i,j du chapitre précédent :

f

r i

G =

f

j

f

lim f i, j - f i + h, j

f lim f i, j - f i, j + h

avec

i = h0 h

et j = h0 h

r

La norme du vecteur G orienté dans le sens de la variation maximale correspond au maximum

de variation d'intensité.

r 2

1/ 2

G = (f )2+ f

i j

en approximation dans les algorithmes, on prend :

r ( f - f

)2 ( f - f

)2 1/ 2

G

i, j

i+1, j +

i, j

i, j+1

et surtout :

r

G f i, j- f i+1, j + f i, j- f i, j+1

ou bien lorsque les contours sont peu marqués, on utilise l'approximation de Roberts

(variations du gradient peu importantes)569 570 :

r

G f i, j- f i+1, j+1 +

f i+1, j- f i, j+1

r

Pour délimiter les contours par la méthode du gradient, il faudra en pratique comparer G à

une valeur seuil T positive. Si

r

G 0 , alors le point considéré appartient au contour (qui peut

comporter une épaisseur de plusieurs pixels) et dans le cas inverse, le point appartient au fond

ou à l'objet.

0 0 0

Le gradient s'exprime par l'opérateur matriciel : -1 1 0

0 0 0

· Délimitation par le laplacien

L'opérateur laplacien est défini par :

2f

=

+ 2f

i2

j2

soit en première approximation,

= fi+1, j - 2 fi,j + fi-1,j + fi,j+1 - 2fi,j + fi,j-1 = fi+1,j + fi-1,j + fi,j+1 + fi,j-1 - 4fi,j

On définit la norme du vecteur laplacien par :

2

r

2 1/ 2

= 2f + 2f

i2

j2

569 CANNY J. (1986) A Computational Approach to Edge Detection, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-8, No. 6, pp. 679-698.

570 LIM J. S. (1990) Two-Dimensional Signal and Image Processing, Englewood Cliffs, NJ: Prentice Hall, pp.

478-488.

0 -1

et le laplacien s'exprime par l'opérateur matriciel : -1 4

0 -1

0

-1

0

Le gradient et le laplacien sont en fait des masques linéaires. Nous examinons dans le

paragraphe suivant la technique de délimitation par masquage d'une façon générale.

La même représentation des localisations de clients virtuels selon leurs niveaux de fréquentation d'un point de vente nous permet d'illustrer le filtre laplacien de délimitation (dessin de droite) suite à l'application de deux filtres médians sur la cartographie initiale (dessin de gauche) conformément à l'étape précédente. Les contours sont nets mais présentent

des courbes non fermées à ébavurer:

Fig. 3.16 - Adresses clients associées aux Fig. 3.17 - La représentation traitée par le fréquentations laplacien après 2 filtres médian

· Délimitation par masquage

Le masquage est un type de filtrage qui généralise le principe des filtres laplacien et gradient vus précédemment en faisant appel au produit de convolution de deux fonctions.

Pour rappel, le produit de convolution de deux fonctions f et g : Z Æ R est une fonction h : Z

Æ R définie par :

Ses propriétés sont d'être commutatif, associatif et d'avoir pour élément unité l'impulsion

unité. On utilise la notation h = f*g. Dans le cas d'une fonction à 2 variables ou d'une matrice carrée à 2 dimensions telle fi,j (image) convoluée avec une fonction ou une matrice du même type hi,j , (filtre) on a :

i +k

j +k

gi,j = fi,j * hi,j = f,

hi -, j -

=i -k

= j -k

Fig. 3.18 - L'image fi,j et le filtre hi,j

Les dimensions de l'image fi,j et du filtre hi,j sont respectivement de 2m+1 et de 2k+1 et celle

du produit de convolution de 2(m+k)+1. Si la dimension du filtre est très petite devant celle

de l'image, ce filtre constitue une fenêtre. Il est à noter que les bords extérieurs de la nouvelle image issue du produit de convolution sont entachés d'erreurs.

On a plus spécifiquement pour le produit scalaire matriciel de 2 matrices A , l'image et M ,

le masque, la notation :

A M

. La matrice résultante

A M

possède les mêmes

dimensions que la matrice image A . Pour une matrice masque M , 3x3, et le produit scalaire

matriciel est défini par :

3 3

A M

= ai, j mi, j

i = 1 j = 1

avec :

r r

Le produit scalaire Ps s'écrit : Ps =

A. M = a1w1 + a2w2 + ...+ a9w9

r r

Les coefficients ai et wi respectivement de A et de M étant rangés dans les vecteurs A et M .

Le contour s'apprécie en comparant la valeur Ts à une valeur seuil T. Dans le cas où Ps>T, le pixel transformé par la convolution est rangé dans la nouvelle matrice de délimitation.

Voici différents types de masques possibles :

Les masques linéaires

Les masques linéaires les plus connus sont le gradient et le laplacien déjà évoqués au paragraphe précédent :

-le Gradient

0 0 0

0 0 0

0 0 0

0 1 0

- 1 1

0 ou

- 1 0

1 ;

0 1

0 ou

0 0 0

0 0 0

0 0 0

0 - 1 0

0 - 1 0

Matrices de détection horizontale ; et matrices de détection verticale

-Le laplacien

0 0 0

0 0 0

0 0 0

0 1 0

- 1 1

0 ou

- 1 0

1 ;

0 1

0 ou

0 0 0

0 0 0

0 0 0

0 - 1 0

0 - 1 0

Matrices de détection horizontale ; et matrices de détection verticale

On a en parallèle des masques linéaires pouvant faire apparaître par convolution uniquement

les frontières d'objet orientés dans une certaine direction avec par exemple:

- un masque pour la détection des droites horizontales

- 1

- 1 - 1

2 2 2

- 1

- 1 - 1

- un masque pour la détection des droites à 45°

- 1 - 1 2

- 1 2

- 1

2 - 1

- 1

Il existe aussi des matrices 3x3 dont les termes sont des facteurs de corrélation de Markov

(voir chapitre sur le filtre spatial) ou bien des composantes issues de fonctions gaussiennes. Voici d'autres masques parmi les plus courants avec dans les masques non-linéaires :

- les masques de Sobel

Ils sont représentés par les deux matrices:

0 0 0

0 1 0

Sx = - 1 1 0

; Sy = 0 0 0

0 0 0

0 - 1 0

Matrice de détection horizontale ; et matrice de détection verticale

Le "pseudo-gradient" G de Sobel (une approximation du gradient vu précédemment) est donné par :

G = Gx2 + Gy

2 1 / 2 ou

G = Gx

+ Gy

(formule encore plus approchée)

avec Gx = (w7 + 2w8 + w9) - (w1 + 2w2 + w3)

Gy = (w3 + 2w6 + w9) - (w1 + 2w4 + w7)

La direction du pseudo-gradient est alors = tg -1 (Gy / Gx)

Fig. 3.20 - La représentation traitée par filtres Fig. 3.19- Adresses clients Sobel après 2 filtres médian (les contours sont associées aux fréquentations superposés à l'image filtrée par les 2 Nagao)

On remarque que le filtre Sobel possède grâce à sa fonction de détection des sauts de valeurs

(de fréquentation) la propriété de fragmenter l'espace à la manière d'un puzzle en séparant les régions pleines et celles vides de clients. Une suggestion d'application est que ce filtre pourrait servir à découper de manière très fine une zone géographique en un certain nombre

de cellules juxtaposées pour effectuer une étude sur la proximité spatiale des activités commerciales ou non, en utilisant le principe de l'analyse quadratique571 572. Cette technique visant à mesurer la dispersion spatiale des activités repérées par la position du centre de gravité de ces cellules par rapport à une distribution aléatoire ou la méthode voisine des plus proches voisins573 ont déjà été utilisées dans de nombreuses études sur la proximité spatiale

dans des comme le Canada574 575, la Grande-Bretagne576 577, l'Irlande578 579, la Suède580, la

571 ROGERS A. (1969) Quadrat Analysis of Urban Dispersion : 2. case studies of urban retail systems,

Environment and Planning, 1, p. 155-171.

572 BROWN S. (1992) Retail Location : A Micro-scale Perspective, Ashgate, England.

573 PINDER D.A. & WITHERICK M.E. (1972) The Principles, Practice and Pitfalls of Nearest-neighbour

Analysis in Linear Situations, Geography, 57, p.277-288.

574 BOUCHARD D.C. (1973) Location Patterns of Selected Retail Activities in the Urban Environment : Montreal, 1950-1970, Revue Géographie Montréal, 27, p. 319-327.

575 SMITH S.L.J. (1985) Location Pattern of Urban Restaurants, Annals of Tourism Research, 12, p. 581-602.

576 SORENSON A.D. (1970) A Comparative Study of the Changing Patterns of Distribution of Service

Industries on Tyneside, Wearside and Teeside, unpublished Ph.D. thesis, University of Newcastle-upon-Tyne.

Yougoslavie581, Israël582, Singapour583, l'Australie584, Hong Kong585 ou le Japon586. L'analyse quadratique difficile à mettre en oeuvre, compare donc la distribution des localisations par rapport à celle qui aurait été générée aléatoirement : les résultats de cette technique risquée sont malheureusement sujets à variation en fonction du découpage géographique retenu de l'aire d'analyse. La méthode des plus proches voisins consiste, quant à elle, en une mesure de l'écart d'une configuration spatiale de points par rapport à une répartition aléatoire : le problème est que, selon l'étendue de la zone d'analyse, les mêmes distributions de points peuvent engendrer des mesures différentes de proximité spatiale et que la méthode est, d'une manière générale, très sensible aux effets de bord 587 588 589. La majorité de ces études ont cependant remarqué que les commerces de détail avaient tendance à se regrouper comme le prévoit la loi de Hotelling 590 (voir § 2.1.1), au niveau des zones urbaines surtout en ce qui concerne la distribution de biens élaborés comme les grands magasins, le prêt-à-porter

féminin, à l'inverse des stations-service ou de certaines activités de services basiques. Le filtre

577 SIBLEY D. (1975) A Temporal Analysis of the Distribution of the Distribution of Shops in British Cities, unpublished Ph.D. thesis, University of Cambridge.

578 PARKER A.J. (1973) The Structure and Distribution of Grocery Shops in Dublin, Irish Geography, 5, p. 625-

630.

579 BRADY J.E.M. (1977) The Pattern of Retailing in Central Dublin, unpublished M.A. thesis, University

College Dublin.

580 ARTLE A. (1959) Study in the Structure of the Stockholm Economy : Towards a Framework for Projecting

Metropolitan Community Development, Business Research Institute, Stockholm School Economics, Stockholm.

581 ROGERS A. (1974) Statistical Analysis of Spatial Dispersion, Pion, London.

582 SHACHAR A. (1967) Some Application of Geo-statistical Methods in Urban Research, Papers of the

Regional Science Association, 18, p.85-92.

583 WING H.C. & LEE S.L. (1980) The Characteristics and Locational Patterns of Wholesale and Service

Trades in the Central Area of Singapore, Singapore Journal Geography, 1, p.23-36.

584 JOHNSTON R.J. (1967) Land Use Changes in the Melbourne CBD : 1857-1972, Troy, P.N., (ed), Urban

Redevelopment in Australia, Research School of Social Sciences, Urban Research Unit, Australian National

University, Canberra, p. 77-201.

585 LEE Y. (1979) A Nearest-neighbour Spatial Association Measure for the Analysis of Firm Interdependence,

Environment and Planning A, 1, p. 169-176.

586 OKABE A., ASAMI Y. & MIKI F. (1985) Statistical Analysis of the Spatial Association of Convenience- good Stores by Use of a Random Clumping Model, Journal of Regional Science, 25, p. 11-28.

587 PINDER D.A. & WITHERICK M.E. (1972) The Principles, Practice and Pitfalls of Nearest-neighbour

Analysis in Linear Situations, Geography, 57, p.277-288.

588 DE VOS (1973) The Use of Nearest-neighbour Methods, Tijdschrift voor Economische en Sociale Geografie,

64, p. 307-319.

589 RODER W. (1975) A Procedure for Assessing Point Patterns without Reference to Area or Density,

Professional Geographer, 27, p. 432-440.

590 HOTELLING H. (1929) Stability in Competition, The Economic Journal, Vol. 39, p 41-57.

Sobel pourrait donc avantageusement servir à construire de manière précise et harmonieuse le découpage géographique introduit dans ce type d'études qui deviendrait ainsi plus fiable (les découpages retenus dans la plupart des cas étaient les limites administratives pas forcément très logiques).

D'autres masques sont pratiquement équivalents au masque Sobel comme les masques de

Kirch ou de Prewitt:

7

- le masque de Kirch

Le pseudo-gradient est cette fois donné par l'expression :

G = max

1, max[ 5Si - 3Ti ]

i = 0

avec : Si = wi + wi+1 + wi+2 et Ti = wi+3 + wi+4 + wi+5 + wi+6 + wi+7

- le masque de Prewitt

Le masque de Prewitt 591 est l'un des filtres du type dérivatif le plus simple.

- 1 - 1

- 1

- 1

0 1

Px = 0

1

0 0

1 1

; Py = - 1

- 1

0 1

0 1

Détection Horizontale Détection Verticale

Il existe aussi de nombreux masques commerciaux proposés par diverses sociétés comme

Robotronics, ITMI, Visiomat, FTR proposent d'autres types de détermination de contour par

le procédé de masquage. Vicom, par exemple propose l'extracteur de contour (passe-haut)

suivant:

591 PREWITT J.M.S. (1970) Picture Processing and Psychopictories, Academic Press, p.75.

1 - b 1

( 1 )2 - b b²

- b

b + 2

1

- b 1

suivi par un atténuateur (filtre passe-bas pour supprimer les aires de clientèle bien identifiées

mais trop petites pour être intéressantes dans l'analyse):

1 b 1

b

( 1 )2 b² b

b + 2

1 b 1

b pouvant adopter selon les cas une valeur comprise entre 0 et 9.

Voici un algorithme général qui sera capable de mettre en oeuvre tous ces processus de masquage:

FONCTION MASQUE;

DEBUT

DE i=1 A largeur

DE j=1 A hauteur

DE x=1 A 3

DE y=1 A 3

ImageTransformée(i, j) = ImageTransformée(i, j) + Masque (x, y) x

ImageOriginale(i+x-1, j+y-1);

FIN FIN

FIN FIN

(les instructions de programmation sont en caractères gras).

· Délimitation par transformation morphologique

L'application de la théorie du morphisme mathématique à la science de la localisation vise à pallier ces manques en rationalisant le concept de zone de chalandise. Le morphisme mathématique qui s'inspire de notions de topologie, de traitement du signal, de probabilités et

de théorie des graphes comporte un grand nombre d'applications qui toutes relèvent du monde réel. Les domaines intéressés par cette technique sont très variés et l'on trouve par exemple la science des matériaux, la géologie, la biologie, la géographie, la robotique. Le point commun des champs d'applications possibles est que les données traitées sont variables dans un espace d'observation assez souvent supérieur ou égal à deux dimensions.

Le morphisme mathématique s'attache à analyser les informations dans leur globalité. Voilà pourquoi, cette science a beaucoup apporté, comme son nom l'indique, à la reconnaissance des formes (empreinte digitale; voix, écriture; structure des matériaux; structure géologique, cytologique ou génétique; circuit électronique) et donc au traitement des images provenant de diverses sources: enregistrement sonore, photographie, microscopie électronique ou optique, images satellites, images radar ou sonar, radiographie, échographie.

Or, pourquoi ne pas utiliser les méthodes du morphisme, en s'appuyant sur le principe d'universalité des mathématiques, sur d'autres données que celles acquises par vision ou enregistrement direct du monde réel ? Le morphisme est en effet tout aussi apte à traiter des informations qui sont issues de capteurs humains (ex. enquêtes marketing quantitatives ou qualitatives) que de capteurs électroniques ou optiques ainsi que de bases de données mixtes. Cette nouvelle méthode fondée sur le morphisme mathématique peut être décrite par une succession de plusieurs étapes:

· Segmentation des données

· Amincissement et régularisation de la frontière de la zone de chalandise

Segmentation des données

Avant de poursuivre la description du traitement sur la matrice, nous allons évoquer certaines notions utiles sur les transformations morphologiques de base.

Transformations Morphologiques de Base: dilatation - érosion - fermeture - ouverture - chapeau "haut-de-forme"

Les premiers filtres morphologiques sur des données discrètes ou continues datent de la fin

des années 1970 592 593, mais c'est entre 1982 et 1986 que les Français Matheron et Serra ont établi une théorie de la morphologie mathématique possédant une véritable unité 594 595.

Voici les principes fondamentaux de cette théorie d'analyse des formes :

Soit X un ensemble connexe de données binaires d'une matrice (0 ou 1, point allumé ou éteint dans un espace 2D), une première transformation de base possible de cet ensemble est la dilatation binaire 596 qui a pour effet d'augmenter la surface totale de cet ensemble. Elle tend à

connecter les parties disjointes et à lisser les contours.

592 MEYER F. (1978) IIème Symposium Européen d'Analyse d'Images en Sciences des Matériaux, Biologie et

Médecine, 4-7 oct. 1977. Pract. Met., S8, p. 374, Caen, France.

593 STERNBERG (1979) Proc. 3rd Int. IEEE Comprac, Chicago 1979.

594 SERRA J. (1982) Image Analysis and Mathematical Morphology, Academic Press.

595 MATHERON G. (1982) Les Applications Idempotentes, Rapport du Centre de Géostatistique et de

Morphologie Mathématique n°743, Ecole des Mines, Fontainebleau.

596 MINKOWSKI H. (1903) Mathematics Annals, Vol. 57, p.447.

Fig. 3.21 - Exemple d'une dilatation:

en hachures, la forme originale

Une autre transformation morphologique de base est l'érosion binaire 597 qui lisse aussi la

surface mais à l'inverse la réduit.

Fig. 3.22- Exemple d'une érosion:

en hachures, la forme originale

Pour obtenir des contours plus réguliers, il est possible de réaliser une succession d'érosion- dilatation c'est-à-dire qu'en partant de l'image initiale, on élimine tous les points de la forme considérée en contact en bas, en haut, à droite ou à gauche avec au moins un point n'appartenant pas à la dite forme (érosion). Seule, donc, restent les points de sa partie intérieure. Puis, on entoure chaque point frontière de la forme érodée de nouveaux points, à

597 HADWIGER H. (1957) Vorlesung Über Inhalt, Oberfläche und Isoperimetrie, Springer Verlag, Berlin.

droite, à gauche, en haut, en bas (dilatation).

Fig. 3.23 - Image Initale, érosion, puis dilatation.

Si on considère au lieu de données binaires, des données réelles comme les fréquentations fi, j

préalablement définies, alors on a un relief qui varie en tout point défini par ses coordonnées

(i, j) selon la valeur fi, j , (ensemble de valeurs représentées par la matrice [ f i, j ]).

La dilatation ou l'érosion binaire peut être généralisée aux paramètres évoluant sur un éventail

de données 598 comme les fréquentations fi, j : dans la transformation d'érosion, la valeur de chaque point est remplacée par la valeur la plus basse l'entourant à moins qu'elle n'ait la valeur la plus élevée parmi tous ses voisins. La dilatation est définie de la même manière, suivant le principe qu'une dilatation d'une forme est l'érosion de son complémentaire. Appliquée à de telles données, la dilatation a tendance à élargir les vallées et à abaisser les pics.

Fig. 3.24 - En Noir: La Courbe Originale / En Gris: a courbe transformée par dilatation

598 CHERMANT J.L. et COSTER M. (1989) Précis d'Analyse d'Images, Presses du CNRS.

Fig. 3.25 - En Noir: La Courbe Originale / En Gris: la courbe transformée par dilatation

Les régions à valeurs maximales ont tendance à élargir leur surface et les régions à valeurs minimales décroissent. Dans le cas de l'érosion, les vallées sont élargies et les pics sont abaissés:

Fig. 3.26 - En Noir: La Courbe Originale / En Gris: la courbe transformée par érosion

Les régions à valeurs minimales ont tendance à élargir leur surface et les régions à valeurs maximales décroissent.

La transformation morphologique de fermeture combine la dilatation et l'érosion (remplit les

vallées sans transformer les pics).

Fig. 3.27 - En Noir: la courbe originale / En Gris: la courbe transformée par fermeture

On peut citer aussi la transformation morphologique d'ouverture qui est la succession, dans

cet ordre, d'une érosion et d'une dilatation de même taille. Enfin, la transformation morphologique du "chapeau haut-de-forme" est la soustraction des données de la matrice initiale [f i, j] aux données de la matrice fermée [f T i, j]. Elle constitue un filtre morphologique

qui met donc en évidence les contours. Un exemple à la fin de ce paragraphe montre son

utilisation pour délimiter les frontières d'une zone de chalandise.

Fig. 3.28 - En Noir: la courbe originale / En Gris: la courbe transformée par chapeau haut-de-Forme

La matrice résultat est faite de données binaires correspondant à une valeur de 1 si l'élément

de matrice appartient à la frontière, et inversement à une valeur nulle.

· Amincissement et régularisation de la frontière de la zone de chalandise

Les éléments binaires appartenant à la frontière de la zone de chalandise sont amincis. Ceci signifie que pour un ensemble d'éléments caractérisant la frontière, seul l'élément moyen représentatif de cette frontière est maintenu dans la matrice tandis que les autres éléments sont mis à 0.

Les points qui ont été calculés lors de la dernière étape sont liés par les courbes régulières de Bézier: considérons une suite de n+1 points du plan: {Pi = (xi ,yi) } / i = 0 to n}, qui définit un polygone à n côtés appelés polygone de commande. On appelle approximation de Bernstein-

Bézier de cet ensemble de points 599, la courbe paramétrée par:

Nous avons pris n = 3 et obtenu des courbes dites cubiques: les courbes cubiques sont définies

en utilisant quatre points, deux points situés aux deux extrémités de la courbe, et les deux autres sur les deux tangentes exerçant dans une certaine mesure une attraction sur la courbe.

Fig. 3.29 - Les 2 points et les 2 tangentes définissant une courbe de Bézier cubique

Soient t un nombre entre 0 et 1, et p(t) un point non spécifié de la courbe. Lorsque t varie de 0

à 1, on obtient l'ensemble des points qui constituent la courbe. Voici les équations qui permettent de définir la courbe:

Le polynôme p(t) = ap t 3 + bp t ² + cp t + p0

599 LANE J.M. et RIESENFELF R.F. (janvier 1980) A Theoretical Development for the Computer Generation and display of Piecewise Polynomial Surfaces, IEEE Trans. on PAMI, Vol. PAMI-2, No 1, p. 35-46.

où t [0, 1]

et ses coefficients:

p1 = p0 + cp / 3

p2 = p1 + (cp + bp) / 3

p3 = p0 + cp + bp + ap

L'exemple concret suivant de délimitation morphologique reprend le cas de clients virtuels abordé au chapitre précédent avec en premier lieu une cartographie des clients associés à leurs fréquentations d'un point de vente suivi de deux filtres Nagao (voir paragraphe 2.6.2.1).

Fig. 3.30 - Adresses clients associées aux fréquentations Fig. 3.31 - suivies de deux filtres Nagao,

Fig. 3.32 - puis une dilatation, Fig. 3.33 - ensuite une érosion

(transformation de fermeture),

Fig. 3.34 - Une soustraction par rapport Fig. 3.35 - Enfin un amincissement

à l'image filtrée du début (transformation et une régularisation, des contours chapeau haut-de-forme) (grâce aux courbes de Bézier)

A la suite de ces délimitations de zones de chalandise, il convient de construire le modèle p-

médian avant de le résoudre ce qui signifie au minimum, définir les noeuds du réseau (noeuds constitués par les centres de gravité de chacune des aires formant la zone de chalandise) et quantifier la demande associée à chaque noeud. La construction de ce réseau est ainsi l'objet

de notre prochain paragraphe.

3.3 La construction du modèle p-médian : détermination des centres de gravité, distances et pondérations du modèle p-médian

La délimitation de la zone de chalandise a mis en évidence les diverses régions de l'espace concentrant un grand nombre de clients. Pour déterminer les coordonnées des centres de gravité de ces régions (futurs noeuds du modèle) et procéder à une analyse en profondeur des caractéristiques de la clientèle (demandes du modèle), il s'agit auparavant de définir analytiquement ces régions, c'est-à-dire de préférence par les coordonnées de leurs contours. Connaître d'une manière rationnelle les frontières des régions formant la zone de chalandise nous permettra de calculer la position de leurs centres de gravité, futurs noeuds du modèle p- médian. L'autre intérêt est de déterminer l'étendue de ces régions dans lesquelles la densité de

clients est forte et de même niveau, afin d'évaluer le niveau de la demande dans chacune de

ces aires (demande associée à chaque noeud du futur modèle p-médian).

Plus précisément, les frontières des régions géographiques peuvent être définies par différents types de coordonnées comme la succession des coordonnées, le code de Freeman, le code hexagonal ou les points essentiels.

· la succession des coordonnées

La succession des coordonnées (i, j ) des points de la frontière linéique s'obtient en parcourant

la frontière dans un sens ou dans l'autre. Ce codage a l'inconvénient de nécessiter un grand nombre de données (2 x Nf, où Nf est le nombre de points de la frontière).

· le code de Freeman 600

On décrit en partant d'un point de la frontière et en la parcourant dans un sens de convention,

les différentes orientations prises par la courbe (vecteurs successifs), soit en général 8 orientations : N(nord), NE (nord-est), NO (nord-ouest), O (ouest), SO (sud-ouest), S (sud), SE (sud-est), E (est) ou bien avec moins de précision seulement 4 : N (nord), O (ouest), S (sud), E (est). Ce type de codage ne nécessite que Nf + 2 données distinctes (incluant les coordonnées

du point de départ, chaque élément directionnel du codage n'étant représenté que par un nombre restreint de bits, 4 ou 8).

· le code hexagonal (dans le cas d'une matrice [de points images] hexagonale)

Le contour est décrit par le point de départ et 3 directions (comme pour le code de Freeman)

mais on simplifie en n'indiquant que la direction d'orientation du segment courant par rapport

au précédent en parcourant la courbe selon un sens de convention. Le nombre de bits nécessaire au codage descend à 2 et nécessite le même nombre de données distinctes que le code de Freeman.

Fig. 3.36 - Exemple de Codage Hexagonal

600 FREEMAN H. (1970) Boundary Encoding and Processing in Picture and Processing and Psychopictrorics, Lipkin B.S. and Rosenfeld A., Academic Press, New York, p. 241-266.

G=direction gauche et D=direction droite par rapport au segment précédent

· les points essentiels

On cherche alors à minimiser le nombre de points de description en approximant le contour

par une courbe enveloppante continue et dérivable (familles de fonctions B-splines). Ce principe est surtout utilisé dans les logiciels de CAO.

Comment connaître les coordonnées des points formant les frontières de la zone de chalandise par l'algorithme de description ?

La procédure de segmentation précédente a, comme on l'a souligné, permis d'identifier des points P(i, j) connexes formant des zones d'équi-fréquence. La réunion de ces différentes zones constitue l'ensemble de la zone de chalandise. Un algorithme de description simple permet d'extraire les coordonnées de la frontière de la zone de chalandise à partir de la fonction caractéristique à l'étape précédente de délimitation. En effet, pour chaque zone de chalandise Z, on peut définir une fonction caractéristique fZ (i, j) telle que:

P(i, j) Z , fZ (i, j) = 1 et P(i, j) Z , fZ (i, j) = 0

Cette fonction permet de toujours savoir si on est à l'intérieur ou à l'extérieur de la zone. On applique maintenant l'algorithme de suivi de contour:

1) On balaye la matrice fZ (i, j) de la fonction caractéristique ligne par ligne jusqu'à atteindre

le point P'(i', j'), le plus haut de la zone Z :

Fig. 3.37 - Exemple de parcours d'une forme à l'aide de l'algorithme

destiné à extraire les coordonnées du contour

2) Si on est en un point situé à l'intérieur de la zone Z, [fZ (i, j) = 1] , tourner à droite puis

avancer d'un cran dans cette direction (d'une colonne ou d'une ligne).

3) Si on se trouve en un point situé à l'extérieur de la zone Z, [fZ (i, j) = 0] , tourner à gauche puis avancer d'un cran dans cette direction (d'une colonne ou d'une ligne).

4) Interrompre l'algorithme dès que l'on atteint à nouveau le point de départ.

Fig. 3.38 - Exemple de parcours de frontière de zone de chalandise à l'aide de l'algorithme

On enregistre ainsi les directions successives prises par l'algorithme de suivi ce qui donne une description du contour sous la forme d'une chaîne ascii en codes de Freeman :

[ E,S,E,S,O,S,O,S,E,S,E,N,E,N,E,S,E,N,E,S,E,N,O,N,E,N,O,S,O,N,E,N,O,S,O,N,O,S,O,N,E,N,O,S,O ]

Ce codage a aussi le grand avantage de pouvoir tout de suite déterminer très simplement la surface géographique Sg de la zone de chalandise par l'algorithme suivant en supposant que la chaîne en code de Freeman s'écrive [a1, a2,...ai,...,an] :

1) Au départ; u = 0 et t =0

2) De i = 1 à n Faire

A) Si ai = Nord Alors t = t + 1 Sinon Aller en B)

B) Si ai = Sud

Alors

u =

u + t

Sinon Aller en C)

C) Si ai = Ouest

Alors

t =

t - 1

Sinon Aller en D)

D) Si ai = Est Alors u = u - t

3) Sg = u x S

où la valeur du paramètre u à la fin de la procédure est le nombre de points contenus dans la zone de chalandise considérée, t un paramètre de comptage et S la superficie géographique unitaire d'un point.

Comment calculer les coordonnées des centres de gravité des aires de chalandise ?

Les coordonnées des contours des aires délimitées vont nous permettre d'accéder simplement aux coordonnées des centres de gravité des différentes aires constitutives de la zone de chalandise globale. Le repérage de ces centres de gravité correspondant aux futurs noeuds du modèle p-médian dans notre algorithme, donnera aussi par un simple calcul de longueur, les distances de chaque segment du réseau (de plus, si la zone de chalandise est très fragmentée et pas du tout rassemblée, la moyenne des distances entre les centres de gravité fournira une mesure de l'éloignement des noeuds). Une question basique que l'on peut se poser est de savoir pourquoi, dans la recherche d'une localisation optimale unique à partir de l'adresses de clients,

on ne procèderait pas directement au calcul du centre de gravité (localisation moyenne) par rapport à ces mêmes clients pour choisir un emplacement bien centré de son futur site. Considérons la cartographie suivante qui montre un ensemble de clients potentiels représentés

par des points (voir figure 3.39). Le centre de gravité de la totalité des clients est au point J, en pleine campagne. On remarque que J est très éloigné de l'ensemble majoritaire des clients de

l'agglomération rassemblés dans le cercle et donc du potentiel commercial le plus intéressant.

Fig. 3.39 - Ensemble de clients potentiels représentés par des points

Le fait de pratiquer un filtrage, par exemple médian, et de délimiter la zone de chalandise (zone dense de clients) permet de ne prendre en compte que les régions ayant un potentiel commercial suffisant. L'analyse de localisation fait donc abstraction de tous les clients "saupoudrés" dans l'espace et dont la prise en compte risque de perturber les calculs. On voit

sur la cartographie suivante la zone de chalandise principale délimitée par filtrage: le centre

de gravité est bien centré sur cette zone à potentiel et non plus décalé en pleine campagne

(voir figure 3.40).

Fig. 3.40 - Centre de gravité d'une zone de chalandise délimitée

Le centre de gravité convient donc bien pour représenter la position moyenne d'une entité dans l'espace en l'occurrence ici la position de l'agglomération (centre d'un futur noeud du p- médian), mais celui-ci n'est pas compatible avec les contraintes du modèle p-médian pour déterminer une localisation optimale. D'autre part, au niveau régional ou national, il est plus significatif de comparer entre eux les centres de gravité des aires mises en évidence par le processus de délimitation que les centres de gravité calculés sur l'ensemble des points appartenant aux aires (localisation moyenne des clients). Le centre de gravité d'une aire est en effet théoriquement le point à partir duquel on parcourt la distance la plus courte en moyenne

pour l'atteindre à partir de tous les autres points de l'aire (point le plus accessible). L'aire est,

on le rappelle, constituée d'une masse de clients de densité homogène obtenue par lissage (filtrage). Le centre de gravité de l'aire qui circonscrit l'esnsemble des clients ne correspond pas forcément à la moyenne des localisations des clients (voir figure 3.41). Prendre un tel centre de gravité des adresses des clients au lieu de celui de la surface de l'aire totale revient aussi à ne pas tenir compte de ce lissage destiné à éliminer une partie des erreurs d'enquête (adresses manquantes ou fausses adresses, clients ayant déménagé).

Fig. 3.41 - Les centres des aires et ceux des points appartenant à ces mêmes aires

Le centre de gravité des aires est également très intéressant dans le cas de desserte de transport interurbaine qu'il s'agisse de transport de voyageurs (gare Sncf ou gare routière) ou

de transport de marchandises (entrepôt) : on cherche en effet le point le plus central possible

au sein d'une aire pour implanter un entrepôt destiné à recevoir des marchandises de gros, entrepôt à partir duquel on effectuera des livraisons au détail vers des clients situés en périphérie de ce centre local de distribution.

Le repérage du centre de gravité au niveau global sur un ensemble d'adresses clients ne permet d'obtenir qu'une position moyenne pour une localisation sans tenir compte des barrières naturelles ou des sites géographiquement inaccessibles. En outre, cette méthode est complètement inadaptée à la recherche de localisations multiples.

Ayant déterminé précédemment les coordonnées des points décrivant la frontière de la zone

de chalandise, les coordonnées de son centre de gravité seront tout simplement la moyenne

des coordonnées de ces points de contour.

Cependant, d'une manière plus générale, le centre de gravité G d'une zone Z composée de n points clients P1, ..., Pn auxquels sont affectées des fréquentations (ou une demande) f1, ..., fn

est tel que :

n

[ fu GPu] = 0

u=1

Considérons la fonction caractéristique fZ (i, j) de la zone de chalandise Z, préalablement

définie par:

P(i, j) Z , fZ (i, j) = 1 et P(i, j) Z , fZ (i, j) = 0

Pour déterminer G le plus simplement possible sur un espace de valeurs discrètes, l'expression

de la fréquentation étant alors sous la forme f(i, j) pour un point P de coordonnées P(i, j), on utilisera la relation:

m p

[fz(i, j) f(i, j) GPij] = 0

i =1

j =1

Avec m, le nombre de lignes de la matrice des fréquentations associées à l'espace

géographique 2D considéré et p son nombre de colonnes.

A noter que comme dans chaque aire, la fréquentation est environ la même (f(i, j) =

constante), l'équation précédente se réduit à:

p

m [fz(i, j)

GPij ] = 0

i = 1 j = 1

Comment déterminer les distances entre les noeuds du modèle p-médian ?

Les distances des segments du modèle p-médian reliant noeuds ou centres de gravité des zones sont calculées soit en utilisant la distance euclidienne classique, soit en déterminant les distances routières ou temps de parcours (par exemple à l'aide d'un logiciel comme AutorouteExpress de Microsoft), soit encore en utilisant la notion de distance psychologique

(dij - nj) introduite dans un modèle p-médian "généralisé" (voir § 2.3.1).

Comment déterminer le niveau de la demande associé à chaque noeud ?

Cette même fonction caractéristique permet en outre de fournir les propriétés marketing ou socio-économiques liées aux zones et donc d'obtenir le niveau de demande dans chaque zone (demandes dans le modèle p-médian pondéré): soit V une variable dont la valeur évolue dans l'espace total de la zone de chalandise. V est donc fonction du point P(i,j) de l'espace géographique et s'écrit V(i,j). La variable V peut être simplement le chiffre d'affaires escompté dans la zone pour un produit ou un service spécifique (niveau de la demande), une variable socio-économique (taux de possession d'un véhicule, PCS, pouvoir d'achat moyen), une mesure de la contribution locale à la performance (fréquentation comme dans l'exemple

qui suit, chiffre d'affaires ou bénéfices perçus par des clients en P(i,j)), un paramètre environnemental (densité de la concurrence en P, places de parking, circulation automobile),... Pour connaître la valeur de V à l'intérieur d'une zone soit en somme, soit en moyenne, on utilise encore la fonction caractéristique fZ(i, j). Pour une variable V(i, j) à sommer comme

par exemple le nombre de places de parking dans la zone Z ou le chiffre d'affaires tiré de la

zone Z, on aura Vz, la somme des V(i, j) sur l'ensemble de la zone Z comme étant:

m p

Vz =

[f z (i, j)

i = 1 j = 1

V(i, j) ]

Pour une variable V(i, j) à étudier en valeur moyenne comme par exemple le pouvoir d'achat

moyen dans la zone Z, on aura pour expression de Vz, la moyenne des V(i, j) sur l'ensemble

de la zone Z:

m p

[f Z (i, j)

i =1 j =1

V(i, j) ]

VZ = m p

[f z (i, j) ]

i =1 j =1

Considérons la variable N(i, j) représentant le nombre de clients en chaque point P(i,j). Alors

le pourcentage de clients contenu dans la zone de chalandise à forte densité de clientèle par rapport au nombre de clients total, est donné par:

p

Z

m [f

(i, j) N(i, j) ]

i =1 j =1

m

p

[N(i, j) ]

100

i =1 j =1

Si la zone de chalandise Z est morcelée en plusieurs aires Z1,...Zh, il suffit de faire le calcul

sur chaque région et de sommer pour avoir le pourcentage total, une alternative étant de définir la fonction caractéristique réunissant toutes ces régions.

3.4 Approches stratégiques de la localisation

Les techniques de localisation peuvent être introduites pour élaborer de véritables stratégies

de développement au niveau de réseaux de magasins. Dans un contexte favorable et avec à l'esprit une stratégie spatiale bien définie, un réseau de distribution en croissance cherchera à s'étendre par addition de nouveaux points de vente 601. La recherche de croissance par simple accroissement de la surface commerciale de magasins existants est en effet bien vite limitée et

601 MERCURIO J. (1984) Store Location Strategies, dans Store Location and Store Assessment Research cité par

CLIQUET G. dans Valeur Spatiale des Réseaux et Stratégies d'Acquisition des Firmes de Distribution, in

Valeur, Marché et Organisation, Ed. J-P. Brechet, Presses Académiques de l'Ouest.

modifie d'autre part le concept initial et éventuellement porteur du magasin dont la taille est l'un des éléments. Outre un pouvoir de négociation accru vis-à-vis des producteurs, une extension d'un réseau de points de vente apporte une meilleure couverture géographique. Cette couverture géographique est en effet importante car, agissant comme un phare, elle permet aux consommateurs de repérer leur enseigne en tous points du territoire et les producteurs de voir en elle un moyen d'écouler en plus grandes quantités leurs produits et de réaliser des bénéfices accrus. Cliquet a effectué un état de l'art des différents types de

stratégies spatiales et de leur classification602. Six stratégies principales sont offertes aux

distributeurs pour croître, dont les trois premières seulement mettent en scène la problématique de localisation spatiale 603:

1) Conquérir de nouvelles aires de marché par ouvertures de nouveaux points de vente, mais

en conservant l'assortiment existant. Ce scénario augmente la couverture spatiale du réseau,

2) Etendre son réseau dans des aires de marché déjà occupées toujours en conservant son choix de marchandises,

3) Conquérir de nouvelles aires de marché en ouvrant et en diversifiant ses nouveaux points

de vente avec un nouvel assortiment,

4) Ouvrir de nouveaux points de vente avec de nouvelles marchandises, mais sur des aires de marché déjà conquises,

5) Augmenter sa part de marché avec les mêmes points de vente et le même assortiment,

6) Diversification en améliorant l'assortiment dans des points de vente existants.

La conquête de nouvelles aires est susceptible de se réaliser par contagion, les points de vente s'implantent alors sur un large front ou bien par diffusion hiérarchique ou par stratégie de tête

602 CLIQUET G. (1998) Valeur Spatiale des Réseaux et Stratégies d'Acquisition des Firmes de Distribution, in

Valeur, Marché et Organisation, Ed. J-P. Brechet, Presses Académiques de l'Ouest.

603 GHOSH A. et McLAFFERTY S. (1987) Location Strategies for Retail and Service Firms, Lexington Books, p.10.

de pont604. Les points de vente s'implantent alors dans les villes principales puis dans les villes de moindre importance comme le décrit la théorie des places centrales605. Par analogie avec le monde animal, un autre classement des types de stratégies distingue l'évitement dans

l'esprit du principe de différenciation minimale de Hotelling (voir § 2.1.4) qui consiste à s'installer loin des concurrents, la recherche de concurrents et en particulier la prédation qui

au contraire recherche l'affrontement souvent par une guerre des prix en visant la proximité

des compétiteurs 606. Davidson, Sweeney et Stampfl utilisent la méthode d'analyse de portefeuille (décriée par certains auteurs - voir § 2.2.3) en croisant les décisions sur les points

de vente, sur les aires de marché et sur les segments de consommateurs à privilégier et dégagent trois grandes catégories de stratégies 607 :

1) la stratégie d'expansion de marché, par contagion, établissement de têtes de ponts, constitution de grappes et recyclage de sites et l'acquisition de sites concurrents ;

2) la stratégie de remplissage : on conforte les positions acquises en agrandissant les points

de vente, en conquérant des marchés secondaires et également comme précédemment, en prenant le contrôle de sites concurrents ;

3) le downsizing : les performances sont améliorées en réorganisant le réseau par la fermeture des points de vente à la traîne et en en relocalisant d'autres ainsi qu'en revoyant le mix produit.

Le choix d'une stratégie spatiale particulière est dicté par le niveau d'ambition du réseau qui,

si elle est internationale ou même nationale, nécessite l'établissement de têtes de pont avec éventuellement des hiérarchies d'implantation à respecter. Un niveau d'ambition modeste avec une volonté régionale uniquement ne nécessitera qu'une stratégie de diffusion par contagion. D'une manière générale, les stratégies spatiales se découpent simplement en deux grandes

604 LAULAJAINEN R. (1987) Spatial Strategies in Retailing, Dordrecht, Holland, Reidel.

605 CHRISTALLER W. (1935) Die Zentralen Orte in Süddeutschland, G.Fischer, Germany, Jena.

606 BROWN S. (1992) Retail Location : A Micro-Scale Perpective, Aldershot : Avebury, p.170-171

607 DAVIDSON W.R., SWEENEY D.J. et STAMPFL R.W. (1988) Retailing Management, 6th Ed., New York : Wiley, cité par Cliquet G. dans Valeur Spatiale des Réseaux et Stratégies d'Acquisition des Firmes de

Distribution, in Valeur, Marché et Organisation, Ed. J-P. Brechet, Presses Académiques de l'Ouest, p.234.

catégories, les stratégies de développement externe où le développement passe par l'absorption d'autres chaînes ou par la coopération avec les concurrents pour l'ouverture de centrales d'achat ou de référencements communs et d'un autre côté, les stratégies de développement interne608.

Cette variété de stratégies peut s'observer effectivement sur le terrain. Le centre d'étude de

l'activité commerciale (Centre for the Study of Commercial Activity) au Canada a réalisé une étude à l'été 2000 sur les orientations stratégiques pressenties auprès d'un échantillon de 475 décideurs, en majorité présidents et directeurs généraux appartenant à 226 réseaux de distribution canadien 609 représentant 32000 points de vente de l'alimentation, l'habillement,

de l'équipement ménager et de grands magasins plus généralement (voir figure ci-dessous).

Arrivent en tête des décisions que ces responsables envisagent pour environ 80 % d'entre eux,

la modernisation et la rénovation des points de vente (refurnishment), la relocalisation (relocation) puis l'extension des réseaux de distribution et de façon moindre le changement d'enseigne. L'extension du réseau de points de vente est envisagée en majorité par l'ouverture

de nouvelles surfaces pour 74 % des décideurs (opening an established format) ou de façon accessoire par l'acquisition d'un groupe de points de vente appartenant à un autre réseau pour

35 % d'entre eux. Enfin, 10 % des décideurs pensent à fermer des points de vente.

608 CLIQUET G. (1998) Valeur Spatiale des Réseaux et Stratégies d'Acquisition des Firmes de Distribution, in

Valeur, Marché et Organisation, Ed. J-P. Brechet, Presses Académiques de l'Ouest.

609 HERNADEZ T., BIASIOTTO M. (2001) The Survey of Corporate Planning : Summary Findings, Research

Letter 2001-2, Centre for the Study of Commercial Activity, p.1-8.

Fig. 3.42 - Type de Décisions prise par les décideurs dans un avenir proche pour leur réseau de distribution610

Cette enquête a montré également que 40 décisions impliquant la notion de localisation étaient prises par an dans chaque réseau comptant en moyenne 437 magasins.

Les décisions impliquant la localisation des points de vente tournent d'une manière générale autour de:

- la création pure d'un réseau de points de vente ;

- l'extension d'un réseau par création de nouveaux points de vente ;

- l'extension d'un réseau par acquisition de points de vente concurrents ;

- la relocalisation de points de vente ;

- la suppression de points de vente.

Ces décisions ne sont pas, comme on l'a vu, forcément contradictoires entre elles. On peut par exemple envisager l'extension d'un réseau tout en supprimant certains points de vente et en relocalisant d'autres. D'autre part, nous avons vu en introduction que les réseaux peuvent adopter une organisation différente, en franchises pour bénéficier d'une réactivité plus élevée

610 HERNADEZ T., BIASIOTTO M. (2001) The Survey of Corporate Planning : Summary Findings, Research

Letter 2001-2, Centre for the Study of Commercial Activity, p.2.

et une connaissance du marché plus fine au niveau local 611 612, en succursales pour asseoir le contrôle du franchiseur sur son réseau ou bien sous forme mixte associant les deux types d'établissements. Cette dernière forme d'organisation présente un intérêt indéniable pour accroître la souplesse stratégique de l'ensemble pour faciliter l'acquisition de nouveaux points

de vente en proposant aux propriétaires différentes formules de rachat ou de franchise ainsi que pour animer le réseau en bénéficiant des efforts d'innovation et de promotion des deux catégories d'établissements commerciaux 613. Le point important qui nous concerne est surtout que cette organisation mixte permet de trouver un compromis entre le développement

du réseau et l'assimilation du concept du groupe. Ainsi, le développement du réseau peut se faire assez rapidement et à moindre prix par la création de franchises alors que les filiales plus sous contrôle permettent de mailler le territoire tout en assimilant graduellement le concept.

Le choix de tel ou tel type d'organisation dépend plus des vues stratégiques du manager et de l'activité commerciale considérée. La méthode associant modèle p-médian et traitement du signal pourra, après avoir délimité la zone de chalandise, spécifier la localisation idéale des points de vente et hiérarchiser l'intérêt des différents sites. Mais, ce n'est qu'au cas par cas et selon les moyens financiers du groupe que l'on pourra décider de la configuration en succursalisme, franchise ou de bâtir un réseau mixte. Sans doute, les sites sans trop de risques liés à la concurrence ou à l'environnement, établis depuis longue date et qui peuvent ainsi contribuer majoritairement à l'amélioration des résultats financiers tout en structurant le réseau, bénéficieront plus facilement de la structure en succursales ce qui leur permettra d'assimiler plus aisément l'identité du groupe. Une identité commune au réseau facilite et

fluidifie en effet les efforts de promotion et de communication vis-à-vis de l'extérieur. Elle

611 BRICKLEY J.A., DARK F.H. (1987) The Choice of Organizational Form : The Case of Franchising, Journal

of Financial Economics, 18, 401-20.

612 CAVES R.E. , MURPHY II W.F. (1976) Franchising : Firms, Markets, and Intangible Assets, Southern

Economic Journal, 42, 572-86.

613 CLIQUET G. (2000) Plural Form in Store Networks : A Model for Store Network Evolution, The

International Review of Retail, Distribution and Consumer Research, vol. 10, n°4, pp 369-387.

constitue en quelque sorte un signe de ralliement pour une masse de clients fidèles ou potentiels qui chercheront alors à fréquenter les points de vente du réseau où qu'ils soient. La structure en franchise conviendrait sans doute mieux à des implantations récentes, plus risquées où il s'agit d'avoir une grande capacité d'innovation pour s'adapter au marché local. Les managers des franchises à l'esprit entrepreneurial, sans doute plus motivés car plus responsables de leur affaire, défricheront en pionniers les territoires non encore conquis et plus en proie à la concurrence. Une plus grande marge de manoeuvre dans le marketing et la gestion souple quotidienne du point de vente leur sera nécessaire pour conforter la position du groupe dans ces régions. A plus long terme, ces franchises pourront éventuellement être converties en succursales de manière à renforcer globalement le concept du groupe et pour transformer une simple chaîne de points de vente en "un dispositif de forme éclatée permettant de mettre en oeuvre simultanément en plusieurs endroits un ensemble d'actions

avec une adaptation souple sur le terrain"614.

L'ouverture ou la réorganisation d'une chaîne de points de vente est un art difficile qui consiste, comme on l'a vu, à choisir au mieux le nombre et la localisation des magasins ainsi que leur type d'organisation (en succursales, en franchises ou mixte). Mais une stratégie d'implantation peut être beaucoup plus élaborée, sans se limiter à ces deux paramètres. Ainsi, faut-il par exemple ouvrir tous les points de vente en même temps ou bien adopter un ordre séquentiel de création judicieusement conçu ? Nous avons d'autre part sous-entendu lors de la construction du modèle p-médian précédent, que les points de vente devaient se situer au plus proche des clients, d'autres paramètres liés à la notion de distance méritent d'être examinés. Certes le modèle p-médian peut incorporer un coût d'ouverture des activités en chacun des différents noeuds du réseau correspondant. Mais d'un autre côté, les modèles de localisation- allocation prennent d'une manière générale l'hypothèse, on l'a dit au début de cet exposé, que

614 BOULANGER P., PERELMAN G. (1990) Le réseau et l'Infini, Nathan, Paris, Cité par Cliquet G. dans

CLIQUET G. (2000) Plural Form in Store Networks : A Model for Store Network Evolution, The

International Review of Retail, Distribution and Consumer Research, vol. 10, n°4, pp 369-387.

le futur site du point de vente que l'on cherche à implanter devra se situer au plus près de clients potentiels. Une manière d'aborder le problème consiste à localiser ses points de vente non seulement par rapport aux clients, mais aussi par rapport à la concurrence. La stratégie d'évitement 615 décrite précédemment privilégiera dans les choix de localisation les zones encore peu exploitées par la concurrence. Sur le plan stratégique, on se situe alors dans la première étape du principe de différenciation minimale correspondant à la phase primaire

d'implantation d'une activité dans un territoire vierge de concurrence (voir §2.1.4). Notre méthode est tout à fait apte à cerner de telles régions qui, si elles s'avèrent comporter un fort potentiel de clients, constituent des mines d'or sur le plan commercial. S'installer en un lieu à

la fois riche en clientèle et dépourvu de concurrence est un avantage stratégique indéniable que les compétiteurs surmonteront sans doute (phase 2 du principe de différenciation minimale616), mais au bout seulement d'un certain temps. Nous nous proposons de décrire dans le prochain paragraphe comment développer cette stratégie d'évitement à partir de la méthode associant traitement du signal et modèle p-médian.

3.4.1 La stratégie d'évitement ou rechercher les zones non exploitées par la concurrence

Considérons l'exemple où la première carte représente cette fois l'ensemble de ces magasins associés à leur chiffre d'affaires sur un territoire vaste (région, pays) et que la deuxième

représente la même cartographie mais filtrée par deux filtres Nagao :

615 BROWN S. (1992) Retail Location : A Micro-Scale Perpective, Aldershot : Avebury, p.170-171

616 Source : BROWN S. (1992) Retail Location : A Micro-scale Perspective, Ashgate, England.

Fig. 3.43- Adresses de magasins associées à leur chiffre d'affaires, Fig. 3.44 - suivies de deux filtres Nagao

Dans ce cas, pour trouver la localisation la plus éloignée et remplir les trous ou interstices de zones non encore exploitées, il suffira de considérer la cartographie "inverse" (c'est-à-dire celle obtenue en prenant pour nouvelle valeur en chaque point la valeur maximale représentée retranchée de la valeur actuelle du point: Vmax - Vactuelle = Vnouvelle valeur). On obtient alors en reprenant l'exemple précédent les figures 3.45 et 3.46 :

Fig. 3.45 - Cartographie inverse, Fig. 3.46 - Cartographie inverse filtrée par deux filtres Nagao

En procédant à une délimitation par transformation morphologique, on obtient la figure 3.47 :

Fig. 3.47 - Délimitation des zones vides de concurrence

Les zones vides où la concurrence est rare sont bien délimitées. Il faut néanmoins prendre garde aux effets de bords: la cartographie, mal ajustée, a ici coupé des zones vides en limite

de représentation ce qui fait que celles-ci sont limitées par des segments rectilignes (voir dessin ci-dessus). D'autre part, certaines zones vides d'activités (ou à faible nombre d'activités) ne correspondent peut-être pas à des zones d'implantation possibles pour un point

de vente mais à des barrières naturelles (bois, lac, rivière, aéroport) qu'il s'agit d'identifier. Cette dernière approche reprend en fait la théorie des secteurs proximaux (voir § 2.1.1) qui cherchait à cibler les lacunes spatiales au niveau desquelles résident des opportunités d'implantation (zones dépourvues de concurrence). Dans cette perspective, il est intéressant de comparer les deux approches à savoir la délimitation des zones de chalandise (à forte densité

de clients) et la délimitation de zones vides (à faible densité de concurrents) pour sélectionner

les régions cumulant les deux avantages.

3.4.2 La recherche de concurrents ou la prédation

Certaines activités ont cependant au contraire tendance à se regrouper pour augmenter leur pouvoir d'attractivité dans une stratégie de recherche de concurrents ou pour se lancer dans un affrontement direct par exemple à travers une guerre des prix dans l'optique d'une stratégie de prédation 617 618 619. Il sera alors intéressant de délimiter les zones de chalandise de clients potentiels pour rechercher les emplacements qui leur sont les plus proches et en parallèle, de délimiter les zones d'implantations de concurrents pour également détecter les régions géographiques où ceux-ci ont tendance à se concentrer pour également s'en rapprocher le plus possible. La démarche cherchera alors à être à la fois proche des clients et proche des concurrents en procédant à une délimitation à la fois des zones de chalandise et des zones

commerciales du secteur. Dans la pratique cependant, au niveau local, les concurrents ne sont

617 HOTELLING H. (1929) Stability in Competition, The Economic Journal, vol. 39, p. 41-57.

618 DELOZIER M.W. et LEWISON D.M. (1986) Retailing, 2nd ed., Merill.

619 BROWN S. (1992) Retail Location : A Micro-Scale Perpective, Aldershot : Avebury, p.170-171

pas en général suffisamment nombreux pour pouvoir clairement définir par traitement du signal les zones de leur implantation. On cherchera, dans ce cas, à sélectionner par simple examen les emplacements de préférence à proximité des regroupements de concurrents. L'identification des zones de concurrence peut être intéressante dans le cadre d'une stratégie

de recherche de concurrents parfois aussi car ces zones d'implantation sont révélatrices d'une activité florissante du secteur et sont donc porteuses commercialement. C'est en particulier le

cas dans la filière du tourisme (hébergement, restauration, centres de loisirs). Par exemple, un terrain de camping souhaitant accueillir une clientèle de touristes n'aura pas intérêt à s'installer dans les régions à fortes populations puisque durant les saisons touristiques, celles-ci migrent vers d'autres lieux. Géocoder les implantations de campings et délimiter leurs régions d'installation comme nous l'avons fait ci-dessous, paraît dans ce cas assez intéressant. La même procédure s'appliquerait pour une stratégie de prédation.

Fig. 3.48 - Représentation des campings sur le territoire national par des points Source des données : CD Stratégie & Localisation de J.Baray et Société Articque Géocodage par Logiciel Carte & Données d'Articque

Fig. 3.49 - Délimitation des zones d'implantation de campings par filtre Sobel

Fig. 3.50 - Numérotation des zones d'implantation de campings

Après avoir délimité les zones d'activité par traitement du signal (filtre Sobel), nous avons identifié 16 zones d'implantation principale de campings qui correspondent chacune à des zones touristiques comme la logique le veut, souvent à proximité du bord de mer: Côte d'Azur, côte vendéenne, Bretagne, Bouches du Rhône, Pyrénées Orientales,... Il convient donc

de rechercher pour un camping touristique une implantation au sein même de l'une de ces zones denses en concurrents en évitant tout de même les régions saturées en offre. Une approche encore meilleure serait d'établir ce même type de carte sur plusieurs années et de cibler les zones d'implantation de camping en développement (ayant un nombre de concurrents en croissance ou s'étendant) et d'éviter celles ayant tendance à régresser.

3.4.3 Stratégie d'ouverture des points de vente

Un réseau de points de vente peut adopter différentes stratégies d'ouverture, en se déployant rapidement sur un territoire ou bien en créant ses magasins, tour à tour, selon un ordre bien déterminé. Les modèles de localisation multiple de points de vente ont longtemps passé sous silence les effets des délais d'ouverture. Il est rare qu'une société décide l'ouverture simultanée

de plusieurs magasins que ce soit pour des raisons de budget ou même par souci de prudence afin de mesurer le succès des premières créations initiales sur un marché donné et de se conforter dans l'idée dans lancer d'autres ultérieurement. Ceci dit, dans le choix même des localisations, il est possible soit de sélectionner les meilleures localisations de manière itérative, soit de chercher à implanter un réseau de manière globale. Dans le premier cas, le décideur identifiera une première localisation optimale en essayant de maximiser le chiffre d'affaires du magasin, puis un peu plus tard va ouvrir de la même façon un certain nombre

d'autres sites en tenant compte des magasins existants et de la concurrence 620. Ce processus

se poursuivra jusqu'à ce que le marché ait atteint son point de saturation en terme d'offre. Le

620 KAUFMANN P.J., DONTHU N. et CHARLES M.B. (2000) Multi-unit Retail Site Selection Processes : Incorporating Opening Delays and Unidentified Competition, Journal of Retailing, Vol.76(1), p. 113-127

problème est qu'en suivant cette procédure, le fait de placer au départ un point de vente entre deux localisations potentiellement très intéressantes va condamner ces opportunités à moyen terme621. Il est en effet impensable pour des raisons de coût, d'ouvrir ultérieurement ces deux nouvelles surfaces commerciales après avoir fermé le magasin existant devenu inutile et sans doute non-rentable, sans avoir au minimum rentabilisé l'investissement souvent onéreux de la création de ce dernier.

Il est donc presque indispensable de choisir les sites optimaux en une étape unique 622 623 624

ce qui permet en outre d'avoir ultérieurement une meilleure couverture du marché 625. Même

s'il existe un délai d'ouverture entre les points de vente sélectionnés de cette manière globale,

le chiffre d'affaires de ces différentes entités sera en général plus équilibré et meilleur à long terme que ne le seraient des localisations déterminées séquentiellement. Dans ce dernier cas,

le premier magasin avec sa localisation très centrale par rapport au potentiel du marché aura tendance à avoir un revenu excellent alors que les magasins suivants devront se contenter des restes et seront moins performants 626. Mais si, pour différentes raisons, les délais d'ouverture entre les premiers magasins à ouvrir et les suivants doivent être longs, il est préférable d'adopter le processus séquentiel de décision afin d'amasser durant cette période les profits sur

ces premiers magasins possédant un potentiel commercial plus intéressant. Cette stratégie est également confortée par le fait que plus le délai d'ouverture est long, plus le risque que les

meilleurs emplacements soient préemptés par un concurrent est élevé 627. Kaufmann, Donthu

621 KAUFMANN P.J., DONTHU N. et CHARLES M.B. (2000) Multi-unit Retail Site Selection Processes : Incorporating Opening Delays and Unidentified Competition, Journal of Retailing, Vol.76(1), p. 113-127

622 GHOSH A., CRAIG S. (1991) Fransys : A Franchise Distribution System Location Model, Journal of

Retailing, 67, p. 466-495.

623 GOODSCHILD M.F. (1984) Ilacs : A Location-Allocation Model for Retail Site Selection, Journal of

Retailing, 60, p. 84-100.

624 ACHABAL D.D., GORR W.L. et MAHAJAN V. (1982) Multiloc : A Multiple Store Location Decision

Model, Journal of Retailing, 58, 5-24.

625 SCOTT A.J. (1971) Combinatorial Programming, Spatial Analysis and Planning, London: Methuen and

Company Limited.

626 GHOSH A., TIBREWALA (1992) Optimal Timing and Location in Competitive Markets, Geographical

Analysis, 24 (4): 317-334.

627 GHOSH A., CRAIG S. (1983) Formulating Retail Location Strategy in a Changing Environment, Journal of

Marketing, 47, p. 56-68.

et Brooks ont vérifié toutes ces hypothèses assez logiques en simulant l'implantation de deux réseaux de magasins à travers un modèle MCI 628.

3.5 Un exemple de construction d'un modèle p-médian par traitement du signal

Reprenons l'exemple du magasin avec les clients virtuels associés à leurs fréquentations du chapitre précédent :

Fig. 3.51 - Adresses clients associées aux fréquentations Fig. 3.52 - La délimitation des zones par filtres médian et Sobel

En calculant les coordonnées (X,Y) du centre de gravité et la valeur moyenne des fréquentations (ainsi que divers paramètres géométriques) de chaque aire selon les méthodes décrites ci-dessus, on obtient la cartographie avec chaque aire numérotée et les deux tableaux

de valeurs suivants (3.1 et 3.2).

628 KAUFMANN P.J., DONTHU N. et CHARLES M.B. (2000) Multi-unit Retail Site Selection Processes : Incorporating Opening Delays and Unidentified Competition, Journal of Retailing, Vol.76(1), p. 113-127

Fig. 3.53 - Numérotation des aires de chalandise

Tableau 3.1 - Paramètres géométriques des 12 aires de la zone de chalandise obtenus après délimitation

Aire

Superficie

X

Y

Périmètre

Diamètre Ds

Epaisseur De

Angle

1

346

87

9

142

24

20

138

2

110

165

6

60

13

10

49

3

156

239

4

59

18

10

175

4

194

134

37

88

19

12

129

5

124

55

41

64

13

11

53

6

143

182

45

89

17

10

31

7

1048

105

74

236

52

25

152

8

322

32

90

148

28

14

134

9

467

235

122

147

45

13

102

10

7594

70

152

1139

134

77

34

11

467

180

137

213

28

21

144

12

689

183

167

233

45

19

1

Tableau 3.2 - Paramètres marketing des 12 régions de la zone de chalandise obtenus après délimitation

Aire

Fréquentation

Moyenne

Valeur

Modale

Maximum des

Fréquentations

1

143

128

192

2

134

128

173

3

145

128

190

4

135

128

173

5

136

128

173

6

136

128

173

7

164

192

192

8

133

128

173

9

157

128

192

10

161

173

192

11

134

128

173

12

147

128

192

Les valeurs de X et de Y nous donnent les coordonnées des centres de gravité de chaque aire

de chalandise et donc les noeuds du réseau p-médian. La demande en chaque noeud peut être caractérisée soit par la fréquentation, soit par la demande globale dans l'aire égale à la fréquentation moyenne par la superficie (les fréquentations moyennes représentent les valeurs

de la fréquentation au sein des aires qui possède, par notre définition, le caractère d'avoir un niveau homogène). L'intérêt de prendre la demande globale dans l'aire comme valeur de la demande en chacun des noeuds est que celle-ci est révélatrice à la fois du niveau moyen de fréquentation dans l'aire considérée et de l'étendue de cette aire, et constitue ainsi une mesure intéressante du potentiel commercial au voisinage du centre de gravité. Il est à noter que ces fréquentations associées aux adresses des clients peuvent être les fréquentations effectives d'un point de vente ou d'un ensemble de points de vente existants dans le cas où l'on voudrait réorganiser un réseau de magasin en tirant parti de l'expérience commerciale acquise. Mais,

ces fréquentations tout aussi bien susceptibles d'être tirées d'une enquête marketing en demandant à un échantillon de clients potentiels répartis dans l'espace s'ils comptent acheter

tel ou tel produit ou service et à quel rythme. Pour caractériser la demande, nous aurions aussi

bien pu prendre en compte d'autres paramètres que les fréquentations comme le volume d'affaires ou même les bénéfices.

La dernière étape avant d'obtenir le réseau p-médian complet est de lier les noeuds en fonction

du réseau de routes existant et d'évaluer les distances kilométriques (ou de mesurer les temps

de parcours) pour évaluer les "coûts" de déplacement.

Fig. 3.54 - Le p-médian modélisé après délimitation de la zone de chalandise et calcul des centres de gravité et fréquentations moyennes. La valeur de fréquentation au sein des aires est ici prise comme valeur de la demande aux noeuds.

Ensuite, peut alors s'effectuer la résolution du modèle p-médian (simplifié) selon les méthodes existantes. En utilisant par exemple la méthode de Goldman629 (voir chapitre I) pour la recherche d'une localisation proche de l'optimale, on trouve que l'aire 7 avec sa fréquentation

de 164 est un site convenable pour l'implantation d'un magasin. En admettant que nous ne soyons pas encore satisfaits de la précision du lieu d'implantation (dans l'aire 7), notre nouvel algorithme associant le p-médian et le traitement du signal (exposé au paragraphe 4.2.1) nous

demande alors d'effectuer la même démarche au sein de cette aire 7, à savoir une délimitation

629 GOLDMAN J.L. (1971) Optimal Center Location in Simple Networks; Transportation Science 5, 212-221.

par filtrage et une analyse des intra-aires de chalandise pour constituer un nouveau réseau p-

médian plus petit occupant l'aire :

Fig. 3.55 - L'aire 7 agrandie

puis un filtrage médian (les fréquences sont très semblables):

Fig. 3.56 - L'aire 7 filtrée par un filtre médian

une délimitation par filtrage Sobel:

Fig. 3.57 - L'aire 7 délimitée par un filtre Sobel

puis un nouveau calcul de centres de gravité et une évaluation des fréquentations intra-aires:

Fig. 3.58 - Les éléments de l'aire 7 numérotés après délimitation

pour constituer le nouveau réseau p-médian:

Fig. 3.59 - Le réseau p-médian correspondant à l'aire 7

Sa résolution montre que le site commercial doit non seulement se situer dans l'aire 7 mais aussi plutôt dans la sous-aire 7.2.

3.6 Utiliser toutes les sources d'informations commerciales disponibles

L'intérêt du traitement du signal associé à un modèle de localisation-allocation tel que le p- médian réside aussi pour le manager dans les nouvelles perspectives offertes pour manipuler

de façon souple des informations de sources d'extraction variées. Les bases de données d'adresses de consommateurs potentiels construites par enquête ou déduites des modes de paiement servent comme on l'a vu, à alimenter le modèle après une phase de géocodage et de délimitation. Mais rien n'empêche non plus d'introduire des informations déjà mises en forme comme des cartes de données statistiques en format électronique ou même sur support imprimé. L'exemple suivant nous montrera qu'il est possible d'effectuer une étude d'implantation sans même passer par la fastidieuse étape de géocodage d'adresses, mais

simplement en reprenant des documents glanés au fil de ses lectures.

Exemple de l'implantation d'activités commerciales au niveau national

Le traitement du signal peut aussi s'attaquer à traiter des informations issues de sources variées comme par exemple des cartographies sur support papier, qui seront directement intégrées dans un modèle p-médian. En témoigne l'exemple de cette carte représentant des densités de population en 2000, carte publiée dans le supplément "l'atlas des régions"630 du magazine les Echos.

Une première phase consiste à acquérir l'information, c'est-à-dire à scanner le document de la même manière que précédemment. Les données d'enquête ont été saisies pour constituer une base de données, puis ont été géocodées. Le procédé consiste alors à appliquer à ces données scannées le même traitement de filtrage et de convolution par un filtre Sobel pour en extraire

les contours les plus marquants, en l'occurrence ceux des bassins de population. Cet exemple illustre bien la souplesse et la rapidité du traitement du signal qui permet d'intégrer n'importe quel document dans une logique p-médian (ou autre modèle de localisation-allocation) sans

même ici perdre de temps ou d'énergie à saisir les données !

630 LES ECHOS (2000) L'atlas des Régions Tome 1, Les Echos, réalisé en collaboration avec l'Insee.

Fig. 3.60 - Carte de France des densités de population en 2000 631

Fig. 3.61 - La carte traitée par un filtre médian, Fig. 3.62 - puis délinée par filtre Sobel

631 LES ECHOS (2000) L'atlas des Régions Tome 1, Les Echos, réalisé en collaboration avec l'Insee.

Fig. 3.63 - Les zones numérotées et analysées

Nous obtenons tout de suite les caractéristiques de bassins de population en terme de

localisation de leur centre d'inertie et de leur étendue (voir tableau 3.3). Il est à noter que nous avons pris comme exemple une carte de densité de population, mais que n'importe quelle autre carte issue d'une quelconque source électronique ou papier aurait pu convenir, cela en fonction des besoins de l'analyse.

Supposons que la France ne compte pas encore d'hypermarchés et qu'un grand groupe décide

d'y créer 10 magasins. Où faudrait-il les installer compte tenu des bassins de population ? Le

p-médian (ou plutôt 10-médian) va nous donner ici encore une fois rapidement la réponse

grâce à l'étape précédente de délimitation des zones par traitement du signal. La résolution du modèle avec les paramètres X, Y et la superficie, pour une distance limite raisonnable de parcours pour les consommateurs de 50 miles, nous apprend très rapidement que les meilleures implantations sont en : 1 (Lille-Roubaix), 6 (Paris et Région Parisienne), 9 (Strasbourg), 18 (Tours), 24 (Lyon), 33 (Bordeaux), 35 (Nice), 36 (Montpellier et la côte), 37 (Marseille et Région) et 38 (la distance maximale à parcourir est alors en théorie 645 pour une fonction objective de 10 253 440). Dans le cas où un nouvel hypermarché viendrait à s'installer, il lui faudrait se placer en 5. Les premiers hypermarchés ont en effet été créés dans

ces régions fortement peuplées à partir des années 60.

Tableau 3.3 : Les caractéristiques des 43 aires de population détectées par traitement du signal

ZONE

Superficie

X

Y

Longueur

Majeur

Mineur

Angle

1

13272

1237

168

1050

177

98

155

2

740

1373

213

163

50

19

29

3

2443

952

420

371

69

45

96

4

870

1211

409

198

58

19

63

5

2680

1706

433

308

89

38

91

6

18179

1135

531

1324

165

145

102

7

1256

733

454

245

45

35

70

8

1435

1815

448

290

68

27

174

9

4594

1951

557

528

116

51

59

10

1356

1721

556

230

51

34

133

11

753

97

599

132

49

20

13

12

875

1908

680

142

45

25

42

13

1803

518

696

225

54

42

162

14

850

810

731

143

41

27

106

15

2021

1900

749

263

65

41

126

16

922

1076

753

134

41

29

4

17

1389

1837

811

307

55

32

89

18

1132

693

845

155

39

37

68

19

1495

885

874

198

44

43

12

20

805

1710

883

165

48

21

37

21

2452

532

896

253

61

51

159

22

831

827

1041

159

42

25

104

23

1065

1780

1108

301

55

24

63

24

7045

1553

1230

606

114

79

135

25

870

1746

1186

140

43

26

117

26

1770

1273

1229

239

69

33

107

27

1046

971

1218

161

43

31

38

28

827

1717

1249

160

51

21

100

29

706

792

1259

114

37

25

27

30

2390

1475

1293

339

64

48

20

31

2627

1690

1339

443

60

56

116

32

1046

1560

1410

201

54

25

112

33

3138

669

1436

300

76

53

180

34

2633

1579

1635

334

59

57

66

35

4155

1930

1690

522

149

36

41

36

4911

1434

1705

626

168

37

36

37

8558

1685

1766

870

162

67

148

38

3642

990

1731

303

77

60

58

39

1524

1594

1725

274

61

32

71

40

1547

1315

1782

306

68

29

8

41

893

696

1788

165

37

31

146

42

906

1266

1819

189

41

29

33

43

1992

1247

1936

254

53

48

111

Fig. 3.64- Pour 10 localisations: zones de potentiel commercial associées aux points de vente en gras

(en ignorant la distance limite de parcours des 50 miles)

Il est à noter cependant qu'avec 10 hypermarchés, seulement 40,6 % de la demande est couverte. D'autre part, on s'aperçoit que, compte-tenu d'une distance limite de 50 miles que les consommateurs seraient prêts à parcourir, les hypermarchés ne couvrent en terme d'offre que leur propre aire d'implantation soit 10 aires sur 43, ces aires étant en France parmi les plus peuplées. Si cette logique d'implantation préoccupait une activité pour laquelle les consommateurs sont prêts à parcourir une plus grande distance comme par exemple celle des parcs d'attraction qui doivent aussi se placer au plus près de leurs clients, nous aurions obtenu

les mêmes résultats mais avec un taux de couverture de 100 % (en supposant que les clients soient prêts à parcourir deux cents ou trois cents kilomètres) : les zones de population sont en

effet éloignées les unes des autres ce qui ne les met pas en concurrence.

Fig. 3.65 - Distance moyenne à parcourir en fonction du nombre de magasins ouverts

(en ignorant la distance limite de parcours des 50 miles)

Conclusion

Nous avons vu dans ce chapitre que les principes du traitement du signal pouvaient être introduits dans une problématique de gestion et en particulier la recherche de localisations commerciales optimales. Dans ce cadre, nous avons présenté un nouvel algorithme composé

de quatre étapes en l'occurrence :

- une phase d'acquisition des données constituées par les adresses des clients qui seront géocodées afin d'obtenir une cartographie représentant l'ensemble des clients potentiels.

- un pré-traitement des données destiné à éliminer par un filtrage les imperfections de la base

de données d'adresses entraînées par exemple par des adresses incomplètes, de mauvaises saisies, des erreurs d'échantillonnage,.... Cette étape comprend en deuxième lieu la phase de traitement ou la mise en forme des données à proprement parler qui s'attache dans notre problématique à détecter par une convolution avec un filtre du type Sobel et un sous- algorithme, les frontières de la zone de chalandise,

- l'exploitation des résultats qui permet de spécifier les caractéristiques propres de la zone de chalandise, c'est-à-dire les paramètres géométriques qui vont nous servir à construire le modèle p-médian (coordonnées des centres de gravité de chaque aire composant la zone de chalandise correspondant aux noeuds du réseau et la surface de ces aires mesurant la demande).

- la résolution du modèle ainsi élaboré par les heuristiques bien connues de résolution du p- médian.

Nous avons déjà laissé entrevoir à travers quelques exemples, les avantages d'un tel mode de recherche de localisations optimales à savoir la rapidité, la souplesse d'utilisation et la démonstrativité. La deuxième partie nous donnera l'occasion de vérifier ces avantages sur des exemples concrets portant sur la filière de distribution des produits biologiques, et en

particulier l'exactitude de la méthode, sa rapidité, sa précision et sa capacité à traiter de larges

bases de données d'adresses clients pour la recherche de localisations proches de l'optimal. Pour introduire ces exemples, nous allons dans un premier temps établir un bilan du marché des produits bio en France et dans le monde, puis présenter les différents modes de distribution de ces produits pour illustrer enfin le fonctionnement de notre algorithme avec le

cas particulier de la localisation de points de vente de produits biologiques dans l'Ouest

parisien.

Partie II :

La localisation d'un réseau

Chapitre 4 :

Analyse d'un réseau de points de vente

de produits biologiques dans l'Ouest parisien

Introduction

Les produits bio sont un secteur qui en France comme en Europe ou aux Etats-Unis connaissent une forte croissance d'abord car les consommateurs échaudés par les scandales alimentaires souhaitent de plus en plus acheter des produits à la fois sûrs, sains et savoureux. D'autre part, les politiques françaises et européennes favorisent très largement l'agriculture biologique en octroyant aux surfaces agricoles dédiées à ce mode de production des subventions non négligeables. Enfin, les grands distributeurs voient dans ce type de produits

un moyen d'améliorer leur image de marque et leur rentabilité. La distribution des produits biologiques constitue un champ intéressant d'étude dans le cadre d'une problématique d'implantation commerciale étant donné que les magasins "bio" sont actuellement en pleine phase d'expansion, les premières créations datant d'une dizaine d'années. Ainsi, il reste en France encore de nombreuses opportunités pour créer son point de vente de produits biologiques en particulier dans les villes de taille moyenne. Nous nous proposons donc d'appliquer la nouvelle méthode explicitée au chapitre précédent à la localisation d'un réseau

de points de vente de produits biologiques dans l'Ouest Parisien. Ce choix géographique n'est pas anodin car l'Ouest Parisien à fort pouvoir d'achat et très hétéroclite est constitué de zones

où les magasins "bio" sont bien implantés (en particulier certains arrondissements de Paris) et d'autres zones apparemment encore libres de toute offre dans ce secteur. Notre démarche dans

ce chapitre constituera à partir d'une base de données d'adresses de clients potentiels habitant cette région et dans l'optique d'une recherche de localisations optimales pour des points de vente de produits biologiques, à construire le modèle p-médian correspondant grâce aux

principes du traitement du signal vus précédemment.

4.1 Le marché et la distribution des produits biologiques

4.1.1 Les produits biologiques : définition et importance du marché

Dopés par les nombreux scandales alimentaires (vache folle, poulet aux hormones, dioxine, fièvre aphteuse...), les produits biologiques sont un secteur dynamique et en pleine expansion bien que le commerce "bio" reste pour l'instant un micro-marché qui n'implique à l'heure actuelle que 1 % de la production agroalimentaire française et moins de 1 % du chiffre d'affaires du commerce de détail. Les qualités hygiéniques ou gustatives de ces produits très souvent au moins 10 % plus chers que les aliments industriels, n'apparaissent pas encore évidentes aux yeux des consommateurs : cependant, malgré leur chèreté, la vente de produits biologiques progresse