Livre vert de la Commission Européenne sur linformation émanant du secteur public
Contribution au débat
Le livre vert de la Commission Européenne sur " linformation émanant du secteur public dans la société de linformation " ouvre un débat sur laccès aux données publiques et sur les conditions de leur diffusion. Ce débat devrait se clore en juin 1999. Il sarticule avec la réflexion engagée au sein de latelier 6 de la mission Lasserre, dont les travaux devraient déboucher sur la publication des propositions en Octobre. Les travaux du CNIG contribueront à nourrir la réponse du gouvernement français au livre Vert, qui sera formalisée en Mai 1999.
La présente contribution reprend les propositions faites au sein du GT3 de la Commission économique du CNIG, complétées et améliorées par la prise en compte de certains éléments apportés par les participants à cette commission. On utilisera lexpression " données publiques ", généralement utilisée en France, comme équivalent de lexpression " information émanant du secteur public ".
Le premier chapitre du livre vert montre que les données publiques constituent une ressource clé pour lEurope, tant pour lexercice de leurs droits par les citoyens que pour le développement économique et lemploi. Laccès aux données publiques est en effet une condition nécessaire à lexercice de la citoyenneté et à la jouissance des droits politiques, sociaux et économiques qui y sont attachés, au niveau des Etats comme à celui de lUnion Européenne. Laccès à linformation constitue aussi un élément essentiel dun marché unifié, dune concurrence vraiment ouverte à lensemble des acteurs économiques européens. Lefficacité des entreprises passe de plus en plus par la maîtrise de linformation. Or une grande part de cette information prend source dans le secteur public. Ainsi le développement de lindustrie de linformation, dans lequel lEurope et la France en particulier marquent un certain retard, nécessite de clarifier les conditions de laccès aux données publiques et de leur utilisation.
Le second chapitre montre limpact des nouvelles technologies sur le secteur public. Ladministration est en effet, pour une part importante, une machine informationelle, qui collecte des informations auprès des citoyens et des entreprises, les traite, les transforme en décisions et en données diverses. Les nouvelles technologies facilitent ce prélèvement informationnel, permettent de mieux former les décisions et de diffuser plus largement les données (Internet, Intranet). Le livre vert se place clairement dans la perspective dun accès très large à Internet, notamment grâce aux équipements publics (écoles bibliothèques) et au moyen de kiosques, en attendant que laccès Internet se banalise dans les foyers et les entreprises, ainsi que sur téléphone mobile.
Cela pose la question de laccès Internet comme élément dun service universel des télécommunications, que ces communications soient filaires ou radio). Cet accès est essentiel non seulement pour la diffusion et lexploitation des données publiques, mais aussi pour leur collecte et leur mise à jour. Il devrait être proposé par le Livre Vert, en complément des services universels qui existent dans le domaine de la radio, de la télévision et du téléphone vocal. Le paragraphe 66, qui fait référence à la nécessité dinvestir dans des " infrastructures " assurant un " accès aux réseaux électroniques ", mériterait dêtre complété en ce sens.
Le troisième chapitre aborde, après le cadrage proposé par les chapitres précédents, les " questions soulevées par laccès et lexploitation de linformation du secteur public ". Ce chapitre énumère 10 questions que nous proposons de reprendre ci-après.
1. Comment définir le secteur public et catégoriser ses informations ?
1.1 La définition du secteur public
Après avoir rappelé les approches classiques :
fonctionnelle : organismes chargés de missions de service public (qui peuvent être privés ),
institutionnelle : organismes bénéficiant dun statut public,
économique : organismes financés sur fonds publics, provenant de prélèvements obligatoires par opposition aux recettes commerciales provenant dun acte libre dachat,
le livre vert souligne que la notion sapplique aussi bien aux collectivités locales quà lEtat. Il en exclut explicitement les entreprises qui sont propriété publique mais qui opèrent dans des conditions de marché.
Il nous semble nécessaire de retenir une approche large du secteur public, associant les trois approches. Lapproche fonctionnelle conduira notamment à inclure dans le secteur public les services publics délégués et toutes les activités sexerçant dans le cadre dun monopole, donnant lieu à lattribution de licences assorties de cahiers de charges ou dun dispositif de régulation. On sort en effet clairement du cadre du simple marché sur lequel les prix se forment librement par le jeu de loffre et de la demande (" acte libre dachat "). Cela vise tous les cas où il existe un " monopole naturel " provenant soit de la structure des coûts (coûts marginaux très faibles comparés aux coûts fixes) soit de la nécessité dutiliser les prérogatives de la puissance publique pour fonctionner (comme pour construire des réseaux ou collecter certaines données)
Les sociétés privées qui interviennent dans ce cadre (France Télécom par exemple) peuvent en effet disposer de données dont la diffusion pourrait être utile. Cela nimplique nullement, comme on le verra ci-après, que ces données soient mises dans le domaine public. Mais il est indispensable que les conditions de collecte et de diffusion de ces données fassent lobjet dun examen attentif et que des dispositions appropriées soient incluses dans les cahiers des charges ou les règlements.
1.2 Les catégories de données publiques
Le Livre vert propose trois types de distinctions qui peuvent influencer la manière de traiter les données publiques, notamment du point de vue de lapplication du droit dauteur, de leur tarification, de la protection de la vie privée :
Ces distinctions semblent insuffisantes dans le domaine de linformation géographique. Elles devraient être complétées en fonction des différentes étapes du cycle de vie des données publiques : les conditions de leur collecte et de leur mise à jour (qui justifient que cette collecte relève du secteur public), les modalités de leur traitement et la nature des utilisations qui en sont faites.
a) Les conditions de collecte et de mise à jour
Il faut dabord distinguer les données qui constituent lobjet même du service public (les cartes, les photos aériennes et les bases de données de lIGN ou du SHOM, les statistiques de lINSEE, les prévisions de Météo France etc.) et celle qui sont un sous produit du service public (la liste des abonnés au téléphone, le plan cadastral et les fichiers associés, le référentiel adresses de La Poste, la liste des électeurs, les plans des réseaux, les POS etc.).
Il faut ensuite identifier les données qui ne peuvent être obtenues que par la contrainte régalienne, en vertu dobligations civiles (état civil, hypothèques, SIRET ), fiscales (enregistrement, déclarations diverses ), statistiques (recensement, enquêtes ), sociales (déclarations dembauche, DAS ) etc. Ce mode dacquisition leur donne forcément un caractère public mais les données appartiennent-elles pour autant à lEtat ?
Il faut aussi repérer les données dont la collecte et la mise à jour relèvent dun monopole naturel en raison de leur coût élevé, qui rend impossible ou, au moins, peu souhaitable, la duplication du travail de collecte, qui napporte aucune valeur ajoutée. Cest la problématique classique des réseaux, encore renforcée par le fait que les données peuvent être dupliquées indéfiniment sans connaître lengorgement puis la saturation constatées sur les réseaux quand le trafic dépasse certains seuils.
b) Les traitements appliqués aux données
On oppose souvent données brutes et données élaborées. Les notions de données primaires et de données traitées paraissent plus pertinentes. Toute donnée est en effet élaborée : elle est collectée selon des spécifications précises, au moyen de capteurs parfois très complexes (tels quun instrument comme un thermomètre, une caméra, un récepteur GPS , ou encore un formulaire qui pourra le cas échéant être rempli par un programme informatique), elle fait souvent lobjet de vérifications automatiques dans le cadre dun modèle de données (plages de valeur, compatibilité avec dautres données ).
Ainsi les données primaires, qui peuvent être extrêmement élaborées, se caractérisent par le fait quelles se trouvent en début de chaîne et quelles ont un caractère factuel (elles ne relèvent pas du droit dauteur, de lart ou de la subjectivité, contrairement à une carte). On dira que la position (ladresse), le nom, les dimensions et les attributs dun objet géographique élémentaire ont un caractère primaire. Ce nest pas le cas de la représentation de ces données (sous forme de cartes, de tableaux de graphes ), ni des analyses et des simulations faites à partir de ces données, ni des objets complexes utilisant diverses sources de données primaires.
Les données primaires ont vocation à constituer la matière première à partir de laquelle vont être produits des données à valeur ajoutée et les services associés (comme les services dannuaires, les calculs ditinéraire et les aides à la navigation, les guides locaux, les services météo etc) sur divers supports (papier, CD ROM, services en ligne ).
c) lutilisation des données
Il faut distinguer les types dutilisateurs (citoyens, entreprises) et les types dutilisation (données essentielles, les données de référence, données de base).
Les données essentielles sont définies par leur importance politique et sociale. Elles sont indispensables à lexercice des droits des citoyens. Il sagit notamment des lois et règlements (et des cartes et plans qui y sont associées comme les POS, les périmètres divers ), du plan cadastral, des adresses postales (non nominatives), des découpages administratifs et statistiques, des délibérations des collectivités et de leurs établissements publics, des informations sur le trafic routier et les transports publics, de la météo de base et des données sur les pollutions et les nuisances
Les données géographiques de référence sont celles qui servent à positionner (géoréférencer) dautres données. Pour bien remplir leur fonction ces référentiels doivent être uniques et dun accès aisé. Ils permettent en effet de combiner les données entre elles. On y retrouve des données essentielles comme le plan cadastral, les adresses et les divers découpages, ainsi que le canevas géodésique (y compris le réseau actif formé de stations de GPS différentielles) et le fichier des voies (filaire, toponymie).
Les données de base sont celles servant à des utilisateurs divers pour des applications variées, par opposition aux données spécifiques ou thématiques qui nintéressent que certains utilisateurs ou certaines applications. On trouvera par exemple parmi les données de base la BD Alti de l'IGN, la description de l'occupation de l'espace (hydrographie, réseau viaire et ferré, villes et villages), la plupart des données INSEE localisées, une orthophoto calée sur le canevas, l'archive numérisée de la couverture aérienne (photothèque de l'IGN), la liste des abonnés au téléphone
Les données essentielles et les données de référence, qui se recoupent en partie, sont des sous-ensembles des données de base. Les données primaires sont souvent des données de base dans la mesure où elles servent de matière première à de nombreuses données à valeur ajoutée.
2. Les conditions daccès aux données publiques
Le livre vert rappelle quil existe des réglementations nationales très diverses garantissant laccès aux données publiques, avec de grandes différences dans les limites apportées à la règle daccessibilité (notamment pour protéger certaines données ou limiter le coût pour les administrations) et dans les modalités daccès en termes de délais, de volume et de format. Il pose en conséquence la question de savoir si ces différences peuvent constituer une barrière au niveau européen, pour quelles raisons et quelles solutions pourraient être envisagées.
Notre réponse est que cette diversité constitue à la fois une barrière et un élément important de renchérissement des données, qui en limitent lutilisation. La diversité des règlements et la complexité de laccès favorisent clairement les nationaux de chaque pays. Il est particulièrement difficile pour les non nationaux de savoir où se trouvent les données, dans quelles conditions on peut y accéder, quelles en sont les utilisations possibles. Les formats exotiques constituent aussi une barrière.
Il existe en outre de nombreux exemples où il existe des besoins transnationaux auxquels il est difficile de répondre (ou avec des retards et des surcoûts) en raison de la diversité des conditions nationales daccès aux données publiques. On citera en particulier les annuaires téléphoniques et les bases de données routières.
Cest pourquoi il paraît nécessaire de formuler au niveau européen quelques principes simples en matière de droit daccès et de diffusion de manière à garantir le droit à linformation des citoyens et la loyauté de la concurrence.
Le premier consiste à faire de laccès aux données un droit pour tous les citoyens dans tous les pays de lunion. Ce droit ne peut être absolu mais seules les données ayant été définies expressément comme sensibles, par délibération motivée de leur détenteur, pourront rester inaccessibles. Pour concrétiser ce droit, les détenteurs de données publiques publieront la liste de leurs données (dictionnaires de données) sans attendre la réalisation des catalogues et outils prévus au point trois (métadonnées), ainsi que la liste des données sensibles.
Le second consiste à créer une obligation de mise en ligne des données numériques (à lexception des données sensibles). Cela vise la quasi totalité des données publiques dans la mesure où le secteur public utilise des outils numériques pour produire, stocker et faire circuler ses données. Lexpérience de la Loi de 1978 en France montre en effet que le droit daccès reste en partie formel sil nest pas associé à une politique de diffusion. La mise des données en ligne constitue une sorte de moyen terme entre la diffusion (push) et laccès (pull).
A ces deux principes de base pourrait sajouter une recommandation visant à la numérisation progressive, sous une forme économique (scan par exemple), des données anciennes. Cela vise en particulier larchive de photos aériennes, lensemble des cartes anciennes, les données statistiques... Il faudrait également sanctionner la rétention de données publiques tant sous la forme de la dissimulation de leur existence que du refus injustifié dy donner accès.
3. Instruments visant à faciliter laccès
Le livre vert souligne le nombre très élevé de bases de données publiques, qui rend nécessaire la réalisation de mécanismes de recherche conviviaux, notamment au moyen dannuaires et de catalogues (métadonnées). Il pose la question de lintérêt de la mise place de tels outils au niveau européen et des modalités possibles pour une telle mise en place.
Il existe un très large consensus sur lutilité des métadonnées. Il paraît indispensable de promouvoir leur mise en place dans chaque pays, dans le respect des standards. En revanche la réalisation doutils spécifiques au niveau européen paraît plus discutable. Les outils de recherche standard dInternet devraient suffire, sous réserve des aspects linguistiques (description des données dans plusieurs langues).
Il existe en outre un réel danger que la production de métadonnées, qui exige beaucoup de soins et de temps, ne serve dalibi à une politique de restriction de laccès et de la diffusion, le mieux étant souvent lennemi du bien. Il est important que la description des fichiers et de leurs différents champs et enregistrements et que les modèles de données soient publiés en létat, sans retard, notamment en vue de laccès aux données brutes.
4. La tarification des données publiques
Le livre vert donne des exemples de la grande disparité des tarifications pratiquées par les différents pays et signale la tendance à la diffusion gratuite de données sur Internet. Il propose que la politique de prix vise trois objectifs :
Le livre vert souligne que la réalisation de ces objectifs nimplique pas la gratuité des données au prétexte quelles ont été financées par les contribuables. Un certain prix peut être demandé, notamment pour les données qui nintéressent quun nombre restreint dutilisateurs prêts à payer pour les acquérir. Seules les données " essentielles " doivent faire lobjet de tarifs très bas pour en assurer laccès à tous. Les détenteurs de données publiques doivent être encouragés à mettre leurs données à la disposition des industries du contenu, ce qui suppose que leurs efforts en ce sens soient rémunérés. Mais les tarifs pratiqués ne doivent pas non plus décourager le secteur privé dinvestir dans cette branche
Le livre vert pose deux questions en conclusion :
Ces deux questions appellent des réponses claires : oui les tarifs élevés pratiqués pour de nombreuses données publiques ont pour effet dexclure un grand nombre dutilisateurs potentiels (notamment le grand public et les PME) et de restreindre fortement le marché ; oui les différences au niveau européen avantagent les entreprises des pays qui ont les politiques de tarification les plus ouvertes.
Ces réponses doivent être complétées par un certain nombre de précisions et de propositions.
4.1 Le prix nest quun élément de la politique de tarification
Pour les données numériques, les questions du nombre dutilisateurs autorisés et des possibilités dintégration simple à des données composites sont essentielles. Il faut en particulier faciliter le partage des données sur des Intranets et sur Internet et la libre utilisation des données de base (fonds de plan, découpages ).
4.2 La philosophie de la tarification doit être clairement affichée
Le choix en la matière est limité. Les principaux types de tarification sont les suivants :
La tarification au coût marginal de mise à disposition : ce coût est souvent très faible (surtout en ligne), débouchant sur une quasi gratuité. Il ne comprend pas les coûts de collecte, de mise à jour et de mise en forme. Cette philosophie exclut la perception de redevances de rediffusion, puisque le coût marginal est nul dans ce cas. Elle garantit une très large diffusion des données, mais elle doit être financée.
La tarification au coût total moyen de long terme, qui rapporte lensemble des coûts au nombre de ventes espérées sur le cycle de vie de la donnée. Cette politique exclut la réalisation de bénéfices.
La tarification aux prix de marché, en fonction de la valeur attachée aux données par les utilisateurs et au prix doffre des données concurrentes. Des marges peuvent être dégagées. Elle nest pas possible quand il nexiste pas doffre concurrente et que le secteur public se trouve en position de monopole, comme cela arrive pour de nombreuses données. Ce monopole est atténué sil y a possibilité de produire soi-même les données (données sur mesure) ou de leur substituer des données voisines (images satellitales par exemple).
La tarification à un prix de monopole optimisant le chiffre daffaires ou la marge bénéficiaire. Cette politique, très fréquente même si elle nest pas formalisée, conduit à des prix élevés pour les données numériques et restreint fortement lutilisation des données.
Les deux dernières politiques transforment clairement les administrations en commerçants, ce qui peut entrer en contradiction avec leur statut ou avec leurs missions de service public. Quoi quil en soit, il est essentiel que les vendeurs de données publiques comme les utilisateurs soient précisément informés de la philosophie de tarification applicable aux données quils diffusent ou achètent, qui doit faire lobjet de décisions politiques explicites.
4.3 Ne pas pénaliser les données numériques
Lorsquelles sont sur support papier, de très nombreuses données géographiques sont diffusées gratuitement (consultation, affichage) ou au coût de mise à disposition (et parfois moins) : cest le cas par exemple des cartes et des photos aériennes de lIGN, du plan cadastral, des données de lINSEE, de lannuaire du téléphone Ce faisant lEtat reconnaît le caractère essentiel de ces données et limpossibilité de facturer leur coût de collecte, de mise à jour et de mise en forme.
Le prix de ces données explose dès quelles passent sur support numérique : il est multiplié par 10, par 100 et parfois plus aux termes de licences restreignant le nombre dutilisateurs et les utilisations admises. Par exemple le droit de scan dune carte IGN est de lordre de 100 fois le prix de vente de la carte. Il était question jusquen 1998 de facturer la feuille cadastrale numérique 800 Francs, soit plus de 10 fois le prix de la planche papier.
Il sagit clairement de faire payer aux acheteurs une partie des coûts de collecte et de mise à jour, puisque le coût de diffusion sous cette forme est bien moindre : il est divisé par dix, par cent et parfois plus. Le coût dimpression de lannuaire atteint par exemple plusieurs centaines de millions de francs, sans comparaison avec celui de sa mise en ligne ou du pressage dun CD ROM La diffusion du plan cadastral et de la matrice sous forme papier est extrêmement onéreuse
Mais ne faut-il pas financer le coût de la numérisation des données papier ? Ce motif ne peut être que transitoire : les outils numériques simposent de plus en plus dans tout le cycle de vie de la donnée précisément parce quils permettent une très forte réduction des coûts. Toutes les données ont vocation à être produites par voie numérique et la numérisation ne concerne que larchive : faut-il pour autant la facturer à un prix plus élevé que les données " fraîches " ?
Il est vrai que le support numérique facilite grandement la diffusion et lutilisation des données, augmentant dautant leur valeur dusage Cest cette caractéristique qui permet, en situation de monopole, de facturer plus cher des données moins coûteuses, les détenteurs des outils numériques et de lexpertise nécessaires à lutilisation des données numériques (administrations, entreprises ) étant censés pouvoir supporter des prix plus élevés que les autres utilisateurs. Ladministration a trouvé ainsi un moyen commode daugmenter ses recettes commerciales, au détriment du développement du marché de la donnée géographique numérique.
On passe ainsi dune politique de large diffusion des données papier à la recherche de recettes commerciales maximales sur les données numériques. Ce renversement contredit la volonté souvent affichée de favoriser la diffusion des données et de permettre lémergence dune société de linformation ouverte à tous. Cest pourquoi il serait souhaitable de poser comme principe légalité de traitement tarifaire entre les données numériques et leur équivalent papier (même philosophie de tarification). On pourra même tenir compte des coûts respectifs des différents supports (données numériques moins chères) de manière à faire bénéficier les utilisateurs des économies apportées par les nouvelles technologies.
4.4 Propositions de tarification en fonction des catégories de données
Il est proposé de tenir compte pour la tarification à la fois des conditions de collecte des données, de leur degré délaboration et des types dutilisation. Le tableau suivant résume succinctement les principaux cas de figure.
Principes de tarification des données publiques
Type de données |
Données essentielles Données de référence |
Données de base |
Données thématiques |
Sous-produit (1) Monopole naturel Contraintes régaliennes (3) Données primaires
Données à valeur ajoutée |
Coût de M.A.D. (2) Coût de M.A.D. (2)
Coût de M.A.D. (2)
Coût de M.A.D. (2) |
Coût de M.A.D. (2) Coût moyen (4) ou prix de marché (5) Coût moyen (4) ou prix de marché (5) Non applicable |
Coût de M.A.D. (2) Coût moyen (4)
Prix de marché (6)
Prix de marché (6) |
(1) Données résultant du fonctionnement du service public ou nécessaires à ce fonctionnement, par opposition aux données qui sont lobjet même du service public. Voir 1.2 (a).
(2) Coût marginal de mise à disposition, excluant les coûts fixes de collecte, de mise à jour et de mise en forme. La tarification au coût marginal de M.A.D exclut la perception de redevances de rediffusion. La gratuité peut être justifiée pour certaines données essentielles.
(3) Données collectées dans le cadre dun monopole naturel ou de contraintes régaliennes. Voir 1.2 (a).
(4) Le coût moyen inclut lensemble des coûts pendant le cycle de vie de la donnée. Il implique la perception d licences de rediffusion.
(5) Le coût moyen peu être supérieur au prix de marché : dans ce cas, les données de base doivent être cédées en dessous du coût moyen afin de permettre leur utilisation effective (notamment comme matière première pour les données à valeur ajoutée).
(6) Le prix de marché nest applicable que sil existe un marché (offres concurrentes). En labsence de concurrence, on se référera au coût moyen.
Cette typologie exclut les pratiques actuelles consistant à maximiser les recettes commerciales des administrations quand elles sont en position de monopole.
4.5 La nécessité dune régulation
La complexité des questions de tarification et les conflits quelles peuvent générer entre les vendeurs et les utilisateurs justifient la création dune instance de régulation pour enregistrer les philosophies de tarification, vérifier leur application au travers des tarifs publiés et arbitrer les conflits éventuels.
Le Conseil de la Concurrence fait fonction de régulateur chaque fois que la concurrence est en cause. Mais on a vu que de nombreuses données publiques sont produites nécessairement dans le cadre de monopoles. En outre la rétention des données (par refus daccès ou par tarification dissuasive) a pour effet dempêcher la création de marchés (notamment pour les données à valeur ajoutée). La compétence du Conseil de la Concurrence est alors contestée.
La tutelle administrative joue aussi un rôle de régulation à travers lapprobation des tarifs et la participation aux processus de décisions. Lexpérience montre toutefois quelle manque souvent de la distance nécessaire et les logiques propres à ladministration passent souvent avant les objectifs que cette dernière est censée servir. Il existe en particulier une tendance forte des monopoles, y compris les monopoles privés (voir Microsoft), à étendre ce monopole en sappuyant sur leurs rentes. Ainsi la maîtrise des données primaires conduira à vouloir contrôler le marché des données à valeur ajoutée, le plus intéressant commercialement, et celui des services associés.
On a vu enfin quune tarification au coût marginal de mise à disposition ou au coût moyen de longue durée est souvent souhaitable, même en labsence de monopole public. Or la détermination de ces coûts est souvent complexe, même lorsquune comptabilité analytique existe. Limputation des coûts indirects et la distinction des coûts de collecte et des coûts de diffusion passent par des arbitrages quune instance indépendante doit valider.
Pour toutes ces raisons il paraît indispensable de mettre en place, dans lensemble des pays européens, des instances de régulation ouvertes à tous.
5. Aspects de concurrence
Après avoir montré que la concurrence peut subir dans certains cas des distorsions comme la vente de données à des prix inférieurs aux coûts normaux ou lattribution dexclusivités au profit dorganismes publics ou privés, le Livre Vert constate que les réglementations nationales sont très variées et rappelle que le traité de Rome définit des règles protectrices en matière de concurrence, avec des possibilités de dérogations au profit de " services dintérêt économique général ". Ces règles encadrent en particulier les subventions des Etats et visent à empêcher les abus de position dominante, notamment en cas de monopole. La mise en concurrence simpose aux marchés publics pour lattribution des marchés dédition et de distribution de données.
Après avoir signalé que le déploiement des nouvelles technologies a des conséquences importantes sur les coûts de collecte et de diffusion des données, conséquences qui peuvent rendre nécessaires certaines évolutions, le Livre Vert demande dans quelle mesure les activités du secteur public pourraient, dans le secteur de linformation, créer une concurrence déloyale au niveau européen.
La réponse est quil existe effectivement de nombreuses distorsions à la concurrence qui ont pour effet de rendre plus difficile la pénétration de chaque marché national par les acteurs non nationaux, retardant dautant lémergence dun marché européen de linformation.
Les principales atteintes à la concurrence sont les suivantes :
Il paraît en particulier très difficile de demander à une administration de poursuivre à la fois des missions de service public (notamment pour la collecte et la diffusion de données primaires, de données de base et de données essentielles) et des objectifs commerciaux de maximisation des recettes, notamment par la valorisation des données primaires.
En intervenant dans le secteur de la valeur ajoutée les producteurs de données publiques entrent en concurrence avec les éditeurs privés et sont tentés de ne pas diffuser les données primaires et les données de base (en invoquant par exemple une qualité ou une sécurité insuffisantes), ou de les vendre au même prix que leurs données à valeur ajoutée (comme France Télécom dans le cas de Filetech). Le résultat est le même : assurer au producteur public un quasi-monopole et des prix élevés.
Or les missions de service public ont précisément pour raison dêtre de pallier les défaillances du marché et de garantir la diffusion des données à des prix correspondant aux possibilités du plus grand nombre.
Cest pourquoi il paraît nécessaire de définir au niveau européen un petit nombre de recommandations, pour favoriser une bonne articulation entre les rôles complémentaires des producteurs publics et de lindustrie privée de linformation :
1. Bien définir les missions de service public, en précisant leur justification et les principes de tarification des données qui en découle. Prévoir une actualisation périodique de cette définition pour prendre en compte limpact des nouvelles technologies et du déploiement de la société de linformation.
2. Confier au secteur privé, chaque fois que cela est possible, la tâche de diffuser les données publiques et de les valoriser, en faisant jouer pleinement la concurrence (ni concessions, ni exclusivités).
3. Veiller, lorsque lintervention des producteurs publics est souhaitable pour la diffusion ou la valorisation des données publiques, à la loyauté de la concurrence. Cela passe par un accès réel aux données primaires aux mêmes conditions que lorganisme public et par la séparation claire des opérations commerciales et des opérations de services publics (risque de subventions déguisées). La création de filiales commerciales de droit privé semble être, dans ce cas, la meilleure solution, compte tenu des contraintes propres à la comptabilité publique.
4. Confier au secteur privé, chaque fois que cela est possible, la collecte et la mise à jour des données publiques dans le cadre de spécifications définies par ladministration et de marchés remis régulièrement en concurrence.
5. Confier à lorgane de régulation (voir le point 4 relatif à la tarification) une mission darbitrage, notamment lorsque labsence de marché (monopole de fait des producteurs publics) pourrait rendre le Conseil de la Concurrence incompétent.
6. Aspects liés au droit dauteur
Le livre vert rappelle que le secteur public peut se fonder sur le droit dauteur pour se procurer des revenus ou pour garantir lintégrité des données (notamment pour des problèmes de sécurité et de responsabilité), mais quil peut aussi y renoncer pour certaines données. Il pose la question de savoir dans quelle mesure les différents régimes de droit dauteur peuvent constituer une barrière à lexploitation des données publiques.
La réponse est que le droit dauteur constitue bien une telle barrière dans la mesure où le droit dauteur est le seul moyen juridique de faire valoir des droits sur une donnée et que de plus en plus dorganismes souhaitent obtenir des compléments de revenus en valorisant leurs données.
Il convient toutefois de préciser que le droit dauteur au sens strict fait référence à une création personnelle ce qui est rarement le cas en lespèce. Il est en effet difficile de reconnaître la marque des auteurs dans la liste des abonnés du téléphone, le bulletin de la météo marine, le nom dun lieu-dit, les coordonnées dun objet géographique, la forme dune parcelle La notion sapplique aux cartes et à la présentation des données lorsquelle fait preuve dun minimum doriginalité la distinguant des présentations habituelles, mais pas aux données factuelles Cest pourquoi il a paru nécessaire de créer un droit nouveau, dit droit sui generis, protégeant le contenu des bases de données même si ce contenu ne relève pas en lui-même du droit dauteur.
Il est clair que le secteur public peut légitimement sappuyer sur ce droit sui generis pour valoriser ses données. Mais cela nimplique quil doive le faire. Il y a en effet un risque sérieux de dérive, notamment pour les données qui sont un sous-produit de lactivité administrative : la vente de ces données devient une fin en soi alors que leur collecte est au départ un moyen daccomplir des missions de service public et ladministration se transforme en commerçant sans en avoir le statut ni les moyens.
On invoque parfois le fait que les recettes commerciales peuvent constituer une incitation à la diffusion des données, sans toujours bien mesurer que lon passe ainsi dune logique administrative (exécuter des missions de service public) à une logique économique (générer des recettes). Ladministration est souvent mal outillée pour gérer ces recettes qui, en droit commun, tombent dans la caisse commune (principe de luniversalité de caisse). Il existe dautres moyens dévaluer la capacité des services à remplir leurs tâches, parmi lesquelles peuvent figurer la collecte et la diffusion des données.
Enfin lapplication du droit dauteur aux bâtiments, aux jardins ou aménagements ayant un maître duvre peut poser un sérieux problème pour les bases de données comprenant des plans, des images aériennes ou des photos, de plus en plus utilisés pour la description de lespace et le repérage des voyageurs. La tendance des tribunaux est de reconnaître un droit non seulement aux auteurs mais aussi aux propriétaires, sans limitation de durée, conduisant à une privatisation partielle de lespace public.
Bien que cela dépasse le champ strict des données publiques, il est important de reconnaître au niveau européen un droit de publier des photos ou des représentations 2D ou 3D (schémas, dessins, axonométries ) de lensemble des bâtiments, équipements et aménagements paysagers publics ou visibles depuis les espaces ouverts au public, en limitant strictement lapplication du droit dauteur, pour une durée limitée et au bénéfice des seuls auteurs, aux publications visant expressément la création architecturale ou paysagère.
Cest pourquoi il paraît nécessaire de recommander au niveau européen que soit publiée, dans chaque pays, la liste des données essentielles et de référence sur lesquelles le secteur public renonce expressément à faire valoir des droits sui generis. Cette renonciation peut saccompagner de prescriptions comme la mention obligatoire de la source et la préservation de lintégrité des données, dans une démarche proche de celle des logiciels libres.
7. Aspects liés à la protection de la vie privée
Le livre vert rappelle que de nombreuses données publiques ont un caractère nominatif et que lémergence de la société de linformation peut induire des risques nouveaux, notamment à travers linternet. Une directive européenne protège depuis 1995 les données à caractère personnel, conduisant à une harmonisation des diverses règles nationales. Elle consacre le principe de finalité, qui peut empêcher certaines utilisations des données publiques.
Cela conduit le livre vert à poser une double question : les considérations liées au respect de la vie privée méritent-elles une attention particulière pour lexploitation des données publiques ? Des intérêts commerciaux peuvent-ils justifier un accès aux données personnelles détenues par le secteur public ?
Ces questions, qui ne peuvent avoir une réponse simple, appellent dabord quatre remarques préliminaires.
1. Il faut bien voir, tout dabord, que très nombreuses données géographiques publiques comprennent des adresses postales et des numéros de téléphone, données personnelles particulièrement sensibles dans la mesure où elles donnent accès aux personnes face à face ou par courrier, téléphone, fax, mél etc., ce qui peut déranger (courriers non désirés) certaines personnes, voire les mettre en danger.
2. La numérisation des données puis leur mise en ligne en facilitent grandement laccès, notamment avec des moteurs de recherche puissants. Parmi les données en libre consultation sur support papier comme les listes électorales, la matrice cadastrale (fichier des propriétaires, fichier des propriétés, évaluations cadastrales) etc. un certain nombre nont pas leur place sur linternet.
3. Les différents moyens mis en place pour protéger la vie privée face à ces nouveaux risques, comme les différentes listes (rouge, orange, safran, stop publicité etc.) ou le droit daccès aux données personnelles se révèlent dune efficacité limitée et sont difficiles à utiliser pour un grand nombre de citoyens. Elles peuvent en outre avoir des effets pervers en empêchant des communications légitimes, voire essentielles.
4. Les nouvelles technologies apportent aussi des outils pouvant contribuer à une protection efficace de la vie privée comme la cryptographie (secret des communications, authentification des correspondants), lidentifiant de lappelant, le filtrage des appels et des méls, la protection de lanonymat (porte-monnaie électronique, pseudos ) etc.
Le marketing direct, le géomarketing et le commerce électronique sont de grands utilisateurs potentiels de données publiques à caractère personnel. Cest ainsi que le nouveau contrat de France Télécom prévoit expressément la possibilité de commercialiser les données personnelles. Cela na rien de scandaleux en soi, sous réserve de bien informer les intéressés, dobtenir leur accord explicite et de leur donner un moyen efficace de contrôler lutilisation qui est faite des données qui les concernent. Bien connaître les clients, adapter loffre à leurs besoins, ce seront de plus en plus des moyens obligés du développement économique.
La directive européenne de 1995 ne fait pas de distinction entre données publiques et données privées, si ce nest la référence, à larticle 7, à la légitimité de certains traitements résultant dune " nécessité objective " en application des lois et règlements ou pour la réalisation de missions de service public. Lutilisation des données publiques à caractère personnel appelle ainsi ni plus ni moins de vigilance que celle des données privées.
Le rapport Braibant, relatif à la transposition de cette directive en droit français, signale toutefois les contradictions qui peuvent naître entre les principes du libre accès à linformation (fondement de la démocratie), de la liberté dexpression et de la liberté dentreprendre (pour lindustrie de linformation) et celui de la protection des données dès lors quelles prennent un caractère personnel direct ou indirect. Cest pourquoi cette protection ne saurait être absolue et ne doit pas conduire à des atteintes non nécessaires ou disproportionnées à laccès à linformation.
Cest ainsi quune grande partie des données du recensement de 1990 est sous embargo pour les zones infracommunales de moins de 5000 habitants, alors que ces données sont essentielles pour les analyses urbaines (notamment pour létude des mécanismes de ségrégation spatiale qui renforcent les processus dexclusion), pour loptimisation de loffre déquipements publics adaptés aux besoins de la population et pour celle de loffre de services privés (géomarketing). La raison invoquée est que ces données pourraient, à léchelle de lîlot, devenir indirectement nominatives. La réalité est que lon na pas dexemple datteinte à la vie privée résultant de la libre diffusion de ces données aux Etats-Unis et dans de nombreux pays.
Ainsi un risque très faible conduit à une mesure dembargo très forte, non proportionnée au risque. En outre cet embargo pénalise fortement lindustrie de linformation en France, contrainte à des travaux coûteux pour réaliser des estimations approximatives des données mises sous embargo. Il y a là une source forte dinégalité entre les pays.
Il nous semble en conséquence que le débat sur les données publiques devrait conduire à compléter la directive de 1995, afin de renforcer à la fois laccès aux données publiques et la protection des données personnelles, en tenant compte de la mutation complète du paysage induite par lémergence de la société de linformation et de linternet. La directive de 1995 est aujourdhui dépassée sur plusieurs points.
Les compléments pourraient porter sur quatre points principaux.
1. Mieux définir, au cas par cas, lensemble des finalités de la collecte, des traitements et de la diffusion des données publiques, en rappelant la possibilité de les utiliser, au-delà de la stricte réalisation de missions de service public, aux fins de linformation des citoyens et du développement économique et social. Le déploiement de la société de linformation implique en particulier une très large diffusion des adresses de toute nature afin de favoriser une communication efficace entre les personnes.
2. Mieux protéger les personnes contre les atteintes à leur vie privée et les risques liés à lutilisation des données les concernant. Cela concerne notamment le droit daccès et la protection contre les démarches intrusives.
Pour limmense majorité des personnes le droit à linformation préalable, le droit daccès et le droit de rectification sont largement théoriques. Il est possible aujourdhui de concrétiser ces droits grâce aux nouveaux outils informatiques. Cela fait partie des missions de service public : il faut assurer concrètement à chaque citoyen un accès gratuit et facile à tous les fichiers qui le concernent, y compris au niveau européen.
Pour se protéger contre lintrusion, chacun est obligé de sinscrire sur différentes listes en fonction des opérateurs de réseaux, des éditeurs de données ou des gestionnaires de services. Les personnes qui entendent ne pas recevoir de courriers ou dappels non sollicités devraient pouvoir sinscrire auprès dun guichet unique, qui pourrait expurger, gratuitement ou à très bas prix, dans le cadre du service public, tous les fichiers de prospection. Le recours à ce service serait obligatoire préalablement à toute cession de fichiers.
Un effort est également nécessaire pour sensibiliser les citoyens et diffuser les outils nécessaires à leur information et à leur protection : messageries, pseudos, boîtes postales, clés de cryptographie etc. Mettre les nouvelles technologies au service de la protection de la vie privée permet de dépasser en partie les contradictions entre le besoin de transparence et de circulation des données et la nécessité dempêcher les utilisations abusives des données personnelles.
3. Renforcer les sanctions contre les atteintes à la vie privée, notamment en clarifiant le droit des personnes concernées à obtenir réparation en cas de traitement clandestin, illicite ou de nature à leur porter préjudice (par exemple pour obtenir une embauche, un emprunt, une assurance etc. ou sous forme dintrusion injustifiée ), sans aller forcément au pénal.
4. Elargir les missions et les moyens de la CNIL. Le rapport Braibant comprend plusieurs propositions utiles en ce sens. Il faudrait aller plus loin en associant laccès à linformation et la protection des données personnelles, comme lont fait certains pays. La CNIL pourrait reprendre les missions de la CADA, en les actualisant pour tenir compte du nouveau contexte technique (NTIC), économique (baisse verticale des coûts de traitement et de diffusion) et politique (volonté de transparence et aspiration à linformation). Tempérer le droit à linformation, dont limportance vitale ne cesse de croître, par la protection de la vie privée est indispensable. Cela peut difficilement résulter du choc de deux logiques qui saffrontent : il faut, au cas par cas, conserver le souci dassurer à la fois la plus grande transparence et la meilleure protection en profitant des nouveaux outils disponibles.
Conclusion provisoire
Les données publiques géographiques ont une spécificité qui tient au fait quelles se caractérisent par un localisant dont limportance va croissant (adresse, dimension spatiale), que les producteurs publics jouent encore un rôle essentiel (IGN, GDGI, INSEE, Météo France, France Télécom ) et quil est essentiel de disposer de données de référence uniques (pour pouvoir associer les données de différentes source). Cela rend nécessaire que des dispositions soient prise au niveau européen pour en faciliter laccès et lexploitation.
Comme le rapport Braibant la bien souligné, il est difficile de séparer laccès aux données et la protection des données personnelles. En adoptant sur ce dernier sujet une directive en 1995, lUnion Européenne a reconnu limportance de la circulation des données entre les pays membres et les entraves qui peuvent résulter de lapplication de règles trop différentes dans le domaine de la protection des données personnelles.
Le même raisonnement vaut a fortiori pour laccès et la diffusion des données publiques. Une directive est probablement nécessaire, à défaut des recommandations sont indispensables. Le développement du commerce électronique est reconnu comme lun des grands enjeux des prochaines années. Il ne peut être séparé de la circulation des données qui sont à la fois un des objets importants de ce commerce et un des moyens de le développer. Dans ce cadre les données géographiques publiques prennent une importance particulière et doivent être expressément visées par les recommandations a adopter au niveau européen.