Page précédente

 

Livre vert de la Commission Européenne sur l’information émanant du secteur public

Contribution au débat

Le livre vert de la Commission Européenne sur " l’information émanant du secteur public dans la société de l’information " ouvre un débat sur l’accès aux données publiques et sur les conditions de leur diffusion. Ce débat devrait se clore en juin 1999. Il s’articule avec la réflexion engagée au sein de l’atelier 6 de la mission Lasserre, dont les travaux devraient déboucher sur la publication des propositions en Octobre. Les travaux du CNIG contribueront à nourrir la réponse du gouvernement français au livre Vert, qui sera formalisée en Mai 1999.

 

La présente contribution reprend les propositions faites au sein du GT3 de la Commission économique du CNIG, complétées et améliorées par la prise en compte de certains éléments apportés par les participants à cette commission. On utilisera l’expression " données publiques ", généralement utilisée en France, comme équivalent de l’expression " information émanant du secteur public ".

 

Le premier chapitre du livre vert montre que les données publiques constituent une ressource clé pour l’Europe, tant pour l’exercice de leurs droits par les citoyens que pour le développement économique et l’emploi. L’accès aux données publiques est en effet une condition nécessaire à l’exercice de la citoyenneté et à la jouissance des droits politiques, sociaux et économiques qui y sont attachés, au niveau des Etats comme à celui de l’Union Européenne. L’accès à l’information constitue aussi un élément essentiel d’un marché unifié, d’une concurrence vraiment ouverte à l’ensemble des acteurs économiques européens. L’efficacité des entreprises passe de plus en plus par la maîtrise de l’information. Or une grande part de cette information prend source dans le secteur public. Ainsi le développement de l’industrie de l’information, dans lequel l’Europe et la France en particulier marquent un certain retard, nécessite de clarifier les conditions de l’accès aux données publiques et de leur utilisation.

 

Le second chapitre montre l’impact des nouvelles technologies sur le secteur public. L’administration est en effet, pour une part importante, une machine informationelle, qui collecte des informations auprès des citoyens et des entreprises, les traite, les transforme en décisions et en données diverses. Les nouvelles technologies facilitent ce prélèvement informationnel, permettent de mieux former les décisions et de diffuser plus largement les données (Internet, Intranet). Le livre vert se place clairement dans la perspective d’un accès très large à Internet, notamment grâce aux équipements publics (écoles bibliothèques) et au moyen de kiosques, en attendant que l’accès Internet se banalise dans les foyers et les entreprises, ainsi que sur téléphone mobile.

 

Cela pose la question de l’accès Internet comme élément d’un service universel des télécommunications, que ces communications soient filaires ou radio). Cet accès est essentiel non seulement pour la diffusion et l’exploitation des données publiques, mais aussi pour leur collecte et leur mise à jour. Il devrait être proposé par le Livre Vert, en complément des services universels qui existent dans le domaine de la radio, de la télévision et du téléphone vocal. Le paragraphe 66, qui fait référence à la nécessité d’investir dans des " infrastructures " assurant un " accès aux réseaux électroniques ", mériterait d’être complété en ce sens.

Le troisième chapitre aborde, après le cadrage proposé par les chapitres précédents, les " questions soulevées par l’accès et l’exploitation de l’information du secteur public ". Ce chapitre énumère 10 questions que nous proposons de reprendre ci-après.

1. Comment définir le secteur public et catégoriser ses informations ?

1.1 La définition du secteur public

Après avoir rappelé les approches classiques :

fonctionnelle : organismes chargés de missions de service public (qui peuvent être privés…),

institutionnelle : organismes bénéficiant d’un statut public,

économique : organismes financés sur fonds publics, provenant de prélèvements obligatoires par opposition aux recettes commerciales provenant d’un acte libre d’achat,

le livre vert souligne que la notion s’applique aussi bien aux collectivités locales qu’à l’Etat. Il en exclut explicitement les entreprises qui sont propriété publique mais qui opèrent dans des conditions de marché.

Il nous semble nécessaire de retenir une approche large du secteur public, associant les trois approches. L’approche fonctionnelle conduira notamment à inclure dans le secteur public les services publics délégués et toutes les activités s’exerçant dans le cadre d’un monopole, donnant lieu à l’attribution de licences assorties de cahiers de charges ou d’un dispositif de régulation. On sort en effet clairement du cadre du simple marché sur lequel les prix se forment librement par le jeu de l’offre et de la demande (" acte libre d’achat "). Cela vise tous les cas où il existe un " monopole naturel " provenant soit de la structure des coûts (coûts marginaux très faibles comparés aux coûts fixes) soit de la nécessité d’utiliser les prérogatives de la puissance publique pour fonctionner (comme pour construire des réseaux ou collecter certaines données)

 

Les sociétés privées qui interviennent dans ce cadre (France Télécom par exemple) peuvent en effet disposer de données dont la diffusion pourrait être utile. Cela n’implique nullement, comme on le verra ci-après, que ces données soient mises dans le domaine public. Mais il est indispensable que les conditions de collecte et de diffusion de ces données fassent l’objet d’un examen attentif et que des dispositions appropriées soient incluses dans les cahiers des charges ou les règlements.

 

 

1.2 Les catégories de données publiques

 

Le Livre vert propose trois types de distinctions qui peuvent influencer la manière de traiter les données publiques, notamment du point de vue de l’application du droit d’auteur, de leur tarification, de la protection de la vie privée :

 

 

Ces distinctions semblent insuffisantes dans le domaine de l’information géographique. Elles devraient être complétées en fonction des différentes étapes du cycle de vie des données publiques : les conditions de leur collecte et de leur mise à jour (qui justifient que cette collecte relève du secteur public), les modalités de leur traitement et la nature des utilisations qui en sont faites.

 

a) Les conditions de collecte et de mise à jour

 

Il faut d’abord distinguer les données qui constituent l’objet même du service public (les cartes, les photos aériennes et les bases de données de l’IGN ou du SHOM, les statistiques de l’INSEE, les prévisions de Météo France etc.) et celle qui sont un sous produit du service public (la liste des abonnés au téléphone, le plan cadastral et les fichiers associés, le référentiel adresses de La Poste, la liste des électeurs, les plans des réseaux, les POS etc.).

 

Il faut ensuite identifier les données qui ne peuvent être obtenues que par la contrainte régalienne, en vertu d’obligations civiles (état civil, hypothèques, SIRET…), fiscales (enregistrement, déclarations diverses…), statistiques (recensement, enquêtes…), sociales (déclarations d’embauche, DAS…) etc. Ce mode d’acquisition leur donne forcément un caractère public mais les données appartiennent-elles pour autant à l’Etat ?

 

Il faut aussi repérer les données dont la collecte et la mise à jour relèvent d’un monopole naturel en raison de leur coût élevé, qui rend impossible ou, au moins, peu souhaitable, la duplication du travail de collecte, qui n’apporte aucune valeur ajoutée. C’est la problématique classique des réseaux, encore renforcée par le fait que les données peuvent être dupliquées indéfiniment sans connaître l’engorgement puis la saturation constatées sur les réseaux quand le trafic dépasse certains seuils.

 

b) Les traitements appliqués aux données

 

On oppose souvent données brutes et données élaborées. Les notions de données primaires et de données traitées paraissent plus pertinentes. Toute donnée est en effet élaborée : elle est collectée selon des spécifications précises, au moyen de capteurs parfois très complexes (tels qu’un instrument comme un thermomètre, une caméra, un récepteur GPS… , ou encore un formulaire qui pourra le cas échéant être rempli par un programme informatique), elle fait souvent l’objet de vérifications automatiques dans le cadre d’un modèle de données (plages de valeur, compatibilité avec d’autres données…).

 

Ainsi les données primaires, qui peuvent être extrêmement élaborées, se caractérisent par le fait qu’elles se trouvent en début de chaîne et qu’elles ont un caractère factuel (elles ne relèvent pas du droit d’auteur, de l’art ou de la subjectivité, contrairement à une carte). On dira que la position (l’adresse), le nom, les dimensions et les attributs d’un objet géographique élémentaire ont un caractère primaire. Ce n’est pas le cas de la représentation de ces données (sous forme de cartes, de tableaux de graphes…), ni des analyses et des simulations faites à partir de ces données, ni des objets complexes utilisant diverses sources de données primaires.

 

Les données primaires ont vocation à constituer la matière première à partir de laquelle vont être produits des données à valeur ajoutée et les services associés (comme les services d’annuaires, les calculs d’itinéraire et les aides à la navigation, les guides locaux, les services météo etc) sur divers supports (papier, CD ROM, services en ligne…).

 

c) l’utilisation des données

 

Il faut distinguer les types d’utilisateurs (citoyens, entreprises) et les types d’utilisation (données essentielles, les données de référence, données de base).

Les données essentielles sont définies par leur importance politique et sociale. Elles sont indispensables à l’exercice des droits des citoyens. Il s’agit notamment des lois et règlements (et des cartes et plans qui y sont associées comme les POS, les périmètres divers…), du plan cadastral, des adresses postales (non nominatives), des découpages administratifs et statistiques, des délibérations des collectivités et de leurs établissements publics, des informations sur le trafic routier et les transports publics, de la météo de base et des données sur les pollutions et les nuisances…

 

Les données géographiques de référence sont celles qui servent à positionner (géoréférencer) d’autres données. Pour bien remplir leur fonction ces référentiels doivent être uniques et d’un accès aisé. Ils permettent en effet de combiner les données entre elles. On y retrouve des données essentielles comme le plan cadastral, les adresses et les divers découpages, ainsi que le canevas géodésique (y compris le réseau actif formé de stations de GPS différentielles) et le fichier des voies (filaire, toponymie).

 

Les données de base sont celles servant à des utilisateurs divers pour des applications variées, par opposition aux données spécifiques ou thématiques qui n’intéressent que certains utilisateurs ou certaines applications. On trouvera par exemple parmi les données de base la BD Alti de l'IGN, la description de l'occupation de l'espace (hydrographie, réseau viaire et ferré, villes et villages), la plupart des données INSEE localisées, une orthophoto calée sur le canevas, l'archive numérisée de la couverture aérienne (photothèque de l'IGN), la liste des abonnés au téléphone…

 

Les données essentielles et les données de référence, qui se recoupent en partie, sont des sous-ensembles des données de base. Les données primaires sont souvent des données de base dans la mesure où elles servent de matière première à de nombreuses données à valeur ajoutée.

 

2. Les conditions d’accès aux données publiques

 

 

Le livre vert rappelle qu’il existe des réglementations nationales très diverses garantissant l’accès aux données publiques, avec de grandes différences dans les limites apportées à la règle d’accessibilité (notamment pour protéger certaines données ou limiter le coût pour les administrations) et dans les modalités d’accès en termes de délais, de volume et de format. Il pose en conséquence la question de savoir si ces différences peuvent constituer une barrière au niveau européen, pour quelles raisons et quelles solutions pourraient être envisagées.

 

Notre réponse est que cette diversité constitue à la fois une barrière et un élément important de renchérissement des données, qui en limitent l’utilisation. La diversité des règlements et la complexité de l’accès favorisent clairement les nationaux de chaque pays. Il est particulièrement difficile pour les non nationaux de savoir où se trouvent les données, dans quelles conditions on peut y accéder, quelles en sont les utilisations possibles. Les formats exotiques constituent aussi une barrière.

 

Il existe en outre de nombreux exemples où il existe des besoins transnationaux auxquels il est difficile de répondre (ou avec des retards et des surcoûts) en raison de la diversité des conditions nationales d’accès aux données publiques. On citera en particulier les annuaires téléphoniques et les bases de données routières.

 

C’est pourquoi il paraît nécessaire de formuler au niveau européen quelques principes simples en matière de droit d’accès et de diffusion de manière à garantir le droit à l’information des citoyens et la loyauté de la concurrence.

 

Le premier consiste à faire de l’accès aux données un droit pour tous les citoyens dans tous les pays de l’union. Ce droit ne peut être absolu mais seules les données ayant été définies expressément comme sensibles, par délibération motivée de leur détenteur, pourront rester inaccessibles. Pour concrétiser ce droit, les détenteurs de données publiques publieront la liste de leurs données (dictionnaires de données) sans attendre la réalisation des catalogues et outils prévus au point trois (métadonnées), ainsi que la liste des données sensibles.

 

Le second consiste à créer une obligation de mise en ligne des données numériques (à l’exception des données sensibles). Cela vise la quasi totalité des données publiques dans la mesure où le secteur public utilise des outils numériques pour produire, stocker et faire circuler ses données. L’expérience de la Loi de 1978 en France montre en effet que le droit d’accès reste en partie formel s’il n’est pas associé à une politique de diffusion. La mise des données en ligne constitue une sorte de moyen terme entre la diffusion (push) et l’accès (pull).

 

A ces deux principes de base pourrait s’ajouter une recommandation visant à la numérisation progressive, sous une forme économique (scan par exemple), des données anciennes. Cela vise en particulier l’archive de photos aériennes, l’ensemble des cartes anciennes, les données statistiques... Il faudrait également sanctionner la rétention de données publiques tant sous la forme de la dissimulation de leur existence que du refus injustifié d’y donner accès.

 

3. Instruments visant à faciliter l’accès

 

 

Le livre vert souligne le nombre très élevé de bases de données publiques, qui rend nécessaire la réalisation de mécanismes de recherche conviviaux, notamment au moyen d’annuaires et de catalogues (métadonnées). Il pose la question de l’intérêt de la mise place de tels outils au niveau européen et des modalités possibles pour une telle mise en place.

 

Il existe un très large consensus sur l’utilité des métadonnées. Il paraît indispensable de promouvoir leur mise en place dans chaque pays, dans le respect des standards. En revanche la réalisation d’outils spécifiques au niveau européen paraît plus discutable. Les outils de recherche standard d’Internet devraient suffire, sous réserve des aspects linguistiques (description des données dans plusieurs langues).

 

Il existe en outre un réel danger que la production de métadonnées, qui exige beaucoup de soins et de temps, ne serve d’alibi à une politique de restriction de l’accès et de la diffusion, le mieux étant souvent l’ennemi du bien. Il est important que la description des fichiers et de leurs différents champs et enregistrements et que les modèles de données soient publiés en l’état, sans retard, notamment en vue de l’accès aux données brutes.

 

4. La tarification des données publiques

 

 

Le livre vert donne des exemples de la grande disparité des tarifications pratiquées par les différents pays et signale la tendance à la diffusion gratuite de données sur Internet. Il propose que la politique de prix vise trois objectifs :

 

 

Le livre vert souligne que la réalisation de ces objectifs n’implique pas la gratuité des données au prétexte qu’elles ont été financées par les contribuables. Un certain prix peut être demandé, notamment pour les données qui n’intéressent qu’un nombre restreint d’utilisateurs prêts à payer pour les acquérir. Seules les données " essentielles " doivent faire l’objet de tarifs très bas pour en assurer l’accès à tous. Les détenteurs de données publiques doivent être encouragés à mettre leurs données à la disposition des industries du contenu, ce qui suppose que leurs efforts en ce sens soient rémunérés. Mais les tarifs pratiqués ne doivent pas non plus décourager le secteur privé d’investir dans cette branche…

 

Le livre vert pose deux questions en conclusion :

 

 

Ces deux questions appellent des réponses claires : oui les tarifs élevés pratiqués pour de nombreuses données publiques ont pour effet d’exclure un grand nombre d’utilisateurs potentiels (notamment le grand public et les PME) et de restreindre fortement le marché ; oui les différences au niveau européen avantagent les entreprises des pays qui ont les politiques de tarification les plus ouvertes.

 

Ces réponses doivent être complétées par un certain nombre de précisions et de propositions.

 

 

4.1 Le prix n’est qu’un élément de la politique de tarification

 

Pour les données numériques, les questions du nombre d’utilisateurs autorisés et des possibilités d’intégration simple à des données composites sont essentielles. Il faut en particulier faciliter le partage des données sur des Intranets et sur Internet et la libre utilisation des données de base (fonds de plan, découpages…).

 

 

4.2 La philosophie de la tarification doit être clairement affichée

 

Le choix en la matière est limité. Les principaux types de tarification sont les suivants :

 

La tarification au coût marginal de mise à disposition : ce coût est souvent très faible (surtout en ligne), débouchant sur une quasi gratuité. Il ne comprend pas les coûts de collecte, de mise à jour et de mise en forme. Cette philosophie exclut la perception de redevances de rediffusion, puisque le coût marginal est nul dans ce cas. Elle garantit une très large diffusion des données, mais elle doit être financée.

 

La tarification au coût total moyen de long terme, qui rapporte l’ensemble des coûts au nombre de ventes espérées sur le cycle de vie de la donnée. Cette politique exclut la réalisation de bénéfices.

 

La tarification aux prix de marché, en fonction de la valeur attachée aux données par les utilisateurs et au prix d’offre des données concurrentes. Des marges peuvent être dégagées. Elle n’est pas possible quand il n’existe pas d’offre concurrente et que le secteur public se trouve en position de monopole, comme cela arrive pour de nombreuses données. Ce monopole est atténué s’il y a possibilité de produire soi-même les données (données sur mesure) ou de leur substituer des données voisines (images satellitales par exemple).

 

La tarification à un prix de monopole optimisant le chiffre d’affaires ou la marge bénéficiaire. Cette politique, très fréquente même si elle n’est pas formalisée, conduit à des prix élevés pour les données numériques et restreint fortement l’utilisation des données.

 

Les deux dernières politiques transforment clairement les administrations en commerçants, ce qui peut entrer en contradiction avec leur statut ou avec leurs missions de service public. Quoi qu’il en soit, il est essentiel que les vendeurs de données publiques comme les utilisateurs soient précisément informés de la philosophie de tarification applicable aux données qu’ils diffusent ou achètent, qui doit faire l’objet de décisions politiques explicites.

 

 

4.3 Ne pas pénaliser les données numériques

 

Lorsqu’elles sont sur support papier, de très nombreuses données géographiques sont diffusées gratuitement (consultation, affichage) ou au coût de mise à disposition (et parfois moins) : c’est le cas par exemple des cartes et des photos aériennes de l’IGN, du plan cadastral, des données de l’INSEE, de l’annuaire du téléphone… Ce faisant l’Etat reconnaît le caractère essentiel de ces données et l’impossibilité de facturer leur coût de collecte, de mise à jour et de mise en forme.

Le prix de ces données explose dès qu’elles passent sur support numérique : il est multiplié par 10, par 100 et parfois plus aux termes de licences restreignant le nombre d’utilisateurs et les utilisations admises. Par exemple le droit de scan d’une carte IGN est de l’ordre de 100 fois le prix de vente de la carte. Il était question jusqu’en 1998 de facturer la feuille cadastrale numérique 800 Francs, soit plus de 10 fois le prix de la planche papier.

 

Il s’agit clairement de faire payer aux acheteurs une partie des coûts de collecte et de mise à jour, puisque le coût de diffusion sous cette forme est bien moindre : il est divisé par dix, par cent et parfois plus. Le coût d’impression de l’annuaire atteint par exemple plusieurs centaines de millions de francs, sans comparaison avec celui de sa mise en ligne ou du pressage d’un CD ROM… La diffusion du plan cadastral et de la matrice sous forme papier est extrêmement onéreuse…

 

Mais ne faut-il pas financer le coût de la numérisation des données papier ? Ce motif ne peut être que transitoire : les outils numériques s’imposent de plus en plus dans tout le cycle de vie de la donnée précisément parce qu’ils permettent une très forte réduction des coûts. Toutes les données ont vocation à être produites par voie numérique et la numérisation ne concerne que l’archive : faut-il pour autant la facturer à un prix plus élevé que les données " fraîches " ?

 

Il est vrai que le support numérique facilite grandement la diffusion et l’utilisation des données, augmentant d’autant leur valeur d’usage… C’est cette caractéristique qui permet, en situation de monopole, de facturer plus cher des données moins coûteuses, les détenteurs des outils numériques et de l’expertise nécessaires à l’utilisation des données numériques (administrations, entreprises…) étant censés pouvoir supporter des prix plus élevés que les autres utilisateurs. L’administration a trouvé ainsi un moyen commode d’augmenter ses recettes commerciales, au détriment du développement du marché de la donnée géographique numérique.

 

On passe ainsi d’une politique de large diffusion des données papier à la recherche de recettes commerciales maximales sur les données numériques. Ce renversement contredit la volonté souvent affichée de favoriser la diffusion des données et de permettre l’émergence d’une société de l’information ouverte à tous. C’est pourquoi il serait souhaitable de poser comme principe l’égalité de traitement tarifaire entre les données numériques et leur équivalent papier (même philosophie de tarification). On pourra même tenir compte des coûts respectifs des différents supports (données numériques moins chères) de manière à faire bénéficier les utilisateurs des économies apportées par les nouvelles technologies.

 

 

4.4 Propositions de tarification en fonction des catégories de données

 

Il est proposé de tenir compte pour la tarification à la fois des conditions de collecte des données, de leur degré d’élaboration et des types d’utilisation. Le tableau suivant résume succinctement les principaux cas de figure.

 

Principes de tarification des données publiques

 

Type de données

Données essentielles

Données de référence

Données de base

Données thématiques

Sous-produit (1)

Monopole naturel

Contraintes régaliennes (3)

Données primaires

 

Données à valeur ajoutée

Coût de M.A.D. (2)

Coût de M.A.D. (2)

 

Coût de M.A.D. (2)

 

Coût de M.A.D. (2)

Coût de M.A.D. (2)

Coût moyen (4)

ou prix de marché (5)

Coût moyen (4)

ou prix de marché (5)

Non applicable

Coût de M.A.D. (2)

Coût moyen (4)

 

Prix de marché (6)

 

Prix de marché (6)

 

 

(1) Données résultant du fonctionnement du service public ou nécessaires à ce fonctionnement, par opposition aux données qui sont l’objet même du service public. Voir 1.2 (a).

(2) Coût marginal de mise à disposition, excluant les coûts fixes de collecte, de mise à jour et de mise en forme. La tarification au coût marginal de M.A.D exclut la perception de redevances de rediffusion. La gratuité peut être justifiée pour certaines données essentielles.

(3) Données collectées dans le cadre d’un monopole naturel ou de contraintes régaliennes. Voir 1.2 (a).

(4) Le coût moyen inclut l’ensemble des coûts pendant le cycle de vie de la donnée. Il implique la perception d licences de rediffusion.

(5) Le coût moyen peu être supérieur au prix de marché : dans ce cas, les données de base doivent être cédées en dessous du coût moyen afin de permettre leur utilisation effective (notamment comme matière première pour les données à valeur ajoutée).

(6) Le prix de marché n’est applicable que s’il existe un marché (offres concurrentes). En l’absence de concurrence, on se référera au coût moyen.

 

Cette typologie exclut les pratiques actuelles consistant à maximiser les recettes commerciales des administrations quand elles sont en position de monopole.

 

 

4.5 La nécessité d’une régulation

 

 

La complexité des questions de tarification et les conflits qu’elles peuvent générer entre les vendeurs et les utilisateurs justifient la création d’une instance de régulation pour enregistrer les philosophies de tarification, vérifier leur application au travers des tarifs publiés et arbitrer les conflits éventuels.

 

Le Conseil de la Concurrence fait fonction de régulateur chaque fois que la concurrence est en cause. Mais on a vu que de nombreuses données publiques sont produites nécessairement dans le cadre de monopoles. En outre la rétention des données (par refus d’accès ou par tarification dissuasive) a pour effet d’empêcher la création de marchés (notamment pour les données à valeur ajoutée). La compétence du Conseil de la Concurrence est alors contestée.

 

La tutelle administrative joue aussi un rôle de régulation à travers l’approbation des tarifs et la participation aux processus de décisions. L’expérience montre toutefois qu’elle manque souvent de la distance nécessaire et les logiques propres à l’administration passent souvent avant les objectifs que cette dernière est censée servir. Il existe en particulier une tendance forte des monopoles, y compris les monopoles privés (voir Microsoft), à étendre ce monopole en s’appuyant sur leurs rentes. Ainsi la maîtrise des données primaires conduira à vouloir contrôler le marché des données à valeur ajoutée, le plus intéressant commercialement, et celui des services associés.

 

On a vu enfin qu’une tarification au coût marginal de mise à disposition ou au coût moyen de longue durée est souvent souhaitable, même en l’absence de monopole public. Or la détermination de ces coûts est souvent complexe, même lorsqu’une comptabilité analytique existe. L’imputation des coûts indirects et la distinction des coûts de collecte et des coûts de diffusion passent par des arbitrages qu’une instance indépendante doit valider.

 

Pour toutes ces raisons il paraît indispensable de mettre en place, dans l’ensemble des pays européens, des instances de régulation ouvertes à tous.

 

5. Aspects de concurrence

 

 

Après avoir montré que la concurrence peut subir dans certains cas des distorsions comme la vente de données à des prix inférieurs aux coûts normaux ou l’attribution d’exclusivités au profit d’organismes publics ou privés, le Livre Vert constate que les réglementations nationales sont très variées et rappelle que le traité de Rome définit des règles protectrices en matière de concurrence, avec des possibilités de dérogations au profit de " services d’intérêt économique général ". Ces règles encadrent en particulier les subventions des Etats et visent à empêcher les abus de position dominante, notamment en cas de monopole. La mise en concurrence s’impose aux marchés publics pour l’attribution des marchés d’édition et de distribution de données.

 

Après avoir signalé que le déploiement des nouvelles technologies a des conséquences importantes sur les coûts de collecte et de diffusion des données, conséquences qui peuvent rendre nécessaires certaines évolutions, le Livre Vert demande dans quelle mesure les activités du secteur public pourraient, dans le secteur de l’information, créer une concurrence déloyale au niveau européen.

 

La réponse est qu’il existe effectivement de nombreuses distorsions à la concurrence qui ont pour effet de rendre plus difficile la pénétration de chaque marché national par les acteurs non nationaux, retardant d’autant l’émergence d’un marché européen de l’information.

 

Les principales atteintes à la concurrence sont les suivantes :

 

 

Il paraît en particulier très difficile de demander à une administration de poursuivre à la fois des missions de service public (notamment pour la collecte et la diffusion de données primaires, de données de base et de données essentielles) et des objectifs commerciaux de maximisation des recettes, notamment par la valorisation des données primaires.

 

En intervenant dans le secteur de la valeur ajoutée les producteurs de données publiques entrent en concurrence avec les éditeurs privés et sont tentés de ne pas diffuser les données primaires et les données de base (en invoquant par exemple une qualité ou une sécurité insuffisantes), ou de les vendre au même prix que leurs données à valeur ajoutée (comme France Télécom dans le cas de Filetech). Le résultat est le même : assurer au producteur public un quasi-monopole et des prix élevés.

 

Or les missions de service public ont précisément pour raison d’être de pallier les défaillances du marché et de garantir la diffusion des données à des prix correspondant aux possibilités du plus grand nombre.

 

C’est pourquoi il paraît nécessaire de définir au niveau européen un petit nombre de recommandations, pour favoriser une bonne articulation entre les rôles complémentaires des producteurs publics et de l’industrie privée de l’information :

 

1. Bien définir les missions de service public, en précisant leur justification et les principes de tarification des données qui en découle. Prévoir une actualisation périodique de cette définition pour prendre en compte l’impact des nouvelles technologies et du déploiement de la société de l’information.

 

2. Confier au secteur privé, chaque fois que cela est possible, la tâche de diffuser les données publiques et de les valoriser, en faisant jouer pleinement la concurrence (ni concessions, ni exclusivités).

 

3. Veiller, lorsque l’intervention des producteurs publics est souhaitable pour la diffusion ou la valorisation des données publiques, à la loyauté de la concurrence. Cela passe par un accès réel aux données primaires aux mêmes conditions que l’organisme public et par la séparation claire des opérations commerciales et des opérations de services publics (risque de subventions déguisées). La création de filiales commerciales de droit privé semble être, dans ce cas, la meilleure solution, compte tenu des contraintes propres à la comptabilité publique.

 

4. Confier au secteur privé, chaque fois que cela est possible, la collecte et la mise à jour des données publiques dans le cadre de spécifications définies par l’administration et de marchés remis régulièrement en concurrence.

 

5. Confier à l’organe de régulation (voir le point 4 relatif à la tarification) une mission d’arbitrage, notamment lorsque l’absence de marché (monopole de fait des producteurs publics) pourrait rendre le Conseil de la Concurrence incompétent.

 

6. Aspects liés au droit d’auteur

 

 

Le livre vert rappelle que le secteur public peut se fonder sur le droit d’auteur pour se procurer des revenus ou pour garantir l’intégrité des données (notamment pour des problèmes de sécurité et de responsabilité), mais qu’il peut aussi y renoncer pour certaines données. Il pose la question de savoir dans quelle mesure les différents régimes de droit d’auteur peuvent constituer une barrière à l’exploitation des données publiques.

 

La réponse est que le droit d’auteur constitue bien une telle barrière dans la mesure où le droit d’auteur est le seul moyen juridique de faire valoir des droits sur une donnée et que de plus en plus d’organismes souhaitent obtenir des compléments de revenus en valorisant leurs données.

 

Il convient toutefois de préciser que le droit d’auteur au sens strict fait référence à une création personnelle ce qui est rarement le cas en l’espèce. Il est en effet difficile de reconnaître la marque des auteurs dans la liste des abonnés du téléphone, le bulletin de la météo marine, le nom d’un lieu-dit, les coordonnées d’un objet géographique, la forme d’une parcelle… La notion s’applique aux cartes et à la présentation des données lorsqu’elle fait preuve d’un minimum d’originalité la distinguant des présentations habituelles, mais pas aux données factuelles… C’est pourquoi il a paru nécessaire de créer un droit nouveau, dit droit sui generis, protégeant le contenu des bases de données même si ce contenu ne relève pas en lui-même du droit d’auteur.

 

Il est clair que le secteur public peut légitimement s’appuyer sur ce droit sui generis pour valoriser ses données. Mais cela n’implique qu’il doive le faire. Il y a en effet un risque sérieux de dérive, notamment pour les données qui sont un sous-produit de l’activité administrative : la vente de ces données devient une fin en soi alors que leur collecte est au départ un moyen d’accomplir des missions de service public et l’administration se transforme en commerçant sans en avoir le statut ni les moyens.

 

On invoque parfois le fait que les recettes commerciales peuvent constituer une incitation à la diffusion des données, sans toujours bien mesurer que l’on passe ainsi d’une logique administrative (exécuter des missions de service public) à une logique économique (générer des recettes). L’administration est souvent mal outillée pour gérer ces recettes qui, en droit commun, tombent dans la caisse commune (principe de l’universalité de caisse). Il existe d’autres moyens d’évaluer la capacité des services à remplir leurs tâches, parmi lesquelles peuvent figurer la collecte et la diffusion des données.

 

Enfin l’application du droit d’auteur aux bâtiments, aux jardins ou aménagements ayant un maître d’œuvre peut poser un sérieux problème pour les bases de données comprenant des plans, des images aériennes ou des photos, de plus en plus utilisés pour la description de l’espace et le repérage des voyageurs. La tendance des tribunaux est de reconnaître un droit non seulement aux auteurs mais aussi aux propriétaires, sans limitation de durée, conduisant à une privatisation partielle de l’espace public.

 

Bien que cela dépasse le champ strict des données publiques, il est important de reconnaître au niveau européen un droit de publier des photos ou des représentations 2D ou 3D (schémas, dessins, axonométries…) de l’ensemble des bâtiments, équipements et aménagements paysagers publics ou visibles depuis les espaces ouverts au public, en limitant strictement l’application du droit d’auteur, pour une durée limitée et au bénéfice des seuls auteurs, aux publications visant expressément la création architecturale ou paysagère.

 

C’est pourquoi il paraît nécessaire de recommander au niveau européen que soit publiée, dans chaque pays, la liste des données essentielles et de référence sur lesquelles le secteur public renonce expressément à faire valoir des droits sui generis. Cette renonciation peut s’accompagner de prescriptions comme la mention obligatoire de la source et la préservation de l’intégrité des données, dans une démarche proche de celle des logiciels libres.

 

7. Aspects liés à la protection de la vie privée

 

 

Le livre vert rappelle que de nombreuses données publiques ont un caractère nominatif et que l’émergence de la société de l’information peut induire des risques nouveaux, notamment à travers l’internet. Une directive européenne protège depuis 1995 les données à caractère personnel, conduisant à une harmonisation des diverses règles nationales. Elle consacre le principe de finalité, qui peut empêcher certaines utilisations des données publiques.

 

Cela conduit le livre vert à poser une double question : les considérations liées au respect de la vie privée méritent-elles une attention particulière pour l’exploitation des données publiques ? Des intérêts commerciaux peuvent-ils justifier un accès aux données personnelles détenues par le secteur public ?

 

Ces questions, qui ne peuvent avoir une réponse simple, appellent d’abord quatre remarques préliminaires.

 

1. Il faut bien voir, tout d’abord, que très nombreuses données géographiques publiques comprennent des adresses postales et des numéros de téléphone, données personnelles particulièrement sensibles dans la mesure où elles donnent accès aux personnes face à face ou par courrier, téléphone, fax, mél etc., ce qui peut déranger (courriers non désirés) certaines personnes, voire les mettre en danger.

 

2. La numérisation des données puis leur mise en ligne en facilitent grandement l’accès, notamment avec des moteurs de recherche puissants. Parmi les données en libre consultation sur support papier comme les listes électorales, la matrice cadastrale (fichier des propriétaires, fichier des propriétés, évaluations cadastrales) etc. un certain nombre n’ont pas leur place sur l’internet.

 

3. Les différents moyens mis en place pour protéger la vie privée face à ces nouveaux risques, comme les différentes listes (rouge, orange, safran, stop publicité etc.) ou le droit d’accès aux données personnelles se révèlent d’une efficacité limitée et sont difficiles à utiliser pour un grand nombre de citoyens. Elles peuvent en outre avoir des effets pervers en empêchant des communications légitimes, voire essentielles.

 

4. Les nouvelles technologies apportent aussi des outils pouvant contribuer à une protection efficace de la vie privée comme la cryptographie (secret des communications, authentification des correspondants), l’identifiant de l’appelant, le filtrage des appels et des méls, la protection de l’anonymat (porte-monnaie électronique, pseudos…) etc.

 

Le marketing direct, le géomarketing et le commerce électronique sont de grands utilisateurs potentiels de données publiques à caractère personnel. C’est ainsi que le nouveau contrat de France Télécom prévoit expressément la possibilité de commercialiser les données personnelles. Cela n’a rien de scandaleux en soi, sous réserve de bien informer les intéressés, d’obtenir leur accord explicite et de leur donner un moyen efficace de contrôler l’utilisation qui est faite des données qui les concernent. Bien connaître les clients, adapter l’offre à leurs besoins, ce seront de plus en plus des moyens obligés du développement économique.

 

La directive européenne de 1995 ne fait pas de distinction entre données publiques et données privées, si ce n’est la référence, à l’article 7, à la légitimité de certains traitements résultant d’une " nécessité objective " en application des lois et règlements ou pour la réalisation de missions de service public. L’utilisation des données publiques à caractère personnel appelle ainsi ni plus ni moins de vigilance que celle des données privées.

 

Le rapport Braibant, relatif à la transposition de cette directive en droit français, signale toutefois les contradictions qui peuvent naître entre les principes du libre accès à l’information (fondement de la démocratie), de la liberté d’expression et de la liberté d’entreprendre (pour l’industrie de l’information) et celui de la protection des données dès lors qu’elles prennent un caractère personnel direct ou indirect. C’est pourquoi cette protection ne saurait être absolue et ne doit pas conduire à des atteintes non nécessaires ou disproportionnées à l’accès à l’information.

 

C’est ainsi qu’une grande partie des données du recensement de 1990 est sous embargo pour les zones infracommunales de moins de 5000 habitants, alors que ces données sont essentielles pour les analyses urbaines (notamment pour l’étude des mécanismes de ségrégation spatiale qui renforcent les processus d’exclusion), pour l’optimisation de l’offre d’équipements publics adaptés aux besoins de la population et pour celle de l’offre de services privés (géomarketing). La raison invoquée est que ces données pourraient, à l’échelle de l’îlot, devenir indirectement nominatives. La réalité est que l’on n’a pas d’exemple d’atteinte à la vie privée résultant de la libre diffusion de ces données aux Etats-Unis et dans de nombreux pays.

 

Ainsi un risque très faible conduit à une mesure d’embargo très forte, non proportionnée au risque. En outre cet embargo pénalise fortement l’industrie de l’information en France, contrainte à des travaux coûteux pour réaliser des estimations approximatives des données mises sous embargo. Il y a là une source forte d’inégalité entre les pays.

 

Il nous semble en conséquence que le débat sur les données publiques devrait conduire à compléter la directive de 1995, afin de renforcer à la fois l’accès aux données publiques et la protection des données personnelles, en tenant compte de la mutation complète du paysage induite par l’émergence de la société de l’information et de l’internet. La directive de 1995 est aujourd’hui dépassée sur plusieurs points.

 

Les compléments pourraient porter sur quatre points principaux.

 

1. Mieux définir, au cas par cas, l’ensemble des finalités de la collecte, des traitements et de la diffusion des données publiques, en rappelant la possibilité de les utiliser, au-delà de la stricte réalisation de missions de service public, aux fins de l’information des citoyens et du développement économique et social. Le déploiement de la société de l’information implique en particulier une très large diffusion des adresses de toute nature afin de favoriser une communication efficace entre les personnes.

 

2. Mieux protéger les personnes contre les atteintes à leur vie privée et les risques liés à l’utilisation des données les concernant. Cela concerne notamment le droit d’accès et la protection contre les démarches intrusives.

 

Pour l’immense majorité des personnes le droit à l’information préalable, le droit d’accès et le droit de rectification sont largement théoriques. Il est possible aujourd’hui de concrétiser ces droits grâce aux nouveaux outils informatiques. Cela fait partie des missions de service public : il faut assurer concrètement à chaque citoyen un accès gratuit et facile à tous les fichiers qui le concernent, y compris au niveau européen.

 

Pour se protéger contre l’intrusion, chacun est obligé de s’inscrire sur différentes listes en fonction des opérateurs de réseaux, des éditeurs de données ou des gestionnaires de services. Les personnes qui entendent ne pas recevoir de courriers ou d’appels non sollicités devraient pouvoir s’inscrire auprès d’un guichet unique, qui pourrait expurger, gratuitement ou à très bas prix, dans le cadre du service public, tous les fichiers de prospection. Le recours à ce service serait obligatoire préalablement à toute cession de fichiers.

 

Un effort est également nécessaire pour sensibiliser les citoyens et diffuser les outils nécessaires à leur information et à leur protection : messageries, pseudos, boîtes postales, clés de cryptographie etc. Mettre les nouvelles technologies au service de la protection de la vie privée permet de dépasser en partie les contradictions entre le besoin de transparence et de circulation des données et la nécessité d’empêcher les utilisations abusives des données personnelles.

 

3. Renforcer les sanctions contre les atteintes à la vie privée, notamment en clarifiant le droit des personnes concernées à obtenir réparation en cas de traitement clandestin, illicite ou de nature à leur porter préjudice (par exemple pour obtenir une embauche, un emprunt, une assurance etc. ou sous forme d’intrusion injustifiée…), sans aller forcément au pénal.

 

4. Elargir les missions et les moyens de la CNIL. Le rapport Braibant comprend plusieurs propositions utiles en ce sens. Il faudrait aller plus loin en associant l’accès à l’information et la protection des données personnelles, comme l’ont fait certains pays. La CNIL pourrait reprendre les missions de la CADA, en les actualisant pour tenir compte du nouveau contexte technique (NTIC), économique (baisse verticale des coûts de traitement et de diffusion) et politique (volonté de transparence et aspiration à l’information). Tempérer le droit à l’information, dont l’importance vitale ne cesse de croître, par la protection de la vie privée est indispensable. Cela peut difficilement résulter du choc de deux logiques qui s’affrontent : il faut, au cas par cas, conserver le souci d’assurer à la fois la plus grande transparence et la meilleure protection en profitant des nouveaux outils disponibles.

 

Conclusion provisoire

 

 

Les données publiques géographiques ont une spécificité qui tient au fait qu’elles se caractérisent par un localisant dont l’importance va croissant (adresse, dimension spatiale), que les producteurs publics jouent encore un rôle essentiel (IGN, GDGI, INSEE, Météo France, France Télécom…) et qu’il est essentiel de disposer de données de référence uniques (pour pouvoir associer les données de différentes source). Cela rend nécessaire que des dispositions soient prise au niveau européen pour en faciliter l’accès et l’exploitation.

 

Comme le rapport Braibant l’a bien souligné, il est difficile de séparer l’accès aux données et la protection des données personnelles. En adoptant sur ce dernier sujet une directive en 1995, l’Union Européenne a reconnu l’importance de la circulation des données entre les pays membres et les entraves qui peuvent résulter de l’application de règles trop différentes dans le domaine de la protection des données personnelles.

 

Le même raisonnement vaut a fortiori pour l’accès et la diffusion des données publiques. Une directive est probablement nécessaire, à défaut des recommandations sont indispensables. Le développement du commerce électronique est reconnu comme l’un des grands enjeux des prochaines années. Il ne peut être séparé de la circulation des données qui sont à la fois un des objets importants de ce commerce et un des moyens de le développer. Dans ce cadre les données géographiques publiques prennent une importance particulière et doivent être expressément visées par les recommandations a adopter au niveau européen.

 

Page précédente