Data visualisation : quelles données pouvez-vous utiliser sans risque ?

09/07/2013 par Suzanne GALY.
  • Diminuer la taille de la police
  • Agrandir la taille de la police
Exemple de data visualisation : une cartographie réalisée avec Google Fusion Tables

Toutes les données pouvant faire l’objet d’une data visualisation par des journalistes, blogueurs ou citoyens internautes n’ont pas été ouvertes pour permettre leur réutilisation par des tiers. Loin s’en faut. Dans quel cadre pouvez-vous utiliser ces données sans risquer des poursuites judiciaires ?

Partons d’un cas concret :

Un blogueur à forte sensibilité citoyenne souhaite créer et publier une carte des assistantes maternelles dans sa ville. Il pense que c’est bien pratique pour les parents cherchant un mode de garde à proximité de leur domicile... Il pense aussi que cette carte aurait valeur d’information au public et qu’il est donc bien légitime de vouloir la produire.

Exemple de cartographie créée avec Google Fusion TablesIl cherche donc sur internet et déniche, sur le site de sa ville, un listing téléchargeable sous la forme d’un fichier PDF (un format contenant des données non « ouvertes »). Celui-ci dresse les noms, adresses et numéros de téléphone des assistantes maternelles présentes sur la commune.

Il extrait ces informations et les modifie de manière à pouvoir les insérer dans un tableur.

Il créé ainsi une base de données puis procède à une opération de géocodage des adresses de la liste.

Le blogueur a produit une carte et peut la diffuser sur internet.

  • Le caractère « ouvert » des données est entendu ici dans le contexte du mouvement open data, c’est à dire que les données ont été préparées pour permettre leur réutilisation par des tiers : elles sont gratuites, complètes, sans erreurs, relativement complètes et mises en forme de manière à permettre un traitement facilité (elles sont par exemple mises à disposition sous forme de tableurs). A priori, elles respectent les réglementations relatives au droit à l’information, à la protection de la vie privée et au secret en matière commerciale et industrielle. Enfin, elles sont régies par une licence juridique cadrant les règles de leur(s) réutilisation(s). Lire aussi le Guide juridique d'AEC « les données publiques »

Donnée publique ou donnée privée ?

Le document PDF concerné ayant été trouvé sur un site internet édité par la ville en question, il peut apparemment être considéré comme un document administratif (au sens de la loi Cada de 1978) car il a été publié par une administration (ici, la mairie) dans le cadre d’une mission de service public (ici, le service public de la petite enfance).

Dessin d'une mairie - DRLa Cnil rappelle par ailleurs que “les informations figurant dans des documents produits ou reçus par les administrations, peuvent être utilisées par toute personne qui le souhaite à d’autres fins que celles de la mission de service public pour les besoins de laquelle les documents ont été produits ou reçus”.

Dans ce cas précis, que les données contenues dans le document PDF soient « ouvertes » ou non n’y change rien : elles sont des données publiques au sens de la loi Cada et sont, en conséquence, librement réutilisables.

Par ailleurs, la responsabilité juridique liée à la « valeur » et/ou à l’« exactitude » des données pèse sur la personne qui les a collectées (ici, la liste des assistantes maternelles agréées a été établie à l’origine par le Conseil général qui délivre l’agrément).

Le blogueur se contentant de réutiliser lesdites données pour créer une data visualisation, il ne peut donc pas voir sa responsabilité juridique engagée du fait du contenu autant que de la publication du document PDF.

Une base de données, quelque soit son origine ou son contenu, bénéficie toujours d’une protection juridique. Si elle n’a jamais fait l’objet d’une mise à disposition du public, elle bénéficie en plus d’une protection au titre du secret des affaires.

En revanche, la publication des informations contenues dans cette base de données sous la forme d’un article ou d’une data visualisation est a priori autorisée car les données sont « remaniées ». En revanche, les données ou le document qui les contient ne doit pas être directement remis à disposition (pas de risques de contrefaçon).

Que la base de données soit publique ou privé, le blogueur qui souhaite réutiliser les informations contenues dans le document PDF doit respecter la loi Informatique et libertés de 1978 en évitant de porter « atteinte à la protection de la vie privée, au secret médical et au secret en matière commerciale et industrielle ».

La qualification juridique des données : personnelles ou professionnelles ?

Les données contenant, par exemple, des noms, adresses et/ou numéros de téléphone des assistantes maternelles sont-elles considérées comme « personnelles » au sens de la loi Informatique et liberté de 1978 ?

Illustration générique protection des données personnellesLa question est épineuse car, ici, la personne est identifiée au titre de son activité professionnelle. « Il paraît possible de défendre l’hypothèse selon laquelle ce genre de données présente un caractère professionnel et sont publiées dans un cadre d’information au public » considère Cédric Favre, juriste TIC à AEC.

Pourtant, la Commission d'accès aux documents administratifs (Cada) a rendu récemment un avis qui s’oppose à cette interprétation.

Le site Fourmi santé est un service en ligne qui proposait un comparateur des tarifs des médecins. Il utilise entre autres les données d’Ameli.fr. La Cada a estimé que les noms des médecins étaient bien des données personnelles, et qu’il fallait donc leur autorisation pour les utiliser ailleurs que sur Ameli.fr.

Conclusion, si l’on s’en tient à ces avis, notre blogueur doit préalablement disposer de l’autorisation lui permettant de réutiliser les données identifiant les assistantes maternelles, alors même que le document PDF qui les contient est librement accessible en ligne.

Du fait que ces données ont, selon la Cada, un caractère privé et un défaut d’autorisation quant à leur réutilisation, notre blogueur s’expose à un risque juridique (mise en jeu de sa responsabilité).

De même, la personne qui a collectées ses mêmes données doit, dès le départ, disposer de l’autorisation lui permettant de les diffuser et/ou de les faire diffuser par des tiers. Si aucune autorisation de diffusion n’a été accordée par les assistantes maternelle lors de la constitution de la base de données, tous les diffuseurs (dont la ville qui les a collectées) peuvent être considérés comme fautifs.

Lire aussi l'article de la Gazette des Communes "Open data et données personnelles : mythes et réalité mouvante"

  • La loi de 1978 énonce que les données personnelles « sont collectées pour des finalités déterminées, explicites et légitimes et ne sont pas traitées ultérieurement de manière incompatible avec ces finalités. » (www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000006068624&dateTexte=vig). Selon l’article 13, il faut que les personnes auprès desquelles sont recueillies les données soient informées « de l’identité du responsable du traitement, de la finalité poursuivie par le traitement, du caractère obligatoire ou facultatif des informations qui lui sont demandées, des destinataires des données, des modalités d’exercice de ses droits d’opposition, d’accès et de rectification ».

L’altération et/ou la modification des données publiées

Si l’on considère qu’il s’agit de données publiques « remaniées » par le blogueur pour générer une data visualisation, ceci peut être identifié, au sens de l’article 12 de la loi Cada, comme une altération ou une dénaturation des données. Le blogueur peut alors voir sa responsabilité engagée à ce titre. Dans ce cas, il est recommandé au blogueur d’indiquer un mail de contact pour toute réclamation ou demande et de mettre à disposition du public le tableur qu’il a créé pour générer la data visualisation.

Il s’agit ici de faire preuve de transparence et de pédagogie.

La mise à jour des données publiées

Dans deux ans, la cartographie réalisée par le blogueur risque de ne plus être à jour. Les professionnelles (assistantes maternelles) qui auront alors connues des changements (d’activité, de lieu de travail, etc.) seront alors en droit d’exiger une ou plusieurs modifications de sur cette carte. Le blogueur devra alors agir avec diligence et procéder aux modifications demandées.

Sur la visualisation de données, lire aussi :

Mots clefs
bonnes-pratiques - cartographie - données - Médias - propriété-intellectuelle - Usages - web 2.0
ImprimerImprimer EnvoyerEnvoyer