Open Data 5 ★

Tim Berners-Lee, principal inventeur du Web et instigateur des Linked Data, a suggéré un programme de déploiement en 5 étoiles pour l’Open Data. Voici quelques exemples qui détaillent chacune des étapes que représentent ces étoiles, avec les coûts et bénéfices qui les accompagnent.

Étapes en 5 étoiles par l’exemple

Par l’exemple …

Ci-dessous, quelques exemples pour chaque étape du programme 5 étoiles pour l’Open Data de Tim Berners-Lee. Les données présentées en exemple correspondent ‘aux prévisions des températures à Galway, en Irlande, pour les trois prochains jours’:

    • publiez vos données sur le Web (peu importe leur format) avec une licence ouverte1
    • exemple …
  • ★★
    • publiez-les en tant que données structurées (par exemple, un document Excel au lieu d’une image scannée d’un tableau)2
    • exemple …
  • ★★★
    • publiez-les dans un format ouvert et non-propriétaire (par exemple, un CSV plutôt qu’un Excel)3
    • exemple …
  • ★★★★
    • utilisez des URI pour désigner des choses dans vos données, afin que les gens puissent faire des références à celles-ci4
    • exemple …
  • ★★★★★
    • liez vos données à d’autres données pour y ajouter du contexte5
    • exemple …

Coût et bénéfices …

Quels sont les coûts et bénéfices des données Web  ?

En tant que consommateur …

  • ✔ Vous pouvez y jeter un œil.
  • ✔ Vous pouvez les imprimer.
  • ✔ Vous pouvez les enregistrer localement (sur votre disque-dur ou dans une clé USB).
  • ✔ Vous pouvez introduire ces données dans un autre système.
  • ✔ Vous pouvez modifier ces données à votre guise.
  • ✔ Vous pouvez partager ces données avec ceux que vous voulez.

En tant qu’éditeur …

  • ✔ C’est simple à publier.
  • ✔ Vous n’avez pas à expliquer continuellement aux autres qu’il peuvent utiliser vos données.

“C’est bien de pouvoir accéder aux données sur le Web sous une licence ouverte (comme PDDL, ODC-by ou CC0), cependant, les données sont verrouillées dans un document. À moins de créer un outil spécifique, extraire les données de ce document ne sera pas chose aisée.”

Quels sont les coûts et bénéfices des données Web ★★ ?

En tant que consommateur, vous pouvez faire tout ce que vous pouvez faire avec des données Web , et plus encore :

  • ✔ Vous pouvez directement les traiter avec un logiciel propriétaire pour les aggréger, effectuer des calculs, les visualiser, etc.
  • ✔ Vous pouvez les exporter dans un autre format (structuré).

En tant qu’éditeur …

  • ✔ C’est toujours facile à publier.

“Splendide ! Les données sont accessibles sur le Web de façon structurée (autrement dit, lisible par une machine), cependant, les données sont toujours verrouillées dans un document. Pour extraire ces données du document, vous dépendez d’un logiciel propriétaire.”

Quels sont les coûts et bénéfices des données Web ★★★ ?

En tant que consommateur, vous pouvez faire tout ce que vous pouvez faire avec des données Web ★★, et plus encore :

  • ✔ Vous pouvez manipuler les données comme bon vous semble, sans nécessiter l’obtention d’aucun logiciel propriétaire.

En tant qu’éditeur …

  • ⚠ Vous pourriez avoir besoin de convertisseurs ou d’extensions pour exporter vos données depuis un format propriétaire.
  • ✔ Ça reste encore assez simple à publier.

“Excellent ! Les données sont non seulement disponible via le Web, mais à présent tous le monde peut utiliser ces données facilement. D’un autre côté, ce sont toujours des données sur le Web et non des données dans le Web.”

Quels sont les coûts et bénéfices des données Web ★★★★ ?

En tant que consommateur, vous pouvez faire tout ce que vous pouvez faire avec des données Web ★★★, et plus encore :

  • ✔ Vous pouvez faire des liens vers elles depuis n’importe quel autre endroit (sur le Web ou localement).
  • ✔ Vous pouvez les mettre en favori (ou marque-page).
  • ✔ Vous pouvez réutiliser des parties de ces données.
  • ✔ Vous pourrez réutiliser des outils et des librairies existants, même si les modèles utilisés par l’éditeur ne sont pas entièrement supportés.
  • ⚠ La compréhension de la structure d’une “graphe” RDF peut être plus difficile, comparée à des données tabulaires (Excel/CSV) ou une arbologie (XML/JSON).
  • ✔ Vous pouvez combiner des données avec d’autres données sans danger. Les URI sont un protocole global, de telle sorte que si deux choses ont le même URI, c’est que c’est que c’est intentionnel et si tel est le cas, c’est que c’est en bonne voix pour devenir des données 5 étoiles&nbps;

En tant qu’éditeur …

  • ✔ Vous avez une granularité de controle très fine sur les items de ces données et pouvez optimisez leur accès (balance de charge, mise en cache, etc).
  • ✔ D’autres éditeurs de données peuvent faire des liens vers des unités précises de vos données, se promouvant de fait en 5 étoiles !
  • ⚠ Vous investissez du temps à découper et recouper vos données.
  • ⚠ Vous allez avoir besoin d’assigner des URI à des unités de données et penser à comment représenter les données.
  • ⚠ Vous avez besoin de trouver des modèles existants à réutiliser, ou de créer les votres.

“Merveilleux! Maintenant, ce sont des données dans le Web. Les (plus importantes) unités de données ont un URI et peuvent être partagées sur le Web. Une manière appropriée de représenter des données est d’utiliser RDF, mais d’autres formats, comme Atom, peuvent aussi être convertis/dérivés si nécessaires.”

Quels sont les coûts et bénéfices des données Web ★★★★★ ?

En tant que consommateur, vous pouvez faire tout ce que vous pouvez faire avec des données Web ★★★★, et plus encore :

  • ✔ Vous pouvez découvrir d’autres données relatives aux données que vous consommez.
  • ✔ Vous pouvez directement reconnaître et apprendre le modèle de données utilisé.
  • ⚠ Vous devez à présent composer avec les liens morts, comme avec les erreurs 404 des sites Web.
  • ⚠ Afficher des données depuis un lien arbitraire en tant que donnée factuelle est aussi risqué que de laisser des gens inclure du contenu depuis n’importe quel site dans vos pages. Attention, confiance et bon sens sont toujours nécessaires.

En tant qu’éditeur …

  • ✔ Vous pouvez rendre vos données facile à trouver.
  • ✔ Vous pouvez augmenter la valeur de vos données.
  • ✔ Votre organisation tiera le même profit des liens que les consommateurs.
  • ⚠ Vous aurez besoin d’investir des ressources pour lier vos données à d’autres données sur le Web.
  • ⚠ Vous pourriez avoir besoin de réparer certains liens brisés ou incorrects.

“Brillant! Maintenant, ce sont des données, dans le Web reliées à d’autres données. Le consommateur comme l’éditeur tirent profit de l’effet de réseau.”

Voir également

Merci à Andy Seaborne pour avoir relevé un bogue avec le CSV, à Kerstin Forsberg pour avoir suggérer de mettre en exergue les données dans les exemples des données 4 et 5 étoiles, ainsi qu’à Vassilios Peristeras pour avoir proposé d’expliquer non seulement le ‘qu’est-ce’, mais aussi le ‘pourquoi’. Merci à Egon Willighagen pour avoir fourni plus de détails sur les bénéfices des données 1 étoile. Contributions complémentaires de la part de Christopher Gutteridge. Le portrait de Tim Berners-Lee, en arrière plan, a été pris par Paul Clarke et publiée sous une licence Creative Common Attribution-Partage dans les mêmes conditions 4.0 International À l’origine, ce site vous a été proposé par le EC FP7 Support Action LOD-Around-The-Clock (LATC), il est désormais accessible indépendamment grâce à James G. Kim et Michael Hausenblas.