5 ★ otevřená data

Tim Berners-Lee, vynálezce webu a iniciátor propojených dat, navrhl 5-hvězdičkové schéma nasazení pro otevřená data. Zde uvádíme příklady pro každý stupeň hvězdiček a uvádíme související náklady a přínosy.

5-hvězdičkové stupně příkladem

Příkladem …

Níže uvádíme příklady pro každý stupeň Timova 5-hvězdičkového plánu pro otevřená data. Data použitá v příkladech jsou ‘třídenní předpověď teplot pro Galway v Irsku’:

    • zpřístupněte vaše data na webu (v libovolném formátu) pod otevřenou licencí1
    • příklad …
  • ★★
    • zpřístupněte je jako strukturovaná (např. Excel místo naskenované tabulky)2
    • příklad …
  • ★★★
    • zpřístupněte je v neproprietárním otevřeném formátu (např. CSV navíc k Excelu)3
    • příklad …
  • ★★★★
    • použijte URI k určení věcí tak, aby na ně mohli lidé ukazovat4
    • příklad …
  • ★★★★★
    • nalinkujte vaše data na jiná data, poskytnete tím kontext5
    • příklad …

Náklady & přínosy …

Jaké jsou náklady & přínosy webových dat?

Jako uživatel …

  • ✔ Můžete se na ně podívat.
  • ✔ Můžete je vytisknout.
  • ✔ Můžete si je uložit lokálně (na váš pevný disk nebo USB klíčenku).
  • ✔ Můžete je nahrát do libovolného jiného systému.
  • ✔ Můžete je měnit dle libosti.
  • ✔ Můžete je sdílet s kým chcete.

Jako poskytovatel …

  • ✔ Je jednoduché je poskytnout.
  • ✔ Nemusíte ostatním opakovaně vysvětlovat, že vaše data mohou použít.

“Je skvělé mít data přístupná na webu pod otevřenou licencí (jako například PDDL, ODC-by nebo CC0), nicméně data jsou uzavřena uvnitř dokumentu. Bez psaní vlastního scraperu je těžké z data z dokumentu dostat.”

Jaké jsou náklady & přínosy ★★ webových dat?

Jako uživatel můžete dělat to, co s webovými daty, a navíc:

  • ✔ Můžete je přímo zpracovat a proprietárním softwarem můžete získat agregace, provádět výpočty, vizualizace, atd.
  • ✔ Můžete je exportovat do jiného (strukturovaného) formátu.

Jako poskytovatel …

  • ✔ Stále je jednoduché je poskytnout.

“Úžasné! Data jsou přístupná na webu ve strukturované podobě (tzn. jsou strojově čitelná), ale jsou stále uzavřena v dokumentu. Pro získání dat z dokumentu jste závislí na proprietárním software.”

Jaké jsou náklady & přínosy ★★★ webových dat?

Jako uživatel můžete dělat to, co s ★★ webovými daty, a navíc:

  • ✔ Můžete data zpracovávat jakýmkoliv způsobem chcete, bez nutnosti vlastnit jakýkoliv proprietární software.

Jako poskytovatel …

  • ⚠ Můžete potřebovat konvertory nebo pluginy pro export dat z proprietárních formátů.
  • ✔ Stále je celkem jednoduché je poskytnout.

“Výborné! Data jsou nejen přístupná na webu, ale navíc je teď může kdokoliv snadno používat. Na druhou stranu jsou to pořád data na webu, nikoliv data ve webu.”

Jaké jsou náklady & přínosy ★★★★ webových dat?

Jako uživatel můžete dělat to, co s ★★★ webovými daty, a navíc:

  • ✔ Můžete se na ně odkazovat odkudkoliv jinud (na webu nebo lokálně).
  • ✔ Můžete si na ně dávat záložky.
  • ✔ Můžete přepoužívat části dat.
  • ✔ Můžete přepoužívat existující nástroje a knihovny a to i v případě, že rozumí pouze částem formátu použitého poskytovatelem.
  • ⚠ Porozumění struktuře “grafových” RDF dat může být náročnější, než v případě tabulkových dat (Excel/CSV) nebo stromových dat (XML/JSON).
  • ✔ Můžete data bezpečně kombinovat s jinými daty. URI jsou globální schéma, takže pokud mají dvě věci stejné URI, tak je to záměr, a tedy na dobré cestě k 5-hvězdičkovým datům!

Jako poskytovatel …

  • ✔ Máte velice jemnou kontrolu nad datovými položkami a můžete optimalizovat přístup k nim (vyvažování zátěže, kešování, atd.)
  • ✔ Jiní poskytovatelé dat mohou nyní linkovat do vašich dat a povýšit je na 5 hvězdiček!
  • ⚠ Typicky investujete nějaký čas do přípravy a transformace dat k publikaci.
  • ⚠ Budete muset přiřadit URI datovým položkám a přemýšlet o tom, jak data reprezentovat.
  • ⚠ Budete muset buď najít existující vzory k přepoužití a nebo vytvořit svoje vlastní.

“Báječné! Nyní jsou to data ve webu. Datové položky (nejdůležitější z nich) mají URI a mohou být sdíleny na webu. Přirozeným způsobem reprezentace dat je použití RDF, ale v případě potřeby mohou být konvertovány/mapovány jiné formáty, například Atom.”

Jaké jsou náklady & přínosy ★★★★★ webových dat?

Jako uživatel můžete dělat to, co s ★★★★ webovými daty, a navíc:

  • ✔ Při používání dat můžete objevovat další (související) data.
  • ✔ Můžete přímo zjistit datové schéma.
  • ⚠ Musíte teď řešit rozbité odkazy v datech, stejně jako chyby 404 na webových stránkách.
  • ⚠ Prezentace dat z různých odkazů jako skutečností je stejně riskantní, jako nechávat lidi vkládat obsah z libovolného webu na vaše stránky. Stále je potřeba opatrnosti, důvěry a zdravého rozumu.

Jako poskytovatel …

  • ✔ Učiníte vaše data nalezitelnými.
  • ✔ Zvýšíte hodnotu vašich dat.
  • ✔ Vaše vlastní organizace získá stejné výhody z linkování, jako vaši uživatelé.
  • ⚠ Budete muset investovat zdroje do linkování vašich dat na jiná data na Webu.
  • ⚠ Může se stát, že budete potřebovat opravovat rozbité nebo chybné linky.

“Brilantní! Nyní jsou to data ve Webu propojená na jiná data. Jak uživatel, tak poskytovatel mají užitek ze síťového efektu.”

Další informace

Díky Andymu Seabornovi za odhalení CSV bugu, Kerstinu Forsbergovi za návrh na ‘vysvícení dat’ ve 4/5-hvězdičkových příkladech, a také Vassiliosi Peristerasovi za návrh vysvětlovat nejen ‘co’ ale i ‘proč’. Díky Egonu Willighagenovi za poskytnutí dalších detailů o přínosech jednohvězdičkových dat. Dále přispíval Christopher Gutteridge. Obrázek Tima Bernerse-Lee na pozadí byl pořízen Paulem Clarkem a je licencován pod licencí Creative Commons Attribution-Share Alike 4.0 International. Tento web vám původně přinesl projekt LOD-Around-The-Clock, podpůrná činnost 7. rámcového programu Evropské unie (LATC), a nyní vám ho nezávisle přináší James G. Kim a Michael Hausenblas.