5 ★ Open Data

Tim Berners-Lee, uppfinnaren av initiativtagaren till webben och länkade data, föreslog ett 5-stjärnigt distributionsschema för Open Data Här ger vi exempel för varje steg av stjärnorna och förklarar kostnader och fördelar som följer med det.

5-stjärniga steg för exempel

Genom exempel …

Nedan ger vi exempel för varje nivå av Tims 5-stjärniga Open Data-plan. Exempeldata som används genomgående är ‘temperaturprognosen för Galway, Irland för de kommande 3 dagarna’:

  • gör dina grejer tillgängliga på webben (oavsett format) under en öppen licens1
  • exempel …
  • ★★
  • gör den tillgänglig som strukturerad data (t.ex. Excel istället för bildskanning av en tabell)2
  • exempel …
  • ★★★
  • gör den tillgänglig i ett icke-proprietärt öppet format (t.ex. CSV istället för Excel)3
  • exempel …
  • ★★★★
  • använd URI:er för att beteckna saker, så att folk kan peka på dina saker4
  • exempel …
  • ★★★★★
  • länka dina data till andra data för att ge sammanhang5
  • exempel …

Kostnader och fördelar …

Vad är kostnaderna och fördelarna med webbdata?

Som konsument …

  • ✔ Du kan lagra det lokalt (på din hårddisk eller på ett USB-minne).
  • ✔ Du kan ange data i vilket annat system som helst.
  • ✔ Du kan ändra data som du vill.
  • ✔ Du kan dela data med vem du vill.

Som utgivare …

  • ✔ Det är enkelt att publicera.
  • ✔ Du behöver inte förklara upprepade gånger för andra att de kan använda dina uppgifter.

“Det är bra att ha data tillgänglig på webben under en öppen licens (som PDDL , ODC-by eller CC0), men data är låsta i ett dokument Förutom att skriva en anpassad skrapa är det svårt att få ut data från dokumentet.

Vad är kostnaderna och fördelarna med ★★ webbdata?

Som konsument kan du göra allt du kan göra med webbdata och dessutom:

  • ✔ Du kan bearbeta det direkt med proprietär programvara för att aggregera det, utföra beräkningar, visualisera det, etc.
  • ✔ Du kan exportera det till ett annat (strukturerat) format.

Som utgivare …

  • ✔ Det är fortfarande enkelt att publicera.

“Fantastiskt! Datan är tillgänglig på webben på ett strukturerat sätt (det vill säga maskinläsbar), dock är data fortfarande låst i ett dokument. För att få ut data från dokumentet är du beroende av proprietär programvara. “

Vad är kostnaderna och fördelarna med ★★★ webbdata?

Som konsument kan du göra allt du kan göra med ★★ webbdata och dessutom:

  • ✔ Du kan manipulera data på vilket sätt du vill, utan att behöva äga något eget programpaket.

Som utgivare …

  • ⚠ Du kan behöva omvandlare eller plug-ins för att exportera data från det proprietära formatet.
  • ✔ Det är fortfarande ganska enkelt att publicera.

“Utmärkt! Datan är inte bara tillgänglig via webben utan nu kan alla enkelt använda datan. Å andra sidan är det fortfarande data på webben och inte data på webben.”

Vad är kostnaderna och fördelarna med ★★★★ webbdata?

Som konsument kan du göra allt du kan göra med ★★★ webbdata och dessutom:

  • ✔ Du kan länka till den från vilken annan plats som helst (på webben eller lokalt).
  • ✔ Du kan bokmärka det.
  • ✔ Du kan återanvända delar av datan.
  • ✔ Du kanske kan återanvända befintliga verktyg och bibliotek, även om de bara förstår delar av det mönster som utgivaren använde.
  • Att förstå strukturen för en RDF “Graph” av data kan vara mer ansträngning än tabelldata (Excel/CSV) eller träddata (XML/JSON).
  • ✔ Du kan kombinera data säkert med andra data är ett globalt schema så om två saker har samma URI så är det avsiktligt, och i så fall är det på god väg att bli 5-stjärniga data.

Som utgivare …

  • ✔ Du har fingranulerad kontroll över dataobjekten och kan optimera deras åtkomst (belastningsbalansering, cachelagring, etc.)
  • ✔ Andra datautgivare kan nu länka till din data och marknadsföra den till 5 stjärnor!
  • ⚠ Du investerar vanligtvis lite tid på att skära och tärna dina data.
  • ⚠ Du måste tilldela URI:er till dataobjekt och tänka på hur du ska representera data.
  • ⚠ Du måste antingen hitta befintliga mönster för att återanvända eller skapa dina egna.

“Underbart! Nu är det data i webben. De (viktigaste) dataobjekten har en URI och kan delas på webben. Ett inbyggt sätt att representera data är att använda RDF, men andra format som Atom kan konverteras/kartas om det behövs.”

Vad är kostnaderna och fördelarna med ★★★★★ webbdata?

Som konsument kan du göra allt du kan göra med ★★★★ webbdata och dessutom:

  • ✔ Du kan upptäcka mer (relaterad) data medan du konsumerar data.
  • ✔ Du kan direkt lära dig om dataschemat.
  • ⚠ Du måste nu hantera trasiga datalänkar, precis som 404-fel på webbsidor.
  • Att presentera data från en godtycklig länk som fakta är lika riskabelt som att låta människor inkludera innehåll från vilken webbplats som helst på dina sidor.

Som utgivare …

  • ✔ Du gör din data upptäckbar.
  • ✔ Du ökar värdet på din data.
  • ✔ Din egen organisation kommer att få samma fördelar av länkarna som konsumenterna.
  • ⚠ Du måste investera resurser för att länka dina data till andra data på webben.
  • ⚠ Du kan behöva reparera trasiga eller felaktiga länkar.

“Briljant! Nu är det data, webben länkad till annan data. Både konsumenten och utgivaren drar nytta av nätverkseffekten.”

Se även

Kudos till Andy Seaborne för att han påpekade CSV-felet, till Kerstin Forsberg för att ha föreslagit “datamarkeringen” i de fyra- och femstjärniga exemplen, samt till Vassilios Peristeras för att han föreslår att inte bara förklara “vad” utan också “varför” Tack till Egon Willighagen för att ge mer information om fördelarna med ytterligare bidrag från Christopher Gutteridge Bakgrundsbilden på Tim Berners-Lee togs av Paul Clarke. och licensierad under licensen Creative Commons Attribution-Share Alike 4.0 International Denna webbplats skickades ursprungligen till dig av EC FP7 Support Action LOD-Around-The-Clock (LATC), och nu presenterad oberoende av James G. Kim och Michael Hausenblas.