5 ★ otvorenih podataka

Tim Berners-Lee, izumitelj weba i inicijator povezanih podataka, predložio je shemu implementacije s 5 zvjezdica za otvorene podatke. Ovdje ćemo dati primjer za svaku zvjezdicu i objasniti ćemo troškove i koristi koje dolaze s ovakvim načinom ocjenjivanja.

5-star steps by example

Primjeri …

Niže su primjeri za svaku razinu ocjene 5 zvjezdica otvorenih podataka. Podaci korišteni u pokaznim primjerima su ‘temperaturna prognoza za Karlovac u sljedeća 3 dana’:

    • omogućite dostupnost podataka na internetu u bilo kojem obliku pod otvorenom dozvolom1
    • primjer …
  • ★★
    • omogućite dostupnost strukturiranih podataka (npr. Excel umjesto skenirane slike tablice)2
    • primjer …
  • ★★★
    • koristite neutralne oblike (npr. CSV umjesto Excela)3
    • primjer …
  • ★★★★
    • koristite URI za označavanje stvari tako da drugi mogu pristupiti izravno vašim podacima4
    • primjer …
  • ★★★★★
    • povežite vaše podatke s drugim podacima za prožanje konteksta5
    • primjer …

Troškovi i koristi …

Koji su troškovi i koristi web podataka?

Kao korisnika podataka …

  • ✔ Možete ih pogledati.
  • ✔ Možete ih ispisati.
  • ✔ Možete ih spremiti na vaše računalo.
  • ✔ Možete unijeti podatke u neki drugi sustav.
  • ✔ Možete promijeniti podatke kako želite.
  • ✔ Možete podijeliti podatke s kime želite.

Kao nositelja podataka …

  • ✔ Jednostavno ih je objaviti.
  • ✔ Ne trebate objašnjavati iznova drugima da mogu koristiti vaše podatke.

“Odlično je imati podatke dostupne na internetu pod otvorenom dozvolom (poput PDDL, ODC-by ili CC0), ipak informacije su zaključane u dokumentu. Teško je izvući podatke iz dokumenta, osim ako napišete vlastitu skriptu za izvlačenje informacija.”

Koji su troškovi i koristi ★★ web podataka?

Kao korisnik možete učiniti isto što i s web podacima i dodatno:

  • ✔ Možete ih izravno obraditi u licenciranim aplikacijama za daljnju agregaciju, obavljati izračune, vizualizirati ih, itd.
  • ✔ Možete ih izvesti u druge (strukturirane) oblike.

Kao nositelj podataka …

  • ✔ Još uvijek ih je jednostavno objaviti.

“Izvrsno! Podaci su dostupni na internetu u strukturiranom obliku (odnosno strojno čitljivom), ipak podaci su i dalje zaključani u dokumentu. Da bismo dobili ove podatke iz dokumenta, ovisimo o licenciranom softveru.”

Koji su troškovi i koristi ★★★ web podataka?

Kao korisnik možete učiniti isto što i s ★★ web podacima i dodatno:

  • ✔ Možete manipulirati podacima na način na koji želite i istovremeno niste ograničeni mogućnostima određenog softvera.

Kao nositelj podataka …

  • ⚠ Možda ćete trebati pretvarače ili dodatke da izvezete podatke iz zatvorenog oblika.
  • ✔ Ipak je i dalje jednostavno objaviti podatke.

“Odlično! Podaci nisu samo dostupni na internetu već sada bilo tko može jednostavno koristiti podatke. U drugu ruku, to su podaci na internetu a ne podaci u internetu.”

Koji su troškovi i koristi ★★★★ web podataka?

Kao korisnik možete učiniti isto što i s ★★★ web podacima i dodatno:

  • ✔ Možete pokazivati izravno na njih s nekog drugog internetskog mjesta.
  • ✔ Možete spremiti izravnu poveznicu na njih u vaše favorite.
  • ✔ Možete ponovno upotrijebiti dijelove podataka.
  • ✔ U mogućnosti ste da ponovno upotrijebite alate i dodatke čak i kada razumijete samo dio uzorka koji je nositelj podataka koristio.
  • ⚠ Razumijevanje strukture RDF grafikona podataka može biti teže nego tabličnih (Excel/CSV) ili razgranatih (XML/JSON) podataka.
  • ✔ Možete vrlo jednostavno uparivati podatke s drugim podacima. URI je globalna shema te ukoliko ima isti URI onda je to namjerno, i tada su na dobrom putu da postanu podaci s 5 zvjezdica!

Kao nositelj podataka …

  • ✔ Imate kontrolu nad podacima te im možete optimizirati pristup (balasirati opterećenje, predmemoriranje, itd.)
  • ✔ Drugi nositelji podataka sada mogu povezati na vaše podatke, promičući ih na podatke s 5 zvijezdica!
  • ⚠ Obično ulažete nešto vremena u razdvajanje vaših podataka.
  • ⚠ Trebati ćete dodijeliti URI stavkama vaših podataka i razmisliti kako prikazati podatke.
  • ⚠ Trebate naći postojeći uzorak koji ćete ponovno upotrijebiti ili ćete kreirati svoj vlastiti.

“Divno! Sada su to podaci u interentu. One (najvažnije) stavke podataka imaju URI i mogu se dijeliti na internetu. Najprirodniji način predstavljanja podataka je korištenjem RDF, ipak i drugi oblici poput Atom mogu biti pretvoreni/mapirani za korištenje ukoliko je to potrebno.”

Koji su troškovi i koristi ★★★★★ web podataka?

Kao korisnik možete učiniti isto što i s ★★★★ web podacima i dodatno:

  • ✔ Možete otkriti više (povezanih) podataka prilikom korištenja podatka.
  • ✔ Možete saznati o podatkovnoj shemi izravno na mjestu.
  • ⚠ Sada ćete možda naići na loše interentske poveznice, poput 404 grešaka.
  • ⚠ Predstavljanje podatka s proizvoljnom vezom je rizično jer omogućuje ljudima uključivanje sadržaja iz bilo koje web stranice na svojim stranicama. Oprez, povjerenje i zdrav razum su još uvijek potrebni.
  • Kao nositelj podataka …

  • ✔ Vaše podatke možete učiniti laganim za pronaći.
  • ✔ Povećavate vrijednost vaših podataka.
  • ✔ Vaša organizacija će dobiti iste koristi iz povezivanja kao i korisnik.
  • ⚠ Trebati ćete uložiti u resurse za povezivanje vaših podataka s drugim podacima na interentu.
  • ⚠ Trebati ćete popraviti loše ili netočne internetske poveznice.
  • “Briljantno! To su sada podaci u internetu povezani s drugim podacima. I korisnici i nositelji podataka imaju koristi iz mrežnog efekta.”

    Dodatne informacije

    Zahvale Andy Seaborne za prijavu greske u CSV-u, Kerstin Forsberg za prijedlog naglašavanja podataka u primjerima s 4/5 zvijezdica, isto tako i Vassilios Peristeras na predlaganju da objašnjenja ne budu samo ‘što’ već i ‘zašto’. Hvala Egon Willighagen na detaljima o koristi za podatke s jednom zvjezdicom. Dodatne zasluge idu i Christopher Gutteridge. The background picture of Tim Berners-Lee was taken by Paul Clarke and licensed under the Creative Commons Attribution-Share Alike 4.0 International license. Ovu stranicu donosi vam EC FP7 Support Action LOD-Around-The-Clock (LATC). This site is now brought to you independently by James G. Kim and Michael Hausenblas.