五顆星 ★ 開放資料

全球資訊網(World Wide Web)發明者和鏈結資料的創始者,提姆.柏納-李 (Tim Berners-Lee)建議了一個開放資料五顆星的分類架構 在此,我們提供在每一顆星中每一步驟的範例且解釋這些步驟的成本和效益:

5-star steps by example

範例 …

根據提姆所說的五顆星開放資料計畫中每一顆星,我們提供以下範例,這個範例資料是來自於’愛爾蘭.戈爾威郡的三天溫度預報’:

    • 採用開放授權,讓手上的資料(任何資料格式)可以在網路上取得1
    • 範例 …
  • ★★
    • 讓這份資料能以結構化的方式取得(例如用 Excel 取代掃描的表格)2
    • 範例 …
  • ★★★
    • 使用開放格式取代專屬格式(例如用 CSV 取代 Excel)3
    • 範例 …
  • ★★★★
  • ★★★★★
    • 鏈結你的資料到其它資料,以提供資料之間的脈絡關係,例如兩份資料間的相等關係(owl:sameAs)。5
    • 範例 …

成本 & 效益 …

什麼是 開放資料的成本 & 效益?

身為資料取用者 …

  • ✔ 你可以查看這份資料。
  • ✔ 你可以列印這份資料。
  • ✔ 你可以儲存這份資料到你的硬碟或 USB 磁碟裡。
  • ✔ 你可以將這份資料鍵入任何其它系統。
  • ✔ 你可以根據你希望的方式改變這份資料。
  • ✔ 你可以分享這份資料給任何你想分享的人。

身為資料發佈者 …

  • ✔ 這是相當簡單的資料發佈方式。
  • ✔ 你不用重覆地解釋,別人可以使用你的資料這件事。

“資料在網路上能用開放的授權取得,真是太棒了! (如 PDDL, ODC-by or CC0),然而,資料被鎖在文件中, 除了用一些客製化的耙梳程式,不然很難把資料帶出文件外。”

什麼是 ★★ 開放資料的成本 & 效益?

身為資料取用者,你可以在★★ 開放資料上做任何你可以做的事,且此外:

  • ✔ 你可以直接以專屬的軟體來處理這資料,以便整合資料、統計、視覺化等。
  • ✔ 你可以輸出資料為其它(結構化的)資料格式。

身為資料發佈者 …

  • ✔ 這是仍然是相當簡單的資料發佈方式。

“很好!資料在網路中是以結構化(也就是機器可讀的)的方式被拿到,但這資料仍被鎖在文件裡,為了取得資料,必須使用專屬的軟體。”

什麼是 ★★★ 開放資料的成本 & 效益?

身為資料取用者,你可以在★★★ 開放資料上做任何你可以做的事,且此外:

  • ✔ 你可以運用這份資料以任何你喜歡的方式,不需受到任何特定軟體的能力限制

身為資料發佈者 …

  • ⚠ 你或許需要轉換器或外掛來轉換專屬格式到開放格式,以輸出資料。
  • ✔ 這是仍然是相對簡單的資料發佈方式。

“非常好!這份資料不但是在網路人人都可以拿到,而且可以容易地使用這份資料。另一方面,這仍然只是一份在「網路上」的資料,而不是在「網路中」的資料。”

什麼是 ★★★★ 開放資料的成本 & 效益?

身為資料取用者,你可以在★★★★ 開放資料上做任何你可以做的事,且此外:

  • ✔ 你可以連結這份資料到任何其它地方(在網路上或在本機電腦裡)。
  • ✔ 你可以將這份資料加到書籤,並分享它。
  • ✔ 你可以重覆使用這份資料的許多部份。
  • ✔ 你也許可以重覆使用已存在的工具和函式庫,即使他們只了解資料發佈者使用部份形態。
  • ⚠ 了解一份資料的RDF“圖”之結構所花的努力是多於表格資料(Excel/CSV)或樹狀資料(XML/JSON)。
  • ✔ 你可以安全地將這份資料與其它資料結合。固定網址是一個全球架構,所以如果二個東西有同一個固定網址的話,二者就有存在某種關係。如果確實如此,那資料將會相當好地成為五顆星等級的資料!

身為資料發佈者 …

  • ✔ 你能決定資料從細目到總覽如何分別發佈,並且可以最佳化其存取方式(負載平衡、快取等)。
  • ✔ 其它資料發佈者現在可以連結你的資料,並且晉升這份資料為五顆星的資料!
  • ⚠ 你通常要花一些時間來切細你的資料。
  • ⚠ 你將需要分派固定網址到資料項目和思考如何呈現你的資料。
  • ⚠ 你需要找出資料中,適合重覆使用與生產的資料型態。

“太棒了!你的資料在網路中,最重要的是資料項目有固定網址,可以在網路裡分享。 使用 RDF 來呈現原始資料是一個方式。如果需要,也可以轉成其它資料格式(如 Atom)。”

什麼是 ★★★★★ 開放資料的成本 & 效益?

身為資料取用者,你可以在★★★★★ 開放資料上做任何你可以做的事,且此外:

  • ✔ 你可以在取用資料時,探索到更多相關的資料。
  • ✔ 你可以直接學習資料結構。
  • ⚠ 你現在必須處理斷掉的資料鏈結,如網頁中的404錯誤訊息。
  • ⚠ 由專有的連結來呈現資料,如同一件事實,就是讓人加入任何網頁中內容在你的網頁中。警告、信任和常識仍然是必須的。

身為資料發佈者 …

  • ✔ 你可以讓你的資料被搜尋到。
  • ✔ 你可以增加你資料的價值。
  • ✔ 擁有組織化的資料,就可以享受網絡效應帶來的人氣。
  • ⚠ 你將需要投入資源去連結你的資料到在網路上的其它資料。
  • ⚠ 你或許需要修復斷的或不正確的連結。

“好的不得了!如今網路中的資料連結到其它資料,資料取用者和資料發佈者都由 網絡效應獲得效益。”

參照

感謝 Andy Seaborne 指出CSV的錯誤,Kerstin Forsberg 建議在4/5星案例的’資料強調’,還有 Vassilios Peristeras 提出’what’和’why’的解釋。感謝 Egon Willighagen 提供一顆星更多詳細的效益,其它的貢獻者 Christopher Gutteridge。The background picture of Tim Berners-Lee was taken by Paul Clarke and licensed under the Creative Commons Attribution-Share Alike 4.0 International license. 這是網站帶你進入歐盟 FP7 計畫 Support Action LOD-Around-The-Clock (LATC). This site is now brought to you independently by James G. Kim and Michael Hausenblas.