5 ★ dos Dados Abertos

Tim Berners-Lee, o inventor da Web e o primeiro a pensar nos Dados Ligados, sugeriu um esquema de implementação das 5 estrelas para Dados Abertos. Aqui, damos exemplos para cada etapa das estrelas e explicamos custos e benefícios que vêm junto com eles.

5-star steps by example

Por Exemplo …

Abaixo, apresentamos exemplos para cada nível do plano de Dados Abertos 5 estrelas de Tim. Os dados usados em todos os exemplo são ‘a previsão de temperatura para Galway, Irlanda para 3 dias’:

    • torne seus recursos disponíveis na Web (tanto faz o formato) sob uma licença aberta1
    • exemplo …
  • ★★
    • torne seus recursos disponíveis como dados estruturados (ex. excel no lugar de imagem escaneada)2
    • exemplo …
  • ★★★
    • utilize formatos não-proprietários (ex. CSV e não excel)3
    • exemplo …
  • ★★★★
    • utilize URIs para identificar recursos. Isso vai ajudar as pessoas a apontarem para eles4
    • exemplo …
  • ★★★★★
    • conecte seus dados com dados de outras pessoas para prover contexto (dados linkado)5
    • exemplo …

Custos & Benefícios …

Quais são os custos & benefícios de dados Web ?

Como consumidor …

  • ✔ Você pode olhar para ele.
  • ✔ Você pode imprimir.
  • ✔ Você pode armazenar (no seu disco rígido, em um pendrive, ou na nuvem).
  • ✔ Você pode introduzir os dados em qualquer outro sistema.
  • ✔ Você pode alterar os dados sempre que você quiser.
  • ✔ Você pode compartilhar os dados com quem desejar.

Como um publicador …

  • ✔ É simples de publicar.
  • ✔ Você não precisa explicar repetidamente aos outros que eles podem utilizar seus dados.

“É ótimo ter os dados acessíveis na Web sob uma licença aberta (assim como PDDL, ODC-by ou CC0), todavia, os dados estão presos em um documento. Para retirar os dados do documento, você vai ter que escrever um raspador com essa funcão.”

Quais são os custos & benefícios de dados Web ★★?

Como um consumidor, você pode fazer tudo que pode fazer com dados Web e adicionalmente:

  • ✔ Você pode processá-los diretamente com um software proprietário para agregar, realizar cálculos, visualizações etc.
  • ✔ Você pode exportar estes dados para outro formato (estruturado).

Como um publicador …

  • ✔ Ainda continua simples para publicar.

“Esplendido! Os dados estão acessíveis na Web em uma forma estruturada (isto é, legível por máquina), todavia, os dados ainda estão presos em um documento. Para obter os dados você depende de um software.”

Quais são os custos & benefícios de dados Web ★★★?

Como um consumidor, você pode fazer tudo que pode fazer com dados Web ★★ e adicionalmente:

  • ✔ manipular os dados de qualquer forma que você queira, sem estar confinado pelas restrições de qualquer software específico.

Como um publicador …

  • ⚠ Você deve precisar de conversores ou plugins para exportar os dados do formato proprietário.
  • ✔ Ainda é muito simples de publicar.

“Excelente! Os dados não estão apenas disponíveis ia Web mas agora qualquer um pode utilizar os dados facilmente. Por outro lado, ainda são dados empacotados na Web e não dados na Web.”

Quais são os custos & benefícios de dados Web ★★★★?

Como um consumidor, você pode fazer tudo que pode fazer com dados Web ★★★ e adicionalmente:

  • ✔ Você pode apontar para ele de qualquer outro lugar (na Web ou localmente).
  • ✔ Você pode marcar como favorito.
  • ✔ Você pode reusar parte ou todos os dados.
  • ✔ Você pode reutilizar ferramentas e bibliotecas existentes, mesmo se elas só entenderem partes do padrões que o publicador utilizou.
  • ⚠ Entender a estrutura de um “Grafo” de dados RDF pode ser mis útil do que dados tabulares (Excel/CSV) ou em árvore (XML/JSON).
  • ✔ Você pode combinar os dados com outros dados seguramente. URIs são um esquema global, se duas coisas têm a mesma URI é porque é intencional. Assim, de certa forma, já está no caminho para ser dados 5 estrelas!

Como um publicador …

  • ✔ Você tem controle granular detalhado sobre os itens de dados e pode otimizar seus acessos (balanceamento de carga, cache, etc.)
  • ✔ Outros publicadores de dados podem referenciar seus dados, promovendo eles a 5 estrelas!
  • ⚠ Você normalmente investe algum tempo separando e fatiando seus dados.
  • ⚠ Você vai precisar definir URIs para os itens de dados e pensar sobre como representar os dados.
  • ⚠ Você precisa tanto encontrar padrões existentes para reutilizar estes dados ou criar os seus próprios.

“Maravilhoso! Agora são dados na Web. Os (mais importantes) itens de dados possuem uma URI e podem ser compartilhados na Web. Um modo nativo de representar dados é utilizando RDF, contudo, outros formatos como o aton, por exemplo, podem ser convertidos/mapeados, se necessário.”

Quais são os custos & benefícios de dados Web ★★★★★?

Como um consumidor, você pode fazer tudo que pode fazer com dados Web ★★★★ e adicionalmente:

  • ✔ Você pode descobrir mais dados (relacionados) enquanto consome os dados.
  • ✔ Você pode diretamente aprender sobre o esquema dos dados.
  • ⚠ Agora você precisa lidar com links de dados quebrados, assim como erro 404 nas páginas web.
  • ⚠ Apresentar dados linkados como um fato é um risco porque permite que outras pessoas incluam conteúdo de qualquer página web nas suas páginas. Portanto, confiança e senso comum são necessários.

Como um publicador …

  • ✔ Você torna seus dados encontráveis.
  • ✔ Você aumenta o valor dos seus dados.
  • ✔ A sua própria organização ganha os mesmo benefícios que os comsumidores de dados já tem.
  • ⚠ Você vai precisar investir recursos para ligar seus dados a dados de outros na Web.
  • ⚠ Você vai precisar reparar links quebrados ou incorretos.

“Brilhante! Agora são dados, na Web ligado a outros dados. Ambos: consumidor e publicador beneficiam-se pelo efeito rede.”

Veja também

Créditos para Andy Seaborne por apontar o bug no CSV, para Kerstin Forsberg por sugerir o ‘destacador de dados’ nos exemplos das estrelas 4/5, assim como para Vassilios Peristeras por propor explicar não apenas o o ‘quê’ mas também o ‘por quê’. Obrigado a Egon Willighagen por fornecer mais detalhes sobre os benefícios dos dados 1 estrela. Adicionalmente contribuições para Christopher Gutteridge. The background picture of Tim Berners-Lee was taken by Paul Clarke and licensed under the Creative Commons Attribution-Share Alike 4.0 International license. Este sítio é trazido a você por EC FP7 Support Action LOD-Around-The-Clock (LATC). This site is now brought to you independently by James G. Kim and Michael Hausenblas.