5 ★ Открытые Данные

Тим Бернерс-Ли, создатель Интернета и инициатор “связанных данных” (Linked data), предлагает 5-звёздочную схему развёртывания открытых данных. Мы представляем примеры для каждого уровня, а также преимущества и недостатки её использования.

5-star steps by example

Примеры …

Ниже, мы приводим примеры для каждого уровня 5-звёздочного рейтинга Тима. В качестве примера используется следующая информация ‘прогноз температуры в Голуэй, Ирландия на последующие 3 дня’:

    • сделайте доступными свои материалы в Интернете (вне зависимости от формата) под открытой лицензией1
    • пример …
  • ★★
    • сделайте их доступными в виде структурированных данных (например, Excel вместо сканированного рисунка или таблицы)2
    • пример …
  • ★★★
    • используйте незапатентованные (непрориетарные) форматы (например, CSV, JSON или XML)3
    • пример …
  • ★★★★
    • используйте URI для обозначения сущностей, чтобы люди могли ссылалаться на них4
    • пример …
  • ★★★★★
    • связывайте свои данные с другими для обеспечения контекста5
    • пример …

Преимущества & Недостатки …

Каковы преимущества & недостатки веб-данных?

Для потребителя …

  • ✔ Вы можете просмотреть их.
  • ✔ Вы можете распечатать их.
  • ✔ Вы можете хранить их локально (на переносном жестком диске или USB флешке).
  • ✔ Вы можете вводить данные в любую другую систему.
  • ✔ Вы можете менять данные так, как пожелаете.
  • ✔ Вы можете делиться данными по своему желанию..

Для публикатора …

  • ✔ Простота публикации.
  • ✔ Нет необходимости постоянно объяснять другим, что они могут использовать ваши данные.

“Прекрасно иметь данные доступные в Вебе под открытой лицензией (будь то PDDL, ODC-by или CC0). Тем не менее, данные органичены документом и извлечь их, кроме как с использованием самописной программы по разбору данных, никак не получится.”

Каковы преимущества & недостатки ★★ веб-данных?

Как потребитель, вы можете делать всё, что и с веб-данными, а также:

  • ✔ Вы можете непосредственно обработать их при помощи собственного программного обеспечения в целях обобщения, вычислений, визуализации и т.д.
  • ✔ Вы можете экспортировать их в другой (структурированный) формат.

Как публикатор …

  • ✔ Это также просто публиковать.

“Прекрасно! Данные доступны в Интернете в структурированном виде (то есть, машиночитаемом виде), однако, данные по-прежнему ограничены документом, так как для получения данных вы зависите от коммерческого (проприетарного) программного обеспечения.”

Каковы преимущества & недостатки ★★★ веб-данных?

Как потребитель, вы можете делать всё, что и с ★★ веб-данными, а также:

  • ✔ Вы можете манипулировать данными любым образом как нравится и без необходимости использования коммерческого программного обеспечения.

Как публикатор …

  • ⚠ Вам могут понадобиться конвертеры или плагины для экспорта данных из коммерческого формата.
  • ✔ Это также просто публиковать.

“Отлично! Данные не только доступны в сети, но также сейчас любой их может легко использовать. С другой стороны, эти данные служат в основном для визуального восприятия (on the Web) и не являются по-настоящему данными встроенными в веб (in the Web).”

Каковы преимущества & недостатки ★★★★ веб-данных?

Как потребитель, вы можете делать всё, что и с ★★★ веб-данными, а также:

  • ✔ Вы можете ссылаться на данные из любого места (в интернете или локально).
  • ✔ Вы можете добавлять их в избранное или закладки.
  • ✔ Вы можете повторно использовать части данных.
  • ✔ Вы можете повторно использовать существующие инструменты и библиотеки, даже если они лишь частично распознают схему представления данных (паттерн), используемый публикатором.
  • ⚠ Структура RDF “Графа” более трудная для понимания, нежели табличная форма (Excel/CSV) или древовидная структура (XML/JSON).
  • ✔ Вы можете безопасно комбинировать разные данные. URI используют общую схему обращения к ресурсу, таким образом, если две сущности имеют одинаковые URI, то это сделано намеренно, и если так, то это хорошо - вы на пути к получению 5 звезд!

Как публикатор …

  • ✔ В вашем распоряжении находится полный контроль над сущностями данных и вы можете оптимизировать доступ к ним (скорость загрузки, кэширование и т.д.)
  • ✔ Другие публикаторы данных теперь могут ссылаться на ваши данные и обеспечить им 5 звезд!
  • ⚠ Как правило, вы тратите определённое время для сбора и комбинирования данных.
  • ⚠ Вам потребуется привязать URI к сущностям и подумать о подходящем представлении данных.
  • ⚠ Вам потребуется найти либо существующие схемы представления данных (паттерны) для повторного использования или создать свои собственные.

“Великолепно! Теперь это данные в Вебе. Сущности (наиболее важные) имеют URI, ими можно поделиться в Вебе. Самый подходящий и естественный способ представления данных это использование RDF, однако другие форматы, такие как Atom, могут быть также преобразованы и связаны, если потребуется.”

Каковы преимущества & недостатки ★★★★★ веб-данных?

Как потребитель, вы можете делать всё, что и с ★★★★ веб-данными, а также:

  • ✔ При разборе данных вы также можете получить доступ к связанным данным.
  • ✔ Вы можете напрямую ознакомиться со структурой данных.
  • ⚠ Теперь вам придется столкнуться с неработающими ссылками, например 404 ошибка.
  • ⚠ Представление данных с использованием непроверенных ссылок так же рискованно, как дать возможность случайным людям добавлять любой контент на ваш сайт. Нужно быть осмотрительным и проверяйте используемые ресурсы.

Как публикатор …

  • ✔ Ваши данные пригодны для обнаружения и разбора.
  • ✔ Ценность ваших данных возросла.
  • ✔ Вы получите такую же выгоду от размещенных ссылок, что и потребители.
  • ⚠ Вам придется потрудиться, чтобы связать свои данные с другими данными в Вебе.
  • ⚠ Возможно, вам придется исправлять сломанные или неверные ссылки.

“Блестяще! Теперь это данные в Вебе связанные с другими данными. Как потребитель, так и публикатор выигрывают от сетевого эффекта.”

Дополнительно

Слова благодарности Энди Сиборну за указание ошибки в CSV, Керстин Форсберг, предложившей “подсвечивание” данных в 4/5-звёздочных примерах, Вассилиос Перистерас за предложение объяснять не только “что”, но и “почему”. Спасибо Эгону Веллигагену предоставившему подробную информацию о выгодах однозвёздночных данных. Отдельная благодарность Кристоферу Гуттериджу. Фоновое изображение Тим-Бернерса Ли использовано Полом Кларком под лицензией Creative Commons Attribution-Share Alike 4.0 International. Первоначально данный сайт предоставлялся по европейской программе EC FP7 “Support Action LOD-Around-The-Clock” (LATC), сейчас же он независимо предоствляется Джеймсом Дж. Кингом и Майклом Хаусенбла.