Open Data bezieht sich darauf, Daten und Informationen öffentlich zugänglich zu machen, damit jeder sie nutzen, analysieren, modellieren und weiterverarbeiten kann.
Was sind offene Daten?
Offene Daten sind Daten und Informationen, die öffentlich zugänglich gemacht wurden und von jedem genutzt, weiterverarbeitet und verbreitet werden können. Im Allgemeinen werden offene Daten in einem standardisierten, maschinenlesbaren Format veröffentlicht, das eine einfache Integration in Anwendungen, Tools und Plattformen ermöglicht.
Je „besser“ offene Daten bereitgestellt werden, umso leichter, fehlerfreier und umfassender sind sie nutzbar. Eine Bewertung für die „Qualität“ von offenen Daten kann mit dem 5-Sterne-Modell durchgeführt werden.
Wer mit offenen Daten beginnt, sollte sich zunächst auf die Veröffentlichung von Daten konzentrieren, die 3 Sterne erfüllen.
Warum werden Daten veröffentlicht?
Es gibt eine Vielzahl von Gründen, warum Daten veröffentlicht werden, zum Beispiel:
- Förderung von Transparenz und Rechenschaftspflicht: Durch die Offenlegung von Daten können Bürgerinnen und Bürger die Entscheidungen von öffentlichen Stellen nachvollziehen und die Rechtmäßigkeit von Entscheidungen überprüfen.
- Wirtschaftliche Entwicklung: Offene Daten können von Unternehmen und Entwicklern genutzt werden, um neue Anwendungen, Produkte und Dienstleistungen zu erstellen und somit wirtschaftliche Entwicklung zu fördern.
- Verbesserung der öffentlichen Dienstleistungen: Offene Daten können von Regierungen und gemeinnützigen Organisationen genutzt werden, um bessere öffentliche Dienstleistungen zu planen und anzubieten.
- Förderung der Forschung und Innovation: Durch den Zugang zu Daten können Forscherinnen und Forscher neue Erkenntnisse gewinnen und Innovationen vorantreiben.
- Stärkung der Demokratie: Offene Daten ermöglichen es Bürgerinnen und Bürgern, sich aktiv an politischen Diskussionen und Entscheidungen zu beteiligen, indem sie auf eine breitere Palette von Informationen zugreifen können.
Insgesamt kann die Veröffentlichung von Daten in offenen Formaten dazu beitragen, eine breitere Beteiligung der Öffentlichkeit an politischen Entscheidungen zu fördern, die Effizienz von Regierungen und Organisationen zu verbessern und eine bessere Nutzung von Ressourcen zu ermöglichen.
Mehr Hintergrundinformationen hierzu gibt es im Open Data Handbook.
Open Data – das Rennen hat begonnen
Die Vorteile von offenen Daten sind überzeugend. Bedeutet das, dass Open Data Portale in Deutschland in großer Zahl entstehen? Leider nein. Im Gegenteil: die neue Datenliebe ist immer noch sehr verhalten. Vielleicht ist es der schlecht messbare Nutzen, vielleicht die unbekannte Zielgruppe oder auch „nur“ die Schwierigkeit, entsprechende Daten in Verwaltungen zu finden und zu veröffentlichen.
Die neue Ressource „Daten“ wird weltweit geschätzt und an vielen Stellen entstehen digital anzapfbare Datenquellen. So hat die Weltbank einen Open Data Werkzeugkasten erstellt, mit dem Verwaltungen schneller Open Data Kenntnisse aufbauen und Daten veröffentlichen können.
Stufe 2: Open Data wird fokussierter
Zunächst müssen prozesse und Technologien etabliert werden, um Daten zu veröffentlichen. Nach dieser ersten Stufe folgen dann:
- mehr Daten
- automatische Belieferung von Daten
- bessere Daten (je mehr Sterne, desto besser – siehe oben)
- Thematische Fokussierung von Daten
- Standardisierte Daten (z.B. auf Basis von DCAT)
Ein gutes Beispiel ist die von der Deutsche Gesellschaft für Internationale Zusammenarbeit im Rahmen der TUMInitiative geförderte Mobilitätsdateninfrasruktur. Ziel ist die Schaffung der digitalen Infrastruktur als wichtiger Beitrag für eine globale Verkehrswende.
Never stop learning: Linked Open Data ist das Ziel
Je besser Qualität der Daten wird, desto anspruchsvoller können die Apps sein, die auf diesen Daten basieren. Wenn Daten im RDF oder gar im LOD Format veröffentlicht werden, ist eine Vorarbeit notwendig, um die Domäne formal zu beschreiben. Mittels diesen Formaten werden Daten in sich und mit externen Ressourcen vernetzt.
LOD basiert auf dem Konzept des Semantic Web, das darauf abzielt, die Bedeutung von Daten durch die Verwendung von standardisierten semantischen Technologien zu erfassen und zu teilen. Dies ermöglicht es, Daten aus verschiedenen Quellen zu integrieren und zu verknüpfen, um neue Erkenntnisse zu gewinnen und komplexe Probleme zu lösen.
LOD nutzt dazu RDF (Resource Description Framework) und SPARQL (SPARQL Protocol and RDF Query Language), um Daten zu veröffentlichen und abzufragen. Durch die Verwendung dieser Standards können Daten maschinenlesbar gemacht und leicht zugänglich gemacht werden.
Mittels LOD können Wissensgraphen und Ontologien aufgebaut werden, die es ermöglichen, Daten in einem größeren Kontext zu verstehen und zu nutzen. Insbesondere die Verstehbarkeit und Selbstbeschreibung der Daten hebt LOD von tabularen einfachen Formaten wie CSV oder Excel-Dateien ab.
Klein anfangen und besser werden
Auch wenn RDF und LOD gefährlich komplex aussehen: die ersten Schritte mit Open Data können und müssen viel einfacher sein. Es geht vielmehr darum, für die Veröffentlichung geeignete Daten zu finden und diese zur veröffentlichen, Metadaten passend anzugeben, die Daten auffindbar zu machen und in Kontakt mit Nutzern zu kommen.