Wie geht das mit GovData?

Was ist GovData eigentlich und warum sollte ich mich damit beschäftigen? Ist mein Open Data Portal geeignet, mit GovData zusammenzuarbeiten? Was muss ich dafür tun? Wir berichten aus unseren Erfahrungen und helfen den CKAN-Portalbetreibern, sich in nationale Standards zu integrieren.

GovData verstärkt die Aufnahme von Metadaten aus deutschen Open Data Portalen im Jahr 2022 sehr . Hierzu wurde eigens das GovData Projekt „DataGo – GoLive“ gestartet.

Was ist GovData?

GovData ist eine Kurzform für Government Data. Die Organisation „GovData“ ist eine Einrichtung des IT-Planungsrates, der Digitalisierungszentrale von Bund und Ländern in Deutschland. GovData betreibt ein das zentrale deutsche Open Data Porta für Verwaltungsdaten. Damit wird ein zentraler Einstiegspunkt für Daten und Informationen der öffentlichen Verwaltung in Deutschland ebenenübergreifend angeboten.

Das GovData Open Data Portal wurde 2016 neu aufgesetzt und hat sich zu einem beachtlichen Datenraum für offene Daten entwickelt. Es sind zwischenzeitlich über 60.000 Datensätze mit 170.000 Ressourcen aus deutschen Verwaltungen verzeichnet – schnell wachsend.

Ziel ist es, dass diese „Datenschätze“ aus der Verwaltung besser genutzt und weiterverwendet werden, so dass durch neue Ideen sowie Kombination und Analyse neue Erkenntnisse aus den vorhandenen Daten gewonnen und neue Anwendungsfelder erschlossen werden können. Mehr Informationen auf govdata.de

Zusammenarbeit mit lokalen Open Data Portalen

Damit GovData ein zentraler Einstiegspuunkt für alle Verwaltungsdaten in Deustchland sein kann, werden Daten aus den zahlreichen Open Data Portalen von Städten, Gemeinden, Ländern und anderen öffentlichen Institutionen übernommen und zur zentralen Suche angeboten.

Wichtig: Aus dem lokalen Open Data Portalen werden keine Daten, sondern nur Metadaten übernommen. Metadaten beschreiben die eigentlichen Daten, z.b. durch Angabe von Veröffentlichungsdatum, Autor, zuständige Verwaltungseinheit, Beschreibung des Inhalts, Datenformat, etc.

Da die lokalen Open Data Portale in der Nutzung von Metadaten eigene Wege gehen können, ist eine Hauptaufgabe von GovData die Standardisierung der Metadaten. Der große Vorteil dabei ist, dass eine Einheitlichkeit in der zentralen Datensuche, Verarbeitung und Darstellung möglich ist.

Beispiel: Wenn in einem Open Data Portal ein Datensatz den Autor des Datensatzes als „Autor“ beschreibt, ein anderer als „Veröffentlicher“ und ein dritter als „Publisher“, können diese Daten nicht gemeinsam verarbeitet werden. Unterschiedliche Interpretationen führen zu erhöhtem Aufwand und bieten Raum für Interpretationsfehler.

Eine umfangreiche Information für Datenbereitsteller hat GovData hier veröffentlicht.

GovData und DCAT-AP.de

GovData treibt aus diesem Grund die Standardisierungsbemühungen von Metadata in deutschen Open Data Portalen. Dieses wird im Einklang mit europäischen Initiativen betrieben. Die wesentlichen Elemente dabei sind:

  • DCAT ist das Data Catalog Vocabulary, ein sogenanntes Vokabular (engl. Vocabulary) zur Beschreibung von Datenkatalogen und ihren Inhalten. Es basiert auf dem Resource Description Framework (RDF), einer Web-Technologie zur Modellierung von Datenstrukturen. Im Sinne der Idee von Linked Data wird DCAT verwendet um web-basierte Datenkataloge zu vereinheitlichen und systematische Recherche, Zugriffe und Vernetzung – sowohl der Daten als auch der Kataloge – zu ermöglichen.
  • DCAT-AP wurde auf Initiative der Europäischen Kommission zu DCAT-AP weiterentwickelt, ein sogenanntes Anwendungsprofil für Datenportale in Europa (Englisch: DCAT Application Profile for Data Portals in Europe).
  • DCAT-AP.de ist das deutsche Metadatenmodell zum Austausch von offenen Verwaltungsdaten

Da fragt man sich: warum brauchen wir in Deutschland ein eigenes Metadatenmodell? Der schlichte Grund ist: weil es nationale Unterschiede gibt. So fordert der DCAT-AP for Switzerland beispielsweise, dass alle Textelemente in den Sprachen Deutsch, Englisch, Französisch und Italienisch angegeben werden müssen.

Zu den DCAT-AP.de Details siehe auch unseren Blog „Was ist eigentlich DCAT-AP?“.

Wie kann ich DCAT-AP.de umsetzen?

Die Regelungen der DCAT-AP.de Spezifikation sind komplex genug, um nicht damit arbeiten zu wollen. Deswegen wurde das DCAT-AP.de Konventionen-Handbuch erstellt. Darin steht in übersichtlichen – derzeit 41 – Konventionen, was bei den Metadaten zu beachten ist, um DCAT-AP.de konform zu sein.

Und wer DCAT-AP.de konform ist, hat die technischen Voraussetzungen für eine Zusammenarbeit mit GovData bereits erfüllt.

Um zu prüfen, ob eine DCAT-AP.de-Konformität des eigenen Open Data Portals besteht, gibt es eine Prüfmaschine, den EU-Validator. Wenn dort bei einer Prüfung keine Fehler mehr angezeigt werden, ist die DCAT-AP.de-Konformität hergestellt.

Wie geht DCAT-AP.de mit CKAN?

CKAN wurde erstellt, um weltweit Open Data Portale aufzusetzen und zu betreiben. Da es viele nationale Besonderheiten gibt, konzentriert man sich bei CKAN auf Kernfunktionen, die überall gültig sind. Die Funktionen für die DCAT-AP.de Kompatibilität müssen zu eigenen CKAN-basierten Portal also erst noch hinzugefügt werden.

Die Schritte zur DCAT-AP.de Konformität eines CKAN-basierten Open Data Portals sind:

  • Erweiterung um DCAT-AP Funktionen
  • Erweiterung um DCAT-AP.de Funktionen
  • Erweiterung der Metadaten bei Datensätzen und Ressourcen um die benötigten Felder
  • Umstellung der Datensätze auf die neuen Metadatenfelder
  • Harvesting-Initiierung durch Govdata und Durchführung von Prüfläufen

Hier noch ein kurzer Blick auf die wichtigsten für DCAT-AP.de benötigten Metadaten-Felder:

  • Titel
  • Beschreibung
  • Quelle
  • Version
  • Autor
  • Email des Autors
  • Verantwortlicher
  • Email des Verantwortlichen
  • contributorID
  • politicalGeocodingURI
  • politicalGeocodingLevelURI
  • publisher_name
  • publisher_email
  • temporal_start
  • temporal_end

Die Erweiterung von CKAN besteht damit aus einem Maßnahmen-Mix:

  • Einsatz von verfügbaren Plugins
  • Erweiterung der Metadatenfelder
  • Abstimmung der Konfiguration von CKAN auf DCAT-AP.de
  • Test-Durchführung zur Ermittlung der DCAT-AP.de Kompatibilität
  • Anleitung für Datensatzredakteure, auf was bei den Metadaten zu achten ist

Die nächsten Schritte

Wir empfehlen zunächst die Kontaktaufnahme zu GovData zur Klärung, inwiefern ein direktes oder indirektes Harvesting (über Länderportale) sinnvoll ist. Bei den technischen Vorbereitungen sind entweder CKAN-Kenntnisse erforderlich und ein gutes Stück Zeit, um sich in das Thema hinein zu begeben. Natürlich muss die CKAN-Version geeignet sein, um überhaupt beginnen zu können.Wir haben gute Erfahrungen gemacht mit den CKAN-Versionen ab 2.8.x

Alternativ steht unser CKAN-Team gerne zur Verfügung.