CKAN hat sich als weltweit führende Open-Source-Lösung für Datenportale etabliert. Es ist ein robustes System zur Katalogisierung, Veröffentlichung und zum Auffinden von Daten. Damit jederfrau und jedermann Daten greifbar gemacht werden, stellen wir uns die Frage: Wie können wir den Zugang zu diesen wertvollen Daten noch intuitiver und leistungsfähiger gestalten? Die Antwort liegt in der direkten Integration von Sprachmodellen (LLMs).
Warum macht CKAN mit KI Sinn? Der intuitive Datenzugriff
Stellen Sie sich vor, Sie müssten nicht mehr durch Filter navigieren oder komplexe API-Abfragen formulieren, um an Informationen zu gelangen. Stattdessen könnten Sie Ihrem Datenportal einfach Fragen stellen:
- „Welche Datensätze zum Thema Luftqualität aus dem letzten Jahr haben wir?“
- „Gib mir eine Zusammenfassung des Datensatzes über die Bevölkerungsentwicklung.“
- „Zeige mir alle CSV-Dateien in Bezug zu kommunalen Finanzen.“
Genau das ermöglicht die Verbindung von CKAN mit KI. Sie erlaubt es Nutzern – von Analysten bis hin zu Bürgern ohne technischen Hintergrund – direkt mit den Daten und Metadaten zu „reden“. Der Zugang wird radikal vereinfacht und die Hürde zur Datennutzung sinkt dramatisch.
Die technische Umsetzung: Wie wird CKAN KI-fähig?
Um diesen Dialog zu ermöglichen, sind zwei Kernkomponenten erforderlich, die wie ein Übersetzer zwischen der Welt der KI und der CKAN-API fungieren.
1. Die Brücke: Der MCP-Server für CKAN Damit eine KI versteht, welche Aktionen in CKAN möglich sind, benötigt sie eine standardisierte Schnittstelle. Hier kommt das Model Context Protocol (MCP) ins Spiel. Wir bei Ondics haben einen CKAN-MCP-Server entwickelt, der genau diese Brücke schlägt. Er übersetzt die Anfragen eines KI-Modells in für CKAN verständliche API-Aufrufe.
Dieser Server wird von der Ondics GmbH als Open-Source-Projekt bereitgestellt, um Innovation in der Community zu fördern: CKAN-MCP-Server von Ondics auf GitHub.
2. Das Gehirn: Die Anweisung an das Sprachmodell (LLM) Ein Sprachmodell wie ChatGPT, Google Gemini oder ein unternehmenseigenes LLM muss instruiert werden, diese neue Fähigkeit zu nutzen. Dies geschieht über einen sogenannten System-Prompt. Dieser Prompt ist eine Art Bedienungsanleitung für die KI, die ihr erklärt, welche Werkzeuge (die MCP-Befehle) zur Verfügung stehen und wie sie diese zur Beantwortung von Nutzerfragen einsetzen kann.
Sobald diese beiden Komponenten eingerichtet sind, können Nutzer über MCP-kompatible Clients (z.B. Claude Desktop) oder andere Anwendungen mit dem CKAN-Portal interagieren.
Die perfekte Integration: Der Chat direkt in CKAN
Um die Nutzererfahrung nahtlos zu gestalten, haben wir eine weitere Lösung entwickelt: die CKAN-Extension ckanext-chatbot.
Diese Erweiterung integriert ein Chat-Fenster direkt in die CKAN-Oberfläche. Der riesige Vorteil: Anwender müssen das System nicht verlassen, um mit den Daten zu sprechen. Der gesamte Dialog findet dort statt, wo die Daten leben. Dies eliminiert Medienbrüche und schafft einen intuitiven, kontextbezogenen Arbeitsablauf.
Erste Erfahrungen aus der Praxis
Die Theorie klingt vielversprechend – aber funktioniert sie auch in der Praxis? Unsere ersten Implementierungen zeigen klare Ergebnisse:
- Es funktioniert! Die technische Umsetzung ist robust und der dialogbasierte Zugriff auf Metadaten und Datensätze ist erfolgreich realisierbar.
- Metadaten sind der Schlüssel: Die Qualität der KI-Antworten steht und fällt mit der Qualität der Metadaten. Eine ausführliche, gut strukturierte Beschreibung der Datensätze ist entscheidend, damit die KI den Kontext versteht und präzise Antworten liefern kann.
- Tiefe Einblicke durch den Datastore: Besonders wertvoll wird die Integration, wenn die KI nicht nur auf Metadaten, sondern auch auf tabellarische Daten im CKAN Datastore zugreifen kann. So kann sie einfache Analysen durchführen, spezifische Informationen aus Tabellen extrahieren und Inhalte zusammenfassen.
- Prompting ist entscheidend: Die Kunst, die richtige Frage zu stellen („Prompting“), ist für gute Ergebnisse essenziell. Um Nutzern den Einstieg zu erleichtern, liefert die Extension
ckanext-chatboteine Sammlung von Beispiel-Prompts mit, die als Vorlage und Inspiration dienen.
Die Kombination von CKAN und KI ist der nächste logische Schritt in der Evolution von Datenportalen. Sie wandelt passive Kataloge in aktive, dialogfähige Wissensdatenbanken um.
Haben Sie Fragen oder möchten Sie das Potenzial von KI für Ihr eigenes CKAN-Portal erkunden? Wir teilen unsere Erfahrungen gerne mit Ihnen.
Weitere Informationen erhalten Sie unter ondics.de/kontakt.