Fit für die Zukunft:
Das UBA veröffentlichte 1984 den ersten bundesweiten Bericht zum Zustand der Umwelt – die „Daten zur Umwelt“. Bis heute gehört dieses Angebot zu den beliebtesten Publikationen des UBA. Ursprünglich eine reine Berichtsreihe, sind die Daten mittlerweile längst dauerhaft online verfügbar. In Zeiten rasant wachsender Datenmengen und steigender Anforderungen an die Verfügbarkeit dieser Daten braucht es jedoch neue Lösungen, um mit diesem Service zeitgemäß zu bleiben. Der in diesem Kontext entstandene Data Cube ist ein entscheidender Schritt hin zu einer Kultur der offenen Daten (engl. Open Data). Er verbessert den Zugang zu umweltrelevanten Daten, aber auch die Transparenz des Regierungs- und Verwaltungshandels.
Das leistungsfähige System eröffnet vielfältige neue Möglichkeiten zur Suche, Erkundung, Analyse und Visualisierung von Daten. Der Data Cube richtet sich mit diesen Nutzungsmöglichkeiten an interessierte Bürger*innen und Medienvertreter*innen, aber auch an die Wissenschaft, Politiker*innen und Politikberatung sowie jegliche Arbeitsfelder mit Berührungspunkten zu Umweltfragen.
Was bedeutet „Data Cube“?
In einem Data Cube werden die Daten als Elemente eines mehrdimensionalen Datenwürfels angeordnet. Die Dimensionen des Würfels beschreiben die Daten, und ermöglichen eine Filterung der Daten nach den vorhandenen Kategorien.
Zum Beispiel werden die Treibhausgas-Emissionen im Data Cube detailliert abgebildet:
- für Deutschland insgesamt (räumliche Dimension)
- 35 Jahre (Zeit-Dimension)
- 271 verschiedene Quellgruppen (Dimension der Quellgruppen)
- 256 Sektoren des Klimaschutzgesetzes (Dimension der KSG Sektoren)
- 27 verschiedene Gase (Dimension der Substanzen)
- in acht verschiedenen Einheiten (Dimension der Einheiten)
Durch die einfach Filtermöglichkeiten können so mit einem Datensatz sowohl sehr allgemeine Fragestellungen (sind die Treibhausgas-Emissionen in Deutschland gesunken?) als auch sehr spezifische Fragestellungen (wie haben sich die Methan-Emissionen aus dem Wirtschaftsdüngermanagement für Legehennen im Vergleich zu Puten zwischen 2000 und 2024 entwickelt?) beantwortet werden. Die Ergebnisdaten können mensch- und maschinenlesbar heruntergeladen, visualisiert und geteilt werden.
Technische Umsetzung: Die .Stat Suite als Open-Source Lösung für den Data Cube
Die .Stat Suite ist eine modulare Lösung für die flexible und skalierbare Bereitstellung von Daten. Die Software wurde von der Statistical Information System Collaboration Community (SIS-CC) als Open-Source-Lösung produziert. Sie bietet die Möglichkeit, Daten über verschiedene Komponenten zu speichern, zu teilen, darzustellen und zu orchestrieren. Die .Stat Suite wird von verschiedenen nationalen oder internationalen Organisationen und Data-Providern genutzt – darunter die FAO, UNICEF oder die OECD. Die Daten werden über das SDMX-Format bereitgestellt, einem technischen Standard für den Austausch von Daten und Metadaten.
Die Infrastruktur des Data Cube ist in einer Cloud-Umgebung realisiert und durch das „Infrastructure as code“-Prinzip umgesetzt. So können Prozesse einfach und zentral skaliert werden. Die agilen Anpassungen der „Continuous Integration“-Methode gewährleistet die stetige Weiterentwicklung des Data Cube, zum Beispiel durch Einbindung von Nutzer*innen-Feedback.
Die Daten werden maschinenlesbar bereitgestellt: Eine RestAPI erlaubt den Abruf von Daten, Metadaten und Datenstrukturen in maschinenlesbarer Form. Als Basis wird die SDMX RESTful API verwendet. Eine Dokumentation ist in Swagger hinterlegt.
Ausprobieren und mitgestalten – wir freuen uns über Feedback!
Das aktuell verfügbare Angebot ist ein Startpunkt. Es kommen ständig neue Datensätze dazu und die Inhalte werden kontinuierlich optimiert. Auch die Oberfläche und Nutzer*innenführung werden noch umfangreich weiterentwickelt, immer unter dem Gesichtspunkt der Nutzungsfreundlichkeit. Erfahrungen zu sammeln, die Anwendungsperspektive einzunehmen und mit Nutzer*innen in Austausch zu treten, hat für uns hohe Priorität! Wir freuen uns daher jederzeit über Rückmeldungen an datacube [at] uba [dot] de.
Die Portalentwicklung findet als Open-Source-Projekt statt, der Code wird zukünftig auf der Plattform openCode öffentlich einsehbar sein.
Wie es weitergeht:
Der Data Cube startete 2024 als Pilotsystem und ging im April 2025 in den Produktivbetrieb über. Die Entwicklung ist auf dauerhaften Betrieb angelegt und zielt daher auf flexible Lösungen ab, die kontinuierlich an sich wandelnde Anforderungen und Rahmenbedingungen angepasst werden können. Alle im Projekt entwickelten Softwarekomponenten sollen Open Source zur Verfügung gestellt werden.
Hintergrund
Die Bundesregierung hat sich mit dem 4. Nationalen Aktionsplan Open Government (NAP) zur Einführung des Data Cube verpflichtet: Steckbrief der Verpflichtung zum Data Cube im 4. NAP