UBA Data Cube – Umweltdaten finden, erkunden und nutzen

Symbolgrafik, die zwei Personen bei der Nutzung des neuen Data Cube zeigt. zum Vergrößern anklicken
Die Daten zur Umwelt – zukünftig besser nutzbar durch den Data Cube.
Quelle: © Feodora / Adobe Stock (verändert)

Mit den Daten zur Umwelt bietet das Umweltbundesamt (UBA) bereits eine große Bandbreite an aktuellen Daten zum Zustand der Umwelt. Der UBA Data Cube macht diese noch besser nutzbar: Das neue System bietet maschinenlesbare Datensätze, offene Dateiformate, Schnittstellen (APIs) und Optionen zur Individualisierung. Das Portal ist verfügbar, wird aber noch intensiv optimiert – Feedback willkommen!

Inhaltsverzeichnis

 

Fit für die Zukunft:

Das ⁠UBA⁠ veröffentlichte 1984 den ersten bundesweiten Bericht zum Zustand der Umwelt – die „Daten zur Umwelt“. Bis heute gehört dieses Angebot zu den beliebtesten Publikationen des ⁠UBA⁠. Ursprünglich eine reine Berichtsreihe, sind die Daten mittlerweile längst dauerhaft online verfügbar. In Zeiten rasant wachsender Datenmengen und steigender Anforderungen an die Verfügbarkeit dieser Daten braucht es jedoch neue Lösungen, um mit diesem Service zeitgemäß zu bleiben. Der in diesem Kontext entstandene ⁠Data Cube⁠ ist ein entscheidender Schritt hin zu einer Kultur der offenen Daten (engl. ⁠Open Data⁠). Er verbessert den Zugang zu umweltrelevanten Daten, aber auch die Transparenz des Regierungs- und Verwaltungshandels.

Das leistungsfähige System eröffnet vielfältige neue Möglichkeiten zur Suche, Erkundung, Analyse und Visualisierung von Daten. Der Data Cube richtet sich mit diesen Nutzungsmöglichkeiten an interessierte Bürger*innen und Medienvertreter*innen, aber auch an die Wissenschaft, Politiker*innen und Politikberatung sowie jegliche Arbeitsfelder mit Berührungspunkten zu Umweltfragen.

 

Was bedeutet „Data Cube“?

In einem ⁠Data Cube⁠ werden die Daten als Elemente eines mehrdimensionalen Datenwürfels angeordnet. Die Dimensionen des Würfels beschreiben die Daten, und ermöglichen eine Filterung der Daten nach den vorhandenen Kategorien.

Zum Beispiel werden die ⁠Treibhausgas⁠-Emissionen im Data Cube detailliert abgebildet:

  • für Deutschland insgesamt (räumliche Dimension)
  • 35 Jahre (Zeit-Dimension)
  • 271 verschiedene Quellgruppen (Dimension der Quellgruppen)
  • 256 Sektoren des Klimaschutzgesetzes (Dimension der KSG Sektoren)
  • 27 verschiedene Gase (Dimension der Substanzen)
  • in acht verschiedenen Einheiten (Dimension der Einheiten)

Durch die einfach Filtermöglichkeiten können so mit einem Datensatz sowohl sehr allgemeine Fragestellungen (sind die Treibhausgas-Emissionen in Deutschland gesunken?) als auch sehr spezifische Fragestellungen (wie haben sich die Methan-Emissionen aus dem Wirtschaftsdüngermanagement für Legehennen im Vergleich zu Puten zwischen 2000 und 2024 entwickelt?) beantwortet werden. Die Ergebnisdaten können mensch- und maschinenlesbar heruntergeladen, visualisiert und geteilt werden.

 

Technische Umsetzung: Die .Stat Suite als Open-Source Lösung für den Data Cube

Die .Stat Suite ist eine modulare Lösung für die flexible und skalierbare Bereitstellung von Daten. Die Software wurde von der Statistical Information System Collaboration Community (SIS-CC) als Open-Source-Lösung produziert. Sie bietet die Möglichkeit, Daten über verschiedene Komponenten zu speichern, zu teilen, darzustellen und zu orchestrieren. Die .Stat Suite wird von verschiedenen nationalen oder internationalen Organisationen und Data-Providern genutzt – darunter die FAO, UNICEF oder die ⁠OECD⁠. Die Daten werden über das SDMX-Format bereitgestellt, einem technischen Standard für den Austausch von Daten und ⁠Metadaten⁠.

Die Infrastruktur des ⁠Data Cube⁠ ist in einer Cloud-Umgebung realisiert und durch das „Infrastructure as code“-Prinzip umgesetzt. So können Prozesse einfach und zentral skaliert werden. Die agilen Anpassungen der „Continuous Integration“-Methode gewährleistet die stetige Weiterentwicklung des Data Cube, zum Beispiel durch Einbindung von Nutzer*innen-Feedback.

Die Daten werden maschinenlesbar bereitgestellt: Eine RestAPI erlaubt den Abruf von Daten, Metadaten und Datenstrukturen in maschinenlesbarer Form. Als Basis wird die SDMX RESTful ⁠API⁠ verwendet. Eine Dokumentation ist in Swagger hinterlegt. 

 

Ausprobieren und mitgestalten – wir freuen uns über Feedback!

Das aktuell verfügbare Angebot ist ein Startpunkt. Es kommen ständig neue Datensätze dazu und die Inhalte werden kontinuierlich optimiert. Auch die Oberfläche und Nutzer*innenführung werden noch umfangreich weiterentwickelt, immer unter dem Gesichtspunkt der Nutzungsfreundlichkeit. Erfahrungen zu sammeln, die Anwendungsperspektive einzunehmen und mit Nutzer*innen in Austausch zu treten, hat für uns hohe Priorität! Wir freuen uns daher jederzeit über Rückmeldungen an datacube [at] uba [dot] de.

Die Portalentwicklung findet als Open-Source-Projekt statt, der Code wird zukünftig auf der Plattform openCode öffentlich einsehbar sein.

 

Wie es weitergeht:

Der ⁠Data Cube⁠ startete 2024 als Pilotsystem und ging im April 2025 in den Produktivbetrieb über. Die Entwicklung ist auf dauerhaften Betrieb angelegt und zielt daher auf flexible Lösungen ab, die kontinuierlich an sich wandelnde Anforderungen und Rahmenbedingungen angepasst werden können. Alle im Projekt entwickelten Softwarekomponenten sollen Open Source zur Verfügung gestellt werden.

 

Hintergrund

Die Bundesregierung hat sich mit dem 4. Nationalen Aktionsplan Open Government (NAP) zur Einführung des ⁠Data Cube⁠ verpflichtet: Steckbrief der Verpflichtung zum Data Cube im 4. NAP

Teilen:
Artikel:
Drucken
Schlagworte:
 Daten zur Umwelt  Umweltzustand  Open Data  Berichterstattung  Datenmanagement  Datenbank  Datenaustausch  Umweltdaten  Politikberatung