[Januar 2023]
Im vorherigen Logbucheintrag zur Luftschadstoffprognose wurde ein Überblick über das eUVM-Teilprojekt zur Prognose der Luftschadstoffe gegeben. Dieser Eintrag beschreibt die Funktionsweise und Ergebnisse der Prognose.
Ziel ist die stündliche Prognose von Stickstoffdioxid und Feinstaub (Partikelgrößen PM2.5 und PM10) in Berlin bis zum Abend des 4. Tages – nicht nur direkt an den Schadstoff-Messcontainern, sondern an beliebigen Orten im Berliner Stadtgebiet. Dabei sind vor allem große Straßen von Interesse, über deren zeitlich hoch aufgelöste Schadstoffbelastung bisher mangels Messcontainer wenig bekannt ist.
Dazu hat INWT Statistics ein statistisches Modell entwickelt, das mittels maschinellem Lernen die typischen Zusammenhänge an den Messstationen lernt und damit Prognosen für beliebige Punkte in Berlin erstellt.
Die folgende Abbildung zeigt exemplarisch die Stickstoffdioxid-Prognose, die das Modell am 2. Januar 2023 um 10 Uhr für einen Punkt in der Nähe des Leipziger Platzes macht:
Wie kommen die Prognosen zustande?
Das Modell lernt anhand der Daten der Schadstoff-Messcontainer seit Anfang 2015 die Zusammenhänge zu Prädiktoren wie dem prognostizierten Verkehrsaufkommen, Wetter, Standorteigenschaften, Wochentag und Uhrzeit. Dabei lernt das Modell typische Zusammenhänge wie zum Beispiel “Morgens um 7 ist die Schadstoffbelastung höher als nachts um 3”.
Nach der Lernphase kann das Modell für einen beliebigen Ort in Berlin eine Prognose erstellen. Die Voraussetzung dafür ist, dass für den gewünschten Ort alle Daten zur Verfügung stehen. Deswegen sind nur Prognosen für Zeitpunkte möglich, für die beispielsweise bereits eine Wetterprognose vorliegt.
Wie gut sind die Modellprognosen?
Generell sind die vom Modell gelernten Zusammenhänge hochgradig plausibel und stimmen mit vorhandenem Wissen überein, zum Beispiel:
- Je mehr Verkehr, desto höher die Schadstoffbelastung
- Je stärker der Wind, desto geringer die Schadstoffbelastung
- Bei sehr starkem Wind nimmt die Feinstaubbelastung jedoch wieder zu (vermutlich durch Aufwirbelung) – nicht aber die Stickstoffdioxidbelastung
- Zur Rush Hour werden die höchsten Schadstoffkonzentrationen identifiziert, nachts die geringsten
- Am Wochenende ist die Schadstoffbelastung geringer als während der Woche
Die folgende Karte visualisiert die NO2-Prognose für den 2. Januar 2023 um 6 Uhr für das Berliner Stadtgebiet. Insbesondere an den Straßen ist eine höhere Belastung (hellgelb) erkennbar. Am Stadtrand ist die geschätzte NO2-Belastung niedriger als im Zentrum.
Das Modell wird regelmäßig mit den aktuellen Daten neu geeicht. Das neueste Modell erreicht eine Genauigkeit von 73% erklärter Varianz für die Vorhersage von PM2.5 für die nächsten 24 Stunden (mittlere absolute Abweichung 3,4 µg/m³). Für PM10 liegt die Genauigkeit bei 71% (mittlere absolute Abweichung 4,2 µg/m³), für Stickstoffdioxid bei 73% (mittlere absolute Abweichung 4,9 µg/m³). Die Genauigkeit wird dabei – wie auch die Wettervorhersage – natürlich schlechter, je weiter in die Zukunft prognostiziert wird.
Die folgende Abbildung zeigt prognostizierte und beobachtete Stickstoffdioxid-Werte an der Schildhornstraße (oben) und PM10-Werte im Grunewald (unten) (Stand 02.01.2023, 09:00 Uhr):
Selbst an der Grunewald-Station, die abseits größerer Straßen und bewohnter Gebiete liegt, sind die Nachwirkungen des Silvester-Feuerwerks deutlich erkennbar.
Hier geht es zur Podcast-Folge über die Luftschadstoff-Prognose aus dem Podcast „In Numbers We Trust“ von INWT.