Zur Kurzanzeige

Mapping and Interpolation of Tropospheric Ozone Data with Machine Learning Methods

dc.contributor.advisorSchultz, Martin G.
dc.contributor.authorBetancourt, Clara
dc.date.accessioned2023-12-14T12:53:11Z
dc.date.available2023-12-14T12:53:11Z
dc.date.issued14.12.2023
dc.identifier.urihttps://hdl.handle.net/20.500.11811/11182
dc.description.abstractTropospheric ozone is a toxic trace gas in the atmosphere. It threatens human health, damages crops and vegetation, and it is a short-lived climate forcer. Ozone is a secondary air pollutant that undergoes multiple physical and chemical processes on a wide range of timescales. Therefore, as with many environmental variables, it is difficult to quantify ozone concentrations where measurements are not available. To solve this problem, the goal of this work is to develop spatio-temporal mapping and interpolation methods using machine learning techniques with the example application of ozone data. We train the machine learning models on a large number of ozone measurements available in the Tropospheric Ozone Assessment Report (TOAR) database. The most important contributions of this work are:
• Mapping and interpolating ozone data, providing high-resolution, high-accuracy, spatiotemporal data products. The data products cover spatial domains from the regional to the global level, and their temporal resolution ranges from hourly data to multi-year statistics. We use large quantities of ozone measurements, combined with model data and geospatial data to generate the data products.
• Adapting, developing, and explaining new state-of-the-art machine learning methods that we use to create these data products. The most relevant algorithms of this work are tree-based and graph-based methods. For example, we develop a multi-scale evaluation technique for spatial machine learning models and verify their physical consistency by using Shapley additive explanations.
• Utilizing spatiotemporal patterns in geospatial data and ozone measurements in machine learning models. We use aggregated local to regional geospatial site conditions as input features for machine learning models. Furthermore, we adopt a graph machine learning algorithm to work on ozone measurements at irregularly placed air quality monitoring stations.
With this work, we publish AQ-Bench, a benchmark dataset for machine learning on global long-term ozone metrics. We link explainable machine learning on AQ-Bench with uncertainty assessments to point out limits in the dataset and the applicability of the resulting machine learning models. With the trained models, we also create the first completely data-driven, global, high-resolution map of long-term ozone metrics (resolution 0.1°×0.1°, years 2010 - 2014). Finally, we develop a high-performance graph-based missing data interpolation method for ozone measurements. It has an index of agreement of 0.96 - 0.99 for hourly missing data interpolation in Germany.
The synthesis of this work is that an interplay of physically sound data selection, uncertainty quantification, and explainability in machine learning can produce trustworthy environmental data products. We also found that the accuracy of the data products in a specific region is mainly dependent on good coverage with ozone measurements in that region. Therefore, this work contributes not only to the gapless quantification of ozone concentrations but also to trustworthy machine learning in the environmental sciences
en
dc.description.abstractMapping und Interpolation von troposphärischen Ozondaten mit Machine Learning Methoden
Troposphärisches Ozon ist ein giftiges Spurengas in der Atmosphäre. Es schadet der menschlichen Gesundheit, Nutzpflanzen und Vegetation, und ist ein kurzlebiges Treibhausgas. Ozon ist ein sekundärer Luftschadstoff, der in der Atmosphäre zahlreiche physikalische und chemische Prozesse auf unterschiedlichen Zeitskalen durchläuft. Wie bei vielen anderen Umweltvariablen ist es daher schwierig, dort Ozonkonzentrationen zu quantifizieren, wenn keine Messungen verfügbar sind. Um dieses Problem zu lösen, ist das Ziel dieser Arbeit die Entwicklung von räumlich-zeitlichen Mapping- und Interpolationsmethoden unter Verwendung von Techniken des Machine Learning am Beispiel von Ozondaten. Wir trainieren die Machine Learning Modelle auf Ozonmesswerten, die in der Datenbank des Tropospheric Ozone Assessment Report (TOAR) verfügbar sind. Die wichtigsten Beiträge dieser Arbeit sind:
• Mapping und Interpolation von Ozondaten, um hochauflösende, hochpräzise raum-zeitliche Datenprodukte zu liefern. Die Datenprodukte decken räumliche Bereiche von der regionalen bis zur globalen Ebene ab, und ihre zeitliche Auflösung reicht von stündlichen Daten bis zu mehrjährigen Statistiken. Wir verwenden große Datensätze mit Ozonmesswerten, kombiniert mit Modelldaten und Geodaten, um die Datenprodukte zu erstellen.
• Anpassung, Entwicklung und Erläuterung neuer Machine Learning Methoden, die wir zur Erstellung dieser Datenprodukte verwenden. Die wichtigsten Algorithmen dieser Arbeit basieren auf Entscheidungsbäumen und Graphen. Zum Beispiel entwickeln wir eine Evaluierungstechnik auf unterschiedlichen Skalen für räumliche Machine Learning Modelle und überprüfen ihre physikalische Konsistenz mit Hilfe von Shapley-Werten.
• Nutzung von raum-zeitlichen Mustern in Geodaten und Ozonmessungen in Machine Learning Modellen. Wir verwenden aggregierte lokale bis regionale geospatiale Daten in Machine Learning Modellen. Außerdem wenden wir einen Machine Learning Algorithmus an, der Ozonmessungen an unregelmäßig angeordneten Stationen verarbeiten kann.
Mit dieser Arbeit veröffentlichen wir AQ-Bench, einen Benchmark-Datensatz für Machine Learning auf globalen Langzeit Ozonmetriken. Wir verknüpfen erklärbares Machine Learning auf AQ-Bench mit Unsicherheitsbewertungen, um die Grenzen des Datensatzes und die Anwendbarkeit der resultierenden Machine Learning Modelle aufzuzeigen. Mit den trainierten Modellen erstellen wir auch die erste vollständig datengetriebene, globale, hochauflösende Karte von Langzeit-Ozonmetriken (Auflösung: 0,1°, Jahre: 2010 bis 2014). Wir entwickeln auch eine graphbasierte Methode zur Interpolation fehlender Daten für Ozonmessungen. Die Methode hat einen Index of Agreement von 0,96 - 0,99 für die stündliche Interpolation fehlender Messdaten in Deutschland. Die Synthese dieser Arbeit ist, dass ein Zusammenspiel von physikalisch fundierter Datenauswahl, Unsicherheitsquantifizierung und Erklärbarkeit beim Machine Learning zuverlässige Umweltdatenprodukte erzeugen kann. Wir haben auch festgestellt, dass die Genauigkeit der Datenprodukte in einer bestimmten Region hauptsächlich von einer guten Abdeckung mit Ozonmessungen in dieser Region abhängt. Daher trägt diese Arbeit nicht nur zur lückenlosen Quantifizierung von Ozonkonzentrationen bei, sondern auch zum Machine Learning in den Umweltwissenschaften im Allgemeinen.
de
dc.language.isoeng
dc.rightsNamensnennung 4.0 International
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectair quality
dc.subjecttropospheric ozone
dc.subjectmachine learning
dc.subject.ddc550 Geowissenschaften
dc.titleMapping and Interpolation of Tropospheric Ozone Data with Machine Learning Methods
dc.typeDissertation oder Habilitation
dc.identifier.doihttps://doi.org/10.48565/bonndoc-179
dc.publisher.nameUniversitäts- und Landesbibliothek Bonn
dc.publisher.locationBonn
dc.rights.accessRightsopenAccess
dc.identifier.urnhttps://nbn-resolving.org/urn:nbn:de:hbz:5-73366
dc.relation.doihttps://doi.org/10.5194/essd-13-3013-2021
dc.relation.doihttps://doi.org/10.3390/make4010008
dc.relation.doihttps://doi.org/10.5194/gmd-15-4331-2022
dc.relation.doihttps://doi.org/10.1021/acs.est.3c05104
ulbbn.pubtypeErstveröffentlichung
ulbbnediss.affiliation.nameRheinische Friedrich-Wilhelms-Universität Bonn
ulbbnediss.affiliation.locationBonn
ulbbnediss.thesis.levelDissertation
ulbbnediss.dissID7336
ulbbnediss.date.accepted28.08.2023
ulbbnediss.instituteLandwirtschaftliche Fakultät : Institut für Geodäsie und Geoinformation (IGG)
ulbbnediss.fakultaetLandwirtschaftliche Fakultät
dc.contributor.coRefereeRoscher, Ribana
ulbbnediss.contributor.orcidhttps://orcid.org/0000-0002-1347-5297


Dateien zu dieser Ressource

Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige

Die folgenden Nutzungsbestimmungen sind mit dieser Ressource verbunden:

Namensnennung 4.0 International