Integrated Robotic Learning and Planning for UAV-Based Information Gathering in Unknown Environments
Integrated Robotic Learning and Planning for UAV-Based Information Gathering in Unknown Environments

dc.contributor.advisor | Popović, Marija | |
dc.contributor.author | Rückin, Julius | |
dc.date.accessioned | 2025-07-09T08:47:36Z | |
dc.date.available | 2025-07-09T08:47:36Z | |
dc.date.issued | 09.07.2025 | |
dc.identifier.uri | https://hdl.handle.net/20.500.11811/13200 | |
dc.description.abstract | Robots increasingly automate tasks that require costly and precise measurements at scale. Combining advances in hardware development with recent progress in machine learning-based computer vision enables robots to collect data with onboard sensors and interpret measurements to gather information, e.g. monitoring crop conditions for breeders or cities for disaster management. Classical information-gathering missions might require the environment to be known before deployment and traditionally execute pre-programmed paths for robotic data collection. In unknown environments, robot autonomy is often limited by the need for human supervision or operation. To fully leverage the information-gathering potential, we need algorithms that enable the robot to plan actions onboard during its deployment. Mainly, robots must autonomously collect information and adapt their behaviour online in the unknown environment while considering onboard resource constraints, such as the limited energy and compute power of unmanned aerial vehicles (UAVs). This task is also known as the adaptive informative path planning problem.
The main contributions of this thesis are novel learning-based adaptive informative path planning approaches for UAV-based information gathering in unknown environments. Our approaches guide a resource-constrained UAV towards areas where it could collect informative measurements to enhance its understanding of the environment. First, we present a new adaptive informative path planning method combining tree search-based planning with reinforcement learning to train strategies gathering continuous-valued information, such as surface temperature. Our learning-based method accelerates path replanning during deployment on a resource-constrained UAV compared to non-learning-based planning methods. In general, adaptive informative path planning methods are explicitly designed and trained for certain map representations capturing continuous-valued or discrete-valued environment information, e.g. semantic segmentation of weeds and crops. The second approach introduces a novel mathematical formulation of the adaptive informative path planning problem unifying arbitrary to-be-monitored environment information. Using our formulation, we train a single map-agnostic information-gathering strategy, performing on par or better than previous map-specific methods. In missions that require semantically interpreting images using deep learning-based vision models, the model's prediction performance often degrades in unknown environments. Thus, costly human labelling of collected images is required to improve vision models. We propose a novel adaptive informative path planning framework for active learning of semantic segmentation models to improve a UAV's semantic vision in unknown environments. Our framework improves the model performance faster while drastically reducing the number of human-labelled images required to train the model compared to prior non-adaptive training data collection campaigns. Lastly, our fourth approach is a novel semi-supervised learning method for improving semantic vision in unknown environments to further reduce human labelling efforts. Overall, our semi-supervised method requires less than one per cent of the human-labelled pixels to maintain semantic segmentation performance similar to exhaustively labelling all image pixels. | en |
dc.description.abstract | Roboter automatisieren zunehmend Aufgaben, die kostenintesive und präzise Messungen in großem Maßstab erfordern. Durch Fortschritte in der Hardwareentwicklung und im maschinellen Lernen können Roboter mittels Sensoren Daten sammeln und interpretieren, um Informationen, z. B. zur Analyse von Nutzpflanzen für Züchter oder von Städten zu Zwecken des Katastrophenmanagements, zu erfassen. Klassische Missionen zur Informationserfassung setzen eine bekannte Umgebung voraus und sammeln Daten entlang vorprogrammierter Pfade. Für die Datenerfassung in unbekannten Umgebungen ist häufig eine manuelle Überwachung oder Bedienung nötig. Um das Potenzial, Informationen zu erfassen voll auszuschöpfen, benötigen wir Algorithmen, die es dem Roboter ermöglichen, Aktionen direkt an Bord zu planen und auszuführen. Um effizient Informationen zu sammeln, müssen Roboter die unbekannte Umgebung autonom erkunden und dabei Ressourcenbeschränkungen wie z.B. begrenzte Energie- und Rechenkapazitäten eines unbemannten Luftfahrzeugs (UAV) berücksichtigen. Diese Aufgabe wird als adaptives Wegplanungsproblem bezeichnet.
Die Hauptbeiträge dieser Arbeit sind neue, lernbasierte, adaptive Wegplanungsmethoden für die UAV-basierte Informationserfassung in unbekannten Umgebungen. Unsere Methoden leiten ein ressourcenbeschränktes UAV in Regionen, in denen es informative Messungen sammeln könnte, um sein aktuelles Umgebungsverständnis zu verbessern. Zuerst präsentieren wir eine adaptive Wegplanungsmethode, die eine Baumsuche mit bestärkenden Lernen kombiniert, um Strategien zur Erfassung von Informationen mit kontinuierlichen Werten, wie z. B. Oberflächentemperatur, zu trainieren. Unsere Methode beschleunigt die Wegplanung auf einem ressourcenbeschränkten UAV im Vergleich zu nicht lernbasierten Wegplanungsmethoden. Generell werden adaptive Wegplanungsmethoden für bestimmte Kartenrepräsentationen entwickelt und trainiert, die entweder Informationen mit kontinuierlichen oder diskreten Werten, wie z.B. die Segmentierung von Unkraut und Pflanzen, erfassen. Die zweite Methode führt eine neue Formulierung des adaptiven Wegplanungsproblems ein, die beliebige zu beobachtende Informationen vereinheitlicht, und es ermöglicht, eine karten-agnostische Strategie zur Informationserfassung zu trainieren, deren Leistung vergleichbar mit kartenspezifischen Methoden ist. In Missionen, bei denen Bilder mittels lernbasierten Bildverarbeitungsmodellen semantisch interpretiert werden, verschlechtert sich die Modellvorhersage in unbekannten Umgebungen, sodass kostenintensive manuelle Annotationen der gesammelten Bilder zur Verbesserung des Modells erforderlich sind. Zur Verbesserung des semantischen Sehens eines UAV in unbekannten Umgebungen stellen wir ein neues adaptives Wegplanungssystem für das aktive Lernen von semantischen Segmentierungsmodellen vor. Im Vergleich zu vorherigen Kampagnen zur Trainingsdatensammlung verbessert unser System die semantische Segmentierung schneller und reduziert die Anzahl der benötigten manuell annotierten Bilder. Unsere vierte Methode ist ein halbüberwachtes Lernverfahren, um den Aufwand der manuellen Annotationen weiter zu reduzieren. Mit weniger als einem Prozent der manuell annotierten Pixeln erzielt unsere Methode eine ähnlich akkurate semantische Segmentierung wie bei der manuellen Annotation aller Pixel. | de |
dc.language.iso | eng | |
dc.rights | In Copyright | |
dc.rights.uri | http://rightsstatements.org/vocab/InC/1.0/ | |
dc.subject | Wegplanung | |
dc.subject | Informationsgewinnung | |
dc.subject | Bestärkendes Lernen | |
dc.subject | Roboterwahrnehmung | |
dc.subject | Luftroboter | |
dc.subject | Path Planning | |
dc.subject | Information Gathering | |
dc.subject | Reinforcement Learning | |
dc.subject | Robot Perception | |
dc.subject | Aerial Robots | |
dc.subject.ddc | 004 Informatik | |
dc.subject.ddc | 620 Ingenieurwissenschaften und Maschinenbau | |
dc.title | Integrated Robotic Learning and Planning for UAV-Based Information Gathering in Unknown Environments | |
dc.type | Dissertation oder Habilitation | |
dc.identifier.doi | https://doi.org/10.48565/bonndoc-597 | |
dc.publisher.name | Universitäts- und Landesbibliothek Bonn | |
dc.publisher.location | Bonn | |
dc.rights.accessRights | openAccess | |
dc.identifier.urn | https://nbn-resolving.org/urn:nbn:de:hbz:5-83361 | |
dc.relation.arxiv | arXiv:2410.10684 | |
dc.relation.doi | https://doi.org/10.1109/LRA.2025.3557233 | |
dc.relation.doi | https://doi.org/10.1109/LRA.2024.3359970 | |
dc.relation.doi | https://doi.org/10.1109/TRO.2023.3313811 | |
dc.relation.doi | https://doi.org/10.1109/IROS47612.2022.9981738 | |
dc.relation.doi | https://doi.org/10.1109/ICRA46639.2022.9812025 | |
ulbbn.pubtype | Erstveröffentlichung | |
ulbbnediss.affiliation.name | Rheinische Friedrich-Wilhelms-Universität Bonn | |
ulbbnediss.affiliation.location | Bonn | |
ulbbnediss.thesis.level | Dissertation | |
ulbbnediss.dissID | 8336 | |
ulbbnediss.date.accepted | 27.05.2025 | |
ulbbnediss.institute | Agrar-, Ernährungs- und Ingenieurwissenschaftliche Fakultät : Institut für Geodäsie und Geoinformation (IGG) | |
ulbbnediss.fakultaet | Agrar-, Ernährungs- und Ingenieurwissenschaftliche Fakultät | |
dc.contributor.coReferee | Stachniss, Cyrill | |
ulbbnediss.contributor.orcid | https://orcid.org/0000-0002-6308-0533 |
Dateien zu dieser Ressource
Das Dokument erscheint in:
-
E-Dissertationen (1103)