Kersting, Lennart Nils: Künstliche Intelligenz zur Detektion von fokaler kortikaler Dysplasie : Ein multizentrischer Vergleich existierender und neu trainierter Modelle. - Bonn, 2026. - Dissertation, Rheinische Friedrich-Wilhelms-Universität Bonn.
Online-Ausgabe in bonndoc: https://nbn-resolving.org/urn:nbn:de:hbz:5-90729
Online-Ausgabe in bonndoc: https://nbn-resolving.org/urn:nbn:de:hbz:5-90729
@phdthesis{handle:20.500.11811/14227,
urn: https://nbn-resolving.org/urn:nbn:de:hbz:5-90729,
author = {{Lennart Nils Kersting}},
title = {Künstliche Intelligenz zur Detektion von fokaler kortikaler Dysplasie : Ein multizentrischer Vergleich existierender und neu trainierter Modelle},
school = {Rheinische Friedrich-Wilhelms-Universität Bonn},
year = 2026,
month = jun,
note = {FCDs sind angeborene Fehlbildungen der Großhirnrinde und eine der häufigsten Ursachen für medikamentös schwer behandelbare fokale Epilepsien. Die Magnetresonanztomographie (MRT) spielt in der präoperativen Diagnostik eine zentrale Rolle. Die korrekte Lokalisation stellt im klinischen Alltag jedoch eine erhebliche Herausforderung dar, da bis zu 30 % übersehen werden. In den letzten Jahren wurden verschiedene Algorithmen veröffentlicht, die bei der FCD-Detektion unterstützen sollen. In dieser Arbeit wurden sechs verschiedene KI-Modelle verglichen, darunter drei bereits veröffentlichte (MAP18, MELD, deepFCD) sowie drei neu zur FCD-Detektion trainierte Modelle (FastSurferCNN, 2D-nnUNet, 3D-nnUNet).
Insgesamt wurden MRT-Datensätze von 329 Personen ausgewertet, darunter 244 mit FCD und 85 gesunde Kontrollpersonen. 118 FCD-Fälle aus Bonn dienten dem Training der Modelle, die übrigen 126 FCD-Fälle aus vier Zentren (Bonn, Berlin, Frankfurt, Zürich) bildeten den unabhängigen Testdatensatz.
Um die Modelle fair und umfassend zu vergleichen, wurden ihre Vorhersagen mit den von Expertinnen und Experten markierten Läsionen anhand einheitlicher Kriterien auf Voxel-, Cluster- und Fall-Ebene bewertet. Dazu wurden hauptsächlich der Dice-Koeffizient, der F1-Score auf Cluster-Ebene und die Detektionsrate sowie Spezifität auf Fall-Ebene betrachtet.
Das neu trainierte 3D-nnUNet erreichte den höchsten F1-Score mit 0,58 (Sensitivität 0,55, Präzision 0,63) sowie den höchsten Dice-Score mit 0,36. Es wies die zweithöchste Detektionsrate von 55 % und eine Spezifität von 86 % auf. Die höchste Detektionsrate erreichte deepFCD mit 82 %, jedoch mit der geringsten Spezifität von 0 %. Zudem produzierte es die meisten falsch-positiven Cluster und wies somit die geringste Präzision von 0,03 und den geringsten F1-Score von 0,07 auf. MELD erreichte eine Detektionsrate von 49 %, MAP18 von 29 %, FastSurferCNN und 2D-nnUNet je von 13 %. Weiterhin zeigte sich, dass sich die Detektionsraten der Modelle für die Fälle aus den vier Zentren unterschieden. MELD erreichte zwar nicht die höchste Detektionsrate, lieferte jedoch über alle vier Zentren hinweg die stabilste Leistung.
Diese Studie stellte den ersten multizentrischen Vergleich öffentlich verfügbarer KI-basierter FCD-Detektionsmodelle dar. Die Performance variierte stark zwischen den Zentren und Modellen. Das neu trainierte 3D-nnUNet erzielte dabei das beste Gleichgewicht aus Präzision und Sensitivität bei gleichzeitig schneller Laufzeit. Zudem zeigten Modelle mit dreidimensionaler Datenverarbeitung insgesamt bessere Detektionsraten, was auf die Bedeutung des räumlichen Kontexts bei der FCD-Erkennung hindeutet.},
url = {https://hdl.handle.net/20.500.11811/14227}
}
urn: https://nbn-resolving.org/urn:nbn:de:hbz:5-90729,
author = {{Lennart Nils Kersting}},
title = {Künstliche Intelligenz zur Detektion von fokaler kortikaler Dysplasie : Ein multizentrischer Vergleich existierender und neu trainierter Modelle},
school = {Rheinische Friedrich-Wilhelms-Universität Bonn},
year = 2026,
month = jun,
note = {FCDs sind angeborene Fehlbildungen der Großhirnrinde und eine der häufigsten Ursachen für medikamentös schwer behandelbare fokale Epilepsien. Die Magnetresonanztomographie (MRT) spielt in der präoperativen Diagnostik eine zentrale Rolle. Die korrekte Lokalisation stellt im klinischen Alltag jedoch eine erhebliche Herausforderung dar, da bis zu 30 % übersehen werden. In den letzten Jahren wurden verschiedene Algorithmen veröffentlicht, die bei der FCD-Detektion unterstützen sollen. In dieser Arbeit wurden sechs verschiedene KI-Modelle verglichen, darunter drei bereits veröffentlichte (MAP18, MELD, deepFCD) sowie drei neu zur FCD-Detektion trainierte Modelle (FastSurferCNN, 2D-nnUNet, 3D-nnUNet).
Insgesamt wurden MRT-Datensätze von 329 Personen ausgewertet, darunter 244 mit FCD und 85 gesunde Kontrollpersonen. 118 FCD-Fälle aus Bonn dienten dem Training der Modelle, die übrigen 126 FCD-Fälle aus vier Zentren (Bonn, Berlin, Frankfurt, Zürich) bildeten den unabhängigen Testdatensatz.
Um die Modelle fair und umfassend zu vergleichen, wurden ihre Vorhersagen mit den von Expertinnen und Experten markierten Läsionen anhand einheitlicher Kriterien auf Voxel-, Cluster- und Fall-Ebene bewertet. Dazu wurden hauptsächlich der Dice-Koeffizient, der F1-Score auf Cluster-Ebene und die Detektionsrate sowie Spezifität auf Fall-Ebene betrachtet.
Das neu trainierte 3D-nnUNet erreichte den höchsten F1-Score mit 0,58 (Sensitivität 0,55, Präzision 0,63) sowie den höchsten Dice-Score mit 0,36. Es wies die zweithöchste Detektionsrate von 55 % und eine Spezifität von 86 % auf. Die höchste Detektionsrate erreichte deepFCD mit 82 %, jedoch mit der geringsten Spezifität von 0 %. Zudem produzierte es die meisten falsch-positiven Cluster und wies somit die geringste Präzision von 0,03 und den geringsten F1-Score von 0,07 auf. MELD erreichte eine Detektionsrate von 49 %, MAP18 von 29 %, FastSurferCNN und 2D-nnUNet je von 13 %. Weiterhin zeigte sich, dass sich die Detektionsraten der Modelle für die Fälle aus den vier Zentren unterschieden. MELD erreichte zwar nicht die höchste Detektionsrate, lieferte jedoch über alle vier Zentren hinweg die stabilste Leistung.
Diese Studie stellte den ersten multizentrischen Vergleich öffentlich verfügbarer KI-basierter FCD-Detektionsmodelle dar. Die Performance variierte stark zwischen den Zentren und Modellen. Das neu trainierte 3D-nnUNet erzielte dabei das beste Gleichgewicht aus Präzision und Sensitivität bei gleichzeitig schneller Laufzeit. Zudem zeigten Modelle mit dreidimensionaler Datenverarbeitung insgesamt bessere Detektionsraten, was auf die Bedeutung des räumlichen Kontexts bei der FCD-Erkennung hindeutet.},
url = {https://hdl.handle.net/20.500.11811/14227}
}





