Validation von medizinischen ML-Modellen auf nicht-iid Datensätzen

Im Bereich der pathologischen medizinischen Bildanalyse (Histopathologie) gibt es großes Potenzial für die Anwendung moderner maschinell erlernter Bildanalysemodelle für Aufgaben wie die Segmentierung von Zellkernen oder die Klassifizierung von Kernen nach Zelltyp. In wissenschaftlichen Studien scheinen diese Modelle gut abzuschneiden und deshalb möchte man sie auch in der medizinischen Praxis einsetzen. Eine der vielen Voraussetzungen dafür ist eine sehr sorgfältige und gut durchgeführte Validierung ihrer Generalisierungsleistung auf Benchmark-Datensätzen. Aufgrund der sehr teuren Prozedur zur Gewinnung von Bildern für ein Validierungsset und verschiedener Faktoren, die Abhängigkeiten zwischen den Bildern schaffen, die die übliche iid-Annahme vieler Machine-Learning-Ansätze verletzen, muss bei der Validierung solcher Modelle besondere Sorgfalt walten.

Das Ziel dieser Arbeit ist es, die Auswirkungen spezifischer Verletzungen der iid-Annahme im Hinblick auf die Validierung der Generalisierungsleistung maschinell gelernter Modelle für histopathologische Bilder zu untersuchen.

Vorraussetzungen:

  • Sehr solide Kenntnisse in Statistik sowie der Validierung von maschinellem Lernen auf Bildbasierten Aufgaben (LV Machine Learning 1, Data Science oder vergleichbare Kenntnisse)
  • Interesse an der Überbrückung der Kluft zwischen theoretisch orientierter Forschung und soliden praktischen Resultaten
  • Gute Programmierkenntnisse in Python oder Sprachen mit starken deep learning frameworks
  • Wissen zu dieser spezifischen Medizinischen Domäne ist von Vorteil, aber keine zwingende Vorraussetzung

Literatur:

  • Homeyer, A. et. Al. (2021). Artificial Intelligence in Pathology: From Prototype to Product. Journal of Pathology Informatics (DOI 10.4103/jpi.jpi_84_20)
  • He, Y. Shen, Z. Cui, P. (2021). Towards non-iid image classification: A dataset and baselines. Pattern Recognition Volume 110 ISSN 0031-3203