Wie man Deep-Learning-Algorithmen in der computergestützten Pathologie wiederverwendbar macht
Der Einsatz von künstlicher Intelligenz (KI) im Bereich der Pathologie, insbesondere bei der Früherkennung von Krankheiten, hat in den letzten zehn Jahren rapide zugenommen. Doch trotz einer ständig wachsenden Zahl von wissenschaftlichen Veröffentlichungen auf diesem Gebiet werden nur wenige publizierte Methoden von anderen Forschern wiederverwendet und noch weniger wurden in die klinische Routine umgesetzt. Ein Team von Helmholtz Munich Forschern hat nun untersucht, wie sich die Wiederverwendbarkeit und Reproduzierbarkeit dieser Deep-Learning-Algorithmen verbessern lässt und ihre Ergebnisse als Kommentar in Nature Medicine veröffentlicht.
Entscheidende Hindernisse für den Einsatz von Algorithmen in größerem Umfang sind die geringe Reproduzierbarkeit und Wiederverwendbarkeit. Mangelnde Verfügbarkeit von Software Code macht es selbst für Fachleute in maschinellem Lernen schwierig, Ergebnisse zu reproduzieren. Eine weitere Hürde ist die sogenannte Generalisierungslücke: KI-Algorithmen neigen dazu, bei externen Daten, die beispielsweise aus anderen Datenquellen oder Laboren stammen, schlechter abzuschneiden als bei Testdaten, die den Trainingsdaten ähnlich sind. Daher ist es wichtig, dass Veröffentlichungen unabhängige Testkohorten in ihre Studien einbeziehen, um diese Fallstricke zu vermeiden und den Nutzen für die klinische Praxis realistisch zu bewerten.
Verbesserung des Wissensaustauschs auf dem Gebiet der computergestützten Pathologie
"Unser Ziel ist es, von Wissenschaftlern entwickelte Algorithmen effektiver nutzbar zu machen", sagt Erstautorin Sophia J. Wagner. Auf Grundlage einer Literaturrecherche erstellten die Autoren eine Anleitung zur Verbesserung der Wiederverwendbarkeit und Reproduzierbarkeit, einschließlich Empfehlungen für die Veröffentlichung von Code und die Datennutzung. So wollen die Wissenschaftler:innen andere Forscher und wissenschaftliche Zeitschriften darauf aufmerksam machen, wie wichtig es ist, Code und Daten besser zugänglich zu machen. "Die gemeinsame Nutzung von Daten und Code wird der computergestützten Pathologie zu schnelleren Fortschritten verhelfen und sicherstellen, dass das Wissen in der gesamten Forschungsgemeinschaft effektiver geteilt werden kann", erklärt Dr. Tingying Peng, eine der beiden Letztautoren. "Letztendlich", ergänzt Dr. Carsten Marr, Direktor des Helmholtz Munich Instituts für AI for Health und ebenfalls Letztautor, "sollen die Algorithmen klinische Arbeitsabläufe optimieren und die Gesundheit der Patienten fördern."
Originalpublikation:
Wagner, S.J., Matek, C., Shetab Boushehri, S. et al. Make deep learning algorithms in computational pathology more reproducible and reusable. Nature Medicine (2022). DOI: https://doi.org/10.1038/s41591-022-01905-0