Künstliche Intelligenz (KI) wird bereits jetzt bei der Diagnose von Hautkrebs eingesetzt, kann aber mit der komplexen Entscheidungsfindung von Ärzt:innen in der Praxis (noch) nicht schritthalten. Ein internationales Forschungsteam unter Leitung von Harald Kittler von der MedUni Wien hat nun das sogenannte Verstärkungslernen als Methode erforscht, bei der durch Einbeziehung menschlicher Entscheidungskriterien mehr Treffsicherheit in den Ergebnissen der KI erzielt werden kann. So konnte die Rate der von Dermatolog:innen gestellten korrekten Hautkrebsdiagnosen um zwölf Prozent verbessert werden. Die Studie wurde aktuell im Top-Journal Nature Medicine publiziert.
Die Forscher:innen setzten im Rahmen ihrer Studie auf das Reinforcement Learning (RL, dt.: Verstärkungslernen) genannte Lernmodell und integrierten (menschliche) Kriterien in Form von „Belohnungstabellen“ in das KI-System. Belohnungstabellen sind Instrumente, die die positiven und negativen Konsequenzen klinischer Bewertungen sowohl aus Sicht der Ärzt:innen als auch aus Sicht der Patient:innen in den Entscheidungsprozess einbeziehen. Auf dieser Grundlage wurden Ergebnisse der KI-Diagnose nicht nur mit richtig oder falsch bewertet, sondern abhängig von den Auswirkungen der Diagnose bzw. der daraus folgenden Entscheidungen mit einer bestimmten Anzahl von Plus- oder Minuspunkten „belohnt“ bzw. „bestraft“.
Von menschlicher Einschätzung lernen
„So lernte die KI nicht nur bildbasierte Merkmale, sondern auch Konsequenzen von Fehldiagnosen in der Einschätzung von gutartigen und bösartigen Hauterscheinungen zu berücksichtigen“, verdeutlicht Studienleiter Harald Kittler von der Universitätsklinik für Dermatologie der MedUni Wien. Dadurch konnte, wie die Studie zeigt, die Treffsicherheit der Diagnose Hautkrebs deutlich verbessert werden: Die Sensitivität für Melanome etwa wurde von 61,4 auf 79,5 Prozent und für Basalzellkarzinome von 79,4 auf 87,1 Prozent erhöht. Insgesamt steigerte sich durch den Einsatz von RL die Rate der von Dermatolog:innen gestellten korrekten Diagnosen um zwölf Prozent, während sich die Rate der optimalen Entscheidungen für Management und Therapie der Erkrankung von 57,4 auf 65,3 Prozent erhöhte.
Auch bei anderen Erkrankungen denkbar
Die so verbesserte Leistung der KI-basierten Hautkrebsdiagnose ist auch darauf zurückzuführen, dass durch RL das übermäßige Vertrauen der KI in ihre eigenen Vorhersagen verringert wird und Vorschläge differenzierter, „menschlicher“ werden. „Das wiederum hilft den Ärzt:innen dabei in komplexen medizinischen Szenarien genauere und auf Patient:innen individuell zugeschnittene Entscheidungen zu treffen“, betont Harald Kittler im Vorfeld weiterer Forschungen zum Thema. Die aktuelle Arbeit konzentrierte sich zwar hauptsächlich auf die Hautkrebsdiagnose, aber die grundlegenden Ideen könnten auch in anderen Bereichen der medizinischen Entscheidungsfindung eingesetzt werden.
Publikation: Nature Medicine
A reinforcement learning model for AI-based decision support in skin cancer;
Catarina Barata, Veronica Rotemberg, Noel C. F. Codella, Philipp Tschandl, Christoph Rinner, Bengu Nisa Akay, Zoe Apalla, Giuseppe Argenziano, Allan Halpern, Aimilios Lallas, Caterina Longo, Josep Malvehy, Susana Puig, Cliff Rosendahl, H. Peter Soyer, Iris Zalaudek, Harald Kittler;
Doi: 10.1038/s41591-023-02475-5
https://www.nature.com/articles/s41591-023-02475-5
OTS-ORIGINALTEXT PRESSEAUSSENDUNG UNTER AUSSCHLIESSLICHER INHALTLICHER VERANTWORTUNG DES AUSSENDERS. www.ots.at
(C) Copyright APA-OTS Originaltext-Service GmbH und der jeweilige Aussender. Medizinische Universität Wien