Lungenkrebs ist nach wie vor eine der häufigsten krebsbedingten Todesursachen weltweit, weshalb eine frühzeitige und genaue Diagnose für die Verbesserung der Patientenergebnisse unerlässlich ist. Computertomographie-Scans (CT) des Brustkorbs werden häufig zur Erkennung von Lungenknötchen eingesetzt. Die Interpretation dieser Bilder erfordert jedoch eine sorgfältige Beurteilung mehrerer Merkmale, einschließlich Form, Ränder und interner Struktur. Dieser Prozess ist oft komplex und hängt stark vom Fachwissen eines Radiologen ab, was zu unterschiedlichen Diagnosen führt. Obwohl künstliche Intelligenz (KI) in den letzten Jahren die Klassifizierungsgenauigkeit verbessert hat, liefern die meisten Systeme immer noch nur binäre Ausgaben und bieten daher nur begrenzte Einblicke in die Art und Weise, wie Schlussfolgerungen gezogen werden.

Um dieser Herausforderung zu begegnen, entwickelte ein Forschungsteam unter der Leitung von Frau Maiko Nagao, einer Doktorandin der Graduate School of Science and Technology der Meijo-Universität, Japan, zusammen mit Professor Atsushi Teramoto von der Fakultät für Informationstechnik, Graduate School of Science and Technology, Meijo-Universität, Japan, und Professor Hiroshi Fujita von der Fakultät für Ingenieurwissenschaften der Gifu-Universität, Japan, und Professor Kazuyoshi Imaizumi von der School of Medicine der Fujita Health University, Japan, ein neuartiges diagnostisches Unterstützungsrahmenwerk basierend auf visueller Darstellung Fragebeantwortung (VQA), die die interaktive Generierung medizinischer Befunde aus Thorax-CT-Bildern ermöglicht. Ihre Ergebnisse wurden in der veröffentlicht Internationale Zeitschrift für computergestützte Radiologie und Chirurgie am 27. März 2026.

Konventionell Methoden zur KI-Diagnoseunterstützung waren nicht erklärbar, da sie sich hauptsächlich auf die Klassifizierung von Läsionen anhand medizinischer Bilder als gutartig oder bösartig konzentrierten. Dies machte es für Ärzte schwierig, die Ergebnisse zu interpretieren und zu nutzen. Unser Ziel war es daher, Erkenntnisse zu generieren, die denen von Ärzten ähneln, um die Benutzerfreundlichkeit und Akzeptanz von KI-Ergebnissen zu verbessern.“ sagt Frau Nagao.

Das Team erstellte einen speziellen Datensatz, indem es strukturierte Anmerkungen des Lung Image Database Consortium und der Image Database Resource Initiative (LIDC-IDRI) nutzte. Diese Anmerkungen beschreiben wichtige morphologische Merkmale von Lungenknötchen, wie z. B. Sphärizität, Rand, Textur, Lobulation, Spiculation und Verkalkung. Durch die Umwandlung dieser strukturierten Daten in Beschreibungen in natürlicher Sprache und deren Verknüpfung mit relevanten klinischen Fragen erstellten die Forscher einen Trainingsrahmen, der Bilder, Fragen und Ergebnisse miteinander verbindet. Anschließend wurde das Vision-Sprache-Modell verfeinert, um Antworten zu generieren, die sowohl auf visuellen Eingaben als auch auf ärztlichen Anfragen basieren.

Werbung
Hier könnte Ihr Advertorial stehen
Ein Advertorial bietet Unternehmen die Möglichkeit, ihre Botschaft direkt im redaktionellen Umfeld zu platzieren

Die Ergebnisse zeigten, dass das System klinisch bedeutsame und sprachlich natürliche Bildergebnisse liefern kann. Quantitative Auswertungen zeigten eine starke Übereinstimmung mit den Referenzbeschreibungen, einschließlich eines hohen CIDEr-Scores von 3,896, was auf genaue und kontextrelevante Ergebnisse hinweist. Wichtig ist, dass das Modell die Konsistenz aller wichtigen morphologischen Merkmale beibehielt und so eine zuverlässige Interpretation von Lungenknötchen unterstützte. Im Gegensatz zu herkömmlichen KI-Systemen ermöglicht dieser Ansatz es Ärzten, gezielte Fragen zu stellen – etwa zur Form oder zur inneren Struktur – und detaillierte, erklärbare Antworten zu erhalten.

„Unsere Studie demonstriert eine Technologie, die eine interaktive Untersuchung von Läsionsmerkmalen und die Generierung von Befunden aus CT-Bildern ermöglicht und als Lernwerkzeug für Ärzte dienen kann, wodurch die Variabilität bei Diagnosen verringert wird.“ sagt Prof. Teramoto.

Die Studie unterstreicht auch die Bedeutung der Erklärbarkeit in der medizinischen KI. Durch die Darstellung der Ergebnisse in einem Frage-und-Antwort-Format sorgt das System für Transparenz im diagnostischen Argumentationsprozess und erleichtert es Ärzten, KI-generierten Ergebnissen zu vertrauen und sie zu nutzen. Diese interaktive Funktion kann das Schreiben von Berichten unterstützen, die Ausbildung medizinischer Fachkräfte verbessern und Inkonsistenzen zwischen Diagnosen reduzieren.

Motiviert durch eine persönliche Erfahrung betonte Frau Nagao die Auswirkungen der Arbeit auf die reale Welt. Einige Patienten können sich aufgrund anderer Erkrankungen keinen invasiven Tests wie Biopsien unterziehen. Dies hat mich dazu inspiriert, eine Methode zu entwickeln, die die Diagnose unterstützt, ohne den Patienten zu belasten. Indem wir KI-Ergebnisse verständlicher und interaktiver machen, hoffen wir, sowohl die klinische Entscheidungsfindung als auch die Patientenversorgung zu verbessern.“

Insgesamt führt diese Forschung ein neues Paradigma für die KI-gestützte Diagnose ein, indem sie strukturiertes medizinisches Wissen mit interaktivem sprachbasiertem Denken kombiniert. Kurzfristig kann das System dazu beitragen, diagnostische Verfahren zu standardisieren und Ärzte bei der Interpretation komplexer CT-Bilder zu unterstützen. Längerfristig könnte es ein transparenteres, kollaborativeres und datengesteuertes Gesundheitssystem ermöglichen und den Weg für fortschrittliche Diagnosetools ebnen, die sich nahtlos in klinische Arbeitsabläufe integrieren lassen.


Quellen:

Journal reference:

Nagao, M., et al. (2026). Visual question answering-based image-finding generation for pulmonary nodules on chest CT from structured annotations. International Journal of Computer Assisted Radiology and Surgery. DOI: 10.1007/s11548-026-03608-0. https://link.springer.com/article/10.1007/s11548-026-03608-0