Eine neue Studie von Wissenschaftlern der University of California San Diego in Zusammenarbeit mit der University of Pittsburgh School of Medicine, der Johns Hopkins University und anderen Institutionen zeigt, dass ein auf künstlicher Intelligenz basierender CPR-Coaching-Agent die 911-Disponenten bei der Führung von Umstehenden durch Herz-Lungen-Wiederbelebung übertreffen kann.

Die Studie, veröffentlicht in JAMA Innere Medizinvergleicht zunächst beliebte KI-Modelle für HLW-Anweisungen und stellt dann ChatCPR vor, einen Open-Source-KI-Agenten, der bei richtlinienbasierten HLW-Checklisten 100 % punktete und menschliche Disponenten deutlich übertraf, wenn er anhand von Aufzeichnungen früherer echter Notrufe getestet wurde.

„Wenn KI ihren Platz in der Medizin verdienen will, sollte sie damit beginnen, den Menschen dabei zu helfen, die Person direkt vor ihnen zu retten“, sagte John W. Ayers, Ph.D., Wissenschaftler am UC San Diego Qualcomm Institute sowie Leiter der KI am UC San Diego Altman Clinical and Translational Research Institute, Professor an der UC San Diego School of Medicine und Mitautor der Studie.

„Mehr als 350.000 Amerikaner erleiden jedes Jahr einen Herzstillstand außerhalb des Krankenhauses, und die Überlebensrate liegt bei etwa 9 %. Angesichts der Tatsache, dass nur 2 % der Amerikaner für die Durchführung von HLW zertifiziert sind, rufen sie, wenn jemand zusammenbricht, die Notrufnummer 911 und warten. ChatCPR könnte das ändern und beginnen, Leben zu retten“, fügte Nimit Desai, BS, ein Forschungsmitarbeiter am UC San Diego Qualcomm Institute, ein Medizinstudent an der UC San Diego School of Medicine, hinzu Hauptautor der Studie.

Werbung
Hier könnte Ihr Advertorial stehen
Ein Advertorial bietet Unternehmen die Möglichkeit, ihre Botschaft direkt im redaktionellen Umfeld zu platzieren

Ein erster Schritt in Richtung KI-gestützter CPR

Die Einführung neuer Technologien könnte dazu beitragen, die Lücke zwischen Herzstillstand und Einleitung einer HLW zu schließen. In dieser Proof-of-Concept-Studie verwendeten die Forscher 12 echte Notrufe, um KI-generierte HLW-Anweisungen mit denen der Disponenten zu vergleichen.

„Wenn neue KI-Technologien auftauchen, wissen wir, dass die Menschen damit beginnen werden, sie in realen Situationen einzusetzen“, sagte Christopher M. Horvat, MD, Direktor der medizinischen Notfallteams am UPMC Children’s Hospital of Pittsburgh. „Unser Ziel war es, einen ersten Schritt zu machen, um zu verstehen, wie diese Werkzeuge funktionieren und wie sie bewertet werden sollten, bevor sie in patientennahen Umgebungen eingesetzt werden“, sagte Horvat, der auch stellvertretender Direktor des Safar Center for Resuscitation Research an der University of Pittsburgh ist, benannt nach Dr. Peter Safar, einem Pionier der modernen CPR.

Die Ergebnisse verdeutlichen die Möglichkeit, die Rolle der KI bei der Bereitstellung richtlinienbasierter Anweisungen zu untersuchen – als Ergänzung und nicht als Ersatz für menschliche Helfer. „Hier geht es darum, Menschen in kritischen Situationen zu unterstützen, in denen menschliches Urteilsvermögen unerlässlich ist“, fügte Horvat hinzu. „Das Ziel besteht darin, die Leistungsfähigkeit anzuheben und nicht darin, ausgebildete Fachkräfte zu ersetzen.“

Beliebte KI-Modelle sind vielversprechend, bleiben aber hinter den Erwartungen zurück

Das Forschungsteam hat zunächst beliebte KI-Modelle, darunter ChatGPT, Claude, Grok, Gemini, Llama und Mixtral, zum CPR-Coaching in simulierten Notfallszenarien verglichen und sie anhand einer Checkliste mit Kriterien für die Bereitstellung richtlinienkonformer CPR-Anweisungen bei außerklinischem Herzstillstand bewertet.

In verschiedenen Situationen, wie Ertrinken oder Zusammenbrechen beim Joggen, und bei verschiedenen Patienten, vom Kleinkind bis zum Senior, zeigten KI-Modelle bei den Grundlagen der HLW gute Ergebnisse. Im Durchschnitt erreichten sie 90 % bei wesentlichen Schritten, z. B. wo und wie schnell sie auf die Brust drücken sollten. Die Werte lagen zwischen 79 % (Zwillinge) und 97 % (Grok und Claude). Wenn es darum ging, die bestmöglichen Anweisungen zur Verbesserung des Überlebens zu geben, sank die Leistung. Bei diesen fortgeschritteneren Schritten, wie dem vollständigen Anheben der Brust zwischen den Kompressionen, erreichten die Modelle durchschnittlich 70 %. Die Werte lagen zwischen 61 % (Llama) und 75 % (ChatGPT).

Bei einem Herzstillstand ist gut nicht gut genug. Das Fehlen von 10 bis 30 % der Schritte kann den Unterschied zwischen Leben und Tod ausmachen.“

Cameron Dezfulian, MD, Intensivmediziner für Erwachsene und Kinder, leitendes Fakultätsmitglied am Baylor College of Medicine und Mitautor der Studie

Aufbau von ChatCPR für echte Notfälle

Diese Lücken haben die Entwicklung von ChatCPR beeinflusst, einem Open-Source-KI-Agenten für CPR-Coaching, der auf Schulungsmaterialien für Notrufzentralen und Best Practices für CPR basiert. Das System wurde iterativ entwickelt, um bestimmte Fehlermodi zu beheben. In denselben Szenarien erzielte ChatCPR bei simulierten Anrufen sowohl bei den grundlegenden als auch bei den fortgeschritteneren Schritten, die erforderlich sind, um jemandem die besten Überlebenschancen zu geben, 100 %.

Die entscheidende Frage war, ob es im wirklichen Leben funktionieren könnte. Das Team nutzte einen separaten Satz echter, nicht identifizierter Notrufe, die öffentlich zugänglich waren. Bei diesen Anrufen hatten die Disponenten bereits HLW-Anweisungen gegeben. Anschließend verglich das Team die Anweisungen der Disponenten mit den Anweisungen von ChatCPR.

ChatCPR übertraf in jedem Vergleich die 911-Disponenten

„ChatCPR hat jeden direkten Vergleich mit menschlichen Disponenten gewonnen“, erklärte Noor Majhail, BS, Rettungsdiensthelfer und Mitautor der Studie. ChatCPR erzielte bei den grundlegenden CPR-Schritten 15 Prozentpunkte bessere Ergebnisse als der Dispatcher; Konkret erfüllten die Disponenten 85 % der Richtlinienschritte und ChatCPR 100 %. Bei fortgeschritteneren Schritten war die Lücke noch größer; ChatCPR erreichte 99 %, während die Disponenten 63 % erreichten – ein Unterschied von 36 Prozentpunkten.

„ChatCPR zeichnete sich durch hervorragende Leistungen bei der Patientenbeurteilung, den Anweisungen zur Tiefe und Frequenz der Brustkorbkompression sowie der Rückstoßführung in Bereichen aus, in denen gestresste, multitaskingfähige Disponenten am häufigsten ins Stocken geraten“, fügte Desai hinzu.

„Hier ging es nicht um Stil. Es ging um die strikte Einhaltung der CPR-Richtlinien, bei denen Präzision am wichtigsten ist“, sagte Dr. Davey Smith, Professor an der UC San Diego School of Medicine, Direktor des Altman Clinical and Translational Research Institute an der UC San Diego und Mitautor der Studie. „ChatCPR befasste sich mit Elementen, die Disponenten unter dem Stress und der Komplexität realer Anrufe manchmal übersehen, und stellte eine wertvolle Gelegenheit dar, KI in die reale Gesundheitspraxis zu übertragen.“

KI, die Leben retten kann – mit Schutzmaßnahmen

„Kein KI-System ist perfekt, aber die Triangulation von Problemerkennung, fundiertem Fachwissen und KI ist der Scheideweg für das Gesundheitswesen, um bedeutende Durchbrüche zu ermöglichen“, sagte Rema Padman, Ph.D., Kuratoriumsprofessorin für Managementwissenschaft und Gesundheitsinformatik am Heinz College of Information Systems and Public Policy der Carnegie Mellon University und Mitautorin der Studie.

Die Forscher sagen, dass noch sorgfältige Tests unter realen Bedingungen erforderlich sind. Sie möchten sicherstellen, dass das System sicher ist, in chaotischen Umgebungen funktioniert und für die Benutzer leicht verständlich ist. Sie betonen auch die Bedeutung von Schutzmaßnahmen und der Integration in bestehende 911-Systeme sowie die kontinuierliche menschliche Aufsicht.

Um dieses Ziel zu erreichen, hat das Team ChatCPR offen und kostenlos gemacht, damit jeder es nutzen und studieren kann. Sie teilten das komplette System, wie sie es getestet haben und alle zugehörigen Materialien. „Jeder Entwickler oder jede Organisation kann ChatCPR frei nutzen, anpassen und bereitstellen“, bemerkte Mark Dredze, Ph.D., Professor für Informatik an der Johns Hopkins University und Mitautor der Studie. „Wir ermutigen Forscher, diese Technologie auf allen Plattformen zu verfeinern, zu testen und zu verbessern, um lebensrettende Hilfe für alle bereitzustellen.“

„KI könnte im gesamten Reaktionskontinuum bei Herzstillstand einen Mehrwert schaffen, indem sie Umstehenden dabei hilft, früher mit der Wiederbelebung zu beginnen, Disponenten mit standardisierten Anleitungen zu unterstützen und Klinikern und Ersthelfern während des Trainings mit komplexen oder szenariospezifischen Anweisungen zu helfen“, fügte Horvat hinzu.

Klare regulatorische Rahmenbedingungen werden, wie einige Mitglieder des Autorenteams bereits in einem früheren JAMA-Artikel angemerkt haben, ebenfalls von entscheidender Bedeutung sein, wenn das Tool von der Forschung in die Praxis übergeht. „Heutzutage genießen Umstehende einen starken rechtlichen Schutz vor zivil- und strafrechtlicher Verfolgung, wenn sie zur Durchführung einer HLW eingreifen“, fügte Mike Hogarth, MD, Professor für Medizin und Direktor für Informatik am Altman Clinical and Translational Research Institute an der UC San Diego und Mitautor der Studie hinzu. „Wie sich dieser Schutz auf die KI-gestützte HLW erstreckt, ist eine Herausforderung, die angegangen werden muss.“

„Letztendlich begründet unsere Arbeit den KI-Hype in der Realität, die über Leben und Tod entscheidet“, schlussfolgerte Ayers. „Das wahre Versprechen besteht darin, die tödliche Lücke zwischen dem Zusammenbruch einer Person und dem Beginn lebensrettender Pflege zu schließen.“


Quellen:

Journal reference:

Desai, N., et al. (2026) An Artificial Intelligence–Enabled Cardiopulmonary Resuscitation Instructor. JAMA Internal Medicine. DOI: 10.1001/jamainternmed.2026.1552. https://jamanetwork.com/journals/jamainternalmedicine/article-abstract/2848650