Eine große klinische Studie in der Praxis hat ergeben, dass ein generatives, KI-gestütztes Unterstützungstool zur Unterstützung von Ärzten an vorderster Front sicher ist und die Qualität der klinischen Entscheidungsfindung verbessert, die kurzfristigen Patientenergebnisse jedoch nicht wesentlich verändert.

Die heute veröffentlichte Studie in Naturmedizin ist eine der ersten randomisierten kontrollierten Studien weltweit, die testet, ob generative KI die Ergebnisse auf Patientenebene und nicht nur die Leistung des Arztes oder simulierte Fälle verbessern kann.

Die Studie umfasste mehr als 9.600 Patienten in 16 Kliniken für Grundversorgung in Kenia und wurde von Experten der Universität Birmingham mit Unterstützung des Biomedizinischen Forschungszentrums des National Institute for Health and Care Research (NIHR) in Birmingham durchgeführt.

Ärzten wurde nach dem Zufallsprinzip zugewiesen, ein elektronisches Patientenaktensystem mit oder ohne integriertem KI-Beratungstool zu verwenden, das Diagnose- und Behandlungsvorschläge in Echtzeit lieferte. Das KI-System, bekannt als „AI Consult“, war ein großes sprachmodellbasiertes Tool zur klinischen Entscheidungsunterstützung, das direkt in das bestehende elektronische Krankenaktensystem eingebettet war.

Werbung
Hier könnte Ihr Advertorial stehen
Ein Advertorial bietet Unternehmen die Möglichkeit, ihre Botschaft direkt im redaktionellen Umfeld zu platzieren

Während der Beratungen arbeitete das Tool im Hintergrund durch:

  • Analyse der vom Arzt in die Krankenakte eingegebenen Informationen
  • Generierung kontextspezifischer Diagnose- und Behandlungsvorschläge, abgestimmt auf die nationalen klinischen Richtlinien Kenias
  • Mögliche Bedenken mithilfe eines einfachen farbcodierten Warnsystems (grün, gelb oder rot) kennzeichnen

Die Ärzte behielten ihre volle Autonomie; Sie waren nicht verpflichtet, den Ratschlägen der KI zu folgen, und trugen die Verantwortung für alle Diagnose-, Verschreibungs- und Überweisungsentscheidungen. Die KI-Schnittstelle war für Patienten nicht sichtbar, was dazu beitrug, die normale Interaktion zwischen Patient und Arzt aufrechtzuerhalten.

Dies ist eine der ersten Studien, die die schwierigste Frage zu KI im Gesundheitswesen rigoros stellt: ob sie tatsächlich die Ergebnisse für Patienten verbessert.

Was wir fanden, ist beruhigend, aber auch ernüchternd. Die Technologie scheint sicher zu sein und verbessert eindeutig Aspekte der klinischen Entscheidungsfindung, aber die Umsetzung dieser Vorteile in messbaren Patientennutzen ist viel schwieriger, insbesondere in der täglichen Grundversorgung.“

Professor Bilal Mateen, Leitender Autor, Honorarprofessor für maschinelles Lernen im Gesundheitswesen an der University of Birmingham und Chief AI Officer bei PATH

Schwerwiegende Folgen wie Krankenhausaufenthalt oder Tod sind in der Primärversorgung selten, was bedeutet, dass extrem große Studien – möglicherweise mit mehr als 100.000 Patienten – erforderlich wären, um bescheidene Auswirkungen festzustellen.

Professor Alastair Denniston, Co-Autor, Professor für Regulierungswissenschaft und Innovation an der Universität Birmingham und Leiter der Gesundheitsdatenforschung am NIHR Biomedical Research Centre: Birmingham, sagte: „Ein großer Teil der Primärversorgung besteht in der Behandlung häufiger Erkrankungen, einschließlich selbstlimitierender Erkrankungen, bei denen viele Patienten nur geringe medizinische Interventionen benötigen. In diesem Zusammenhang führen selbst sinnvolle Verbesserungen im klinischen Denken möglicherweise nur zu geringfügigen Änderungen bei den Patientenergebnissen, die sehr schwer zu messen sind.“

„Diese Studie zeigt, dass KI sicher in reale klinische Arbeitsabläufe integriert werden kann, ohne das Vertrauen der Patienten oder die Autonomie des Arztes zu untergraben – was eine entscheidende Grundlage für alle zukünftigen Auswirkungen ist.“

Erkenntnisse: Sicherheit, Qualität und Kosten

Die Forscher fanden keinen statistisch signifikanten Unterschied im Behandlungsversagen innerhalb von 14 Tagen zwischen Patienten, die mit KI-gestützter Pflege behandelt wurden, und denen, die Standardversorgung erhielten (2,2 % vs. 2,0 %). Die Studie ergab keine Hinweise auf Schäden, wobei die Krankenhauseinweisungs- und Sterberaten in beiden Gruppen ähnlich waren.

Während das KI-Tool keine messbaren Verbesserungen bei den kurzfristigen Patientenergebnissen hervorbrachte, verbesserte es die Qualität der klinischen Dokumentation und Behandlungsplanung erheblich, wie von einem unabhängigen Gremium erfahrener Kliniker beurteilt wurde, die nicht wissen konnten, ob KI eingesetzt wurde.

Die Patientenzufriedenheit war in beiden Gruppen gleich, was darauf hindeutet, dass die KI-Unterstützung das Pflegeerlebnis der Patienten nicht veränderte.

Die Studie ergab außerdem, dass die antibiotikabedingten Kosten in der KI-unterstützten Gruppe aufgrund kostenbewussterer Verschreibungsentscheidungen niedriger waren, obwohl die Verschreibungsraten für Antibiotika insgesamt ähnlich waren.

Obwohl die Studie in Kenia durchgeführt wurde, betonen die Forscher, dass die Ergebnisse globale Relevanz haben, auch für Gesundheitssysteme mit hohem Einkommen.

Professor Richard Riley, Professor für Biostatistik an der University of Birmingham und leitender Autor, sagte: „Robuste Studien wie diese sind so wichtig, um die tatsächlichen Auswirkungen des Einsatzes von KI in der Praxis festzustellen. Sie tragen dazu bei, realistische Erwartungen darüber zu wecken, was KI tatsächlich innerhalb bestehender Pflegepfade beitragen kann, und helfen dabei, zu bestimmen, worauf künftige Investitionen und Forschungsbemühungen konzentriert werden sollten. Die Übertragbarkeit unserer Ergebnisse auf einkommensstärkere Umgebungen, in denen die Grundstandards der Pflege bereits hoch sind, muss evaluiert werden.“

Die Studie wurde von der Gates Foundation finanziert, von PATH gesponsert und mit Mitarbeitern der London School of Hygiene and Tropical Medicine und des KEMRI-Wellcome Trust Research Programme, Kenia, durchgeführt.


Quellen:

Journal reference:

Agweyu, A., et al. (2026). Generative AI-enabled clinical decision support system in primary care: a pragmatic, cluster-randomized trial. Nature Medicine. DOI: 10.1038/s41591-026-04503-6. https://www.nature.com/articles/s41591-026-04503-6