PromptSE KI sagt Nebenwirkungen von Medikamenten vorher, indem sie biologische Hinweise analysiert.

Durch das Lehren großer Sprachmodelle, über pharmakologische Wege nachzudenken, könnte PromptSE die Genauigkeit, Interpretierbarkeit und biologische Plausibilität von Arzneimittel-Sicherheitsprüfungen verbessern.

In einer aktuellen Veröffentlichung in der Zeitschrift Scientific Reports präsentieren Forscher PromptSE als mögliche Lösung für die derzeitigen Einschränkungen bei der Vorhersage unerwünschter Arzneimittelnebenwirkungen. PromptSE ist ein neuartiges hybrides rechnergestütztes Rahmenwerk, das die semantischen Denkfähigkeiten von LLMs mit der prädiktiven Präzision von Deep-Learning-Algorithmen kombiniert.

Die Ergebnisse der Studie zeigten, dass das Führen der KI zur Bewertung der biologischen Mechanismen, die möglicherweise Symptomen zugrunde liegen, die Leistung im Vergleich zu mehreren traditionellen Modellen zur Vorhersage von Nebenwirkungen verbesserte. Diese Ergebnisse deuten darauf hin, dass PromptSE und ähnliche KI-Rahmenwerke den Weg für eine sicherere Arzneimittelentwicklung ebnen und potenziell zuverlässigere rechnergestützte Werkzeuge für die pharmakologische Prüfung ermöglichen könnten.

Hier könnte Ihr Advertorial stehen

Ein Advertorial bietet Unternehmen die Möglichkeit, ihre Botschaft direkt im redaktionellen Umfeld zu platzieren

Hintergrund

Trotz jahrzehntelanger Forschung auf dem Gebiet ist es nach wie vor eine große Herausforderung im modernen Gesundheitswesen, unerwünschte Arzneimittelreaktionen vorherzusagen. Unbeabsichtigte Reaktionen auf therapeutische Medikamente sind derzeit die vierthäufigste Todesursache, nur übertroffen von Herz-Kreislauf-Erkrankungen, Krebs und Infektionskrankheiten.

Obwohl es technisch möglich ist, Risiken in Laboreinstellungen zu identifizieren, ist bekannt, dass dies prohibitv teuer und zeitaufwändig ist. Folglich verlassen sich Forscher größtenteils auf rechnergestützte Modelle, um vorherzusagen, ob ein bestimmtes Medikament eine spezifische unerwünschte Reaktion auslösen könnte.

Leider zeigen Bewertungen zu diesem Thema, dass diese Modelle erheblich durch die aktuelle Datenqualität eingeschränkt sind. Während gut strukturierte Daten über chemische Verbindungen leicht verfügbar sind, sind Informationen über Nebenwirkungen oft in unstrukturierten klinischen Berichten und spontanen Symptommeldungen verborgen, was die Genauigkeit traditioneller rechnergestützter Modelle erheblich beeinträchtigt.

Darüber hinaus wurde künstliche Intelligenz als mögliche Lösung für dieses Problem vorgeschlagen, jedoch hat die Forschung gezeigt, dass ältere Algorithmen des maschinellen Lernens dazu neigen, sich auf die häufigsten Symptome zu konzentrieren und oft die zugrunde liegenden biologischen Mechanismen zu übersehen, die zur unerwünschten Reaktion beitragen könnten.

Über die Forschung

Die Forschung zielte darauf ab, die Einschränkungen von LLMs als grundlegende Textkonverter zu überwinden, indem PromptSE entwickelt wurde, ein dynamisches Denk-Rahmenwerk der künstlichen Intelligenz, das mithilfe einer mehrstufigen Eingabetechnik aufgebaut wurde.

Die Eingabe wurde dazu entworfen, das Modell zu führen, um Nebenwirkungen hinsichtlich ihres: 1. Verabreichungsweges, 2. Metabolismusweg, 3. strukturellen Eigenschaften und 4. Zielselektivität zu bewerten, wodurch PromptSE erste relevante Erklärungen für ein unerwünschtes Ereignis ableiten konnte, anstatt sich nur auf oberflächliche Symptombeschreibungen oder häufige Muster aus dem Trainingsdatensatz zu verlassen.

PromptSE wurde unter Verwendung eines kombinierten „datensatz von etikettierten Arzneimittelnebenwirkungen“ trainiert, das aus den Datenbanken DrugBank und SIDER abgeleitet wurde und insgesamt 1.020 Medikamente und 5.599 Nebenwirkungen umfasste.

Sobald das LLM mechanistische Profile basierend auf diesen Daten generierte, wurde das Biomedical Bidirectional Encoder Representations from Transformers (BioBERT), ein separates KI-Modell, das auf die Verarbeitung medizinischer, klinischer und biologischer Texte spezialisiert ist, verwendet, um die generierten Profile (Text) in mathematische Vektoren umzuwandeln, die dann in ein Deep-Learning-Modul eingespeist wurden, um die Assoziationen zwischen Arzneimitteln und Nebenwirkungen vorherzusagen.

Für seltene Medikamente und Nebenwirkungen mit begrenzten Daten wurde das Hierarchical Graph Convolutional Network (HiGCN) verwendet, um es seltenen Entitäten zu ermöglichen, kontextuelle Hinweise von häufigeren, gut dokumentierten Medikamenten oder Nebenwirkungen zu entleihen, wodurch die Modellgenauigkeit verbessert und das Risiko verringert wurde, besser unterstützte Darstellungen zu degradieren.

Ergebnisse

Die Forschungsergebnisse zeigten, dass der Datensatz stark auf unbekannte unerwünschte Assoziationen verzerrt war, wobei nur 2,34 % der möglichen Arzneimittel-Nebenwirkungs-Paare als bekannte positive Assoziationen gekennzeichnet waren. Folglich wurde die Area Under the Precision-Recall Curve (AUPR) verwendet, um die Genauigkeit von PromptSE zusammen mit AUC, Macro-F1 und Matthews Correlation Coefficient zu messen.

AUPR-Analysen revealed that PromptSE achieved an AUPR of 0.6551 and outperformed the strongest non-drug-informed baseline by 9.26%, despite being provided only with side-effect data and association-derived drug alignment features rather than direct drug properties. Furthermore, when the model was augmented with multi-modal drug information, performance was observed to improve by an additional 1.81% over the strongest drug-informed baseline, with PromptSE+ achieving an AUPR of 0.6878 and surpassing traditional “state-of-the-art baseline” approaches for adverse effects prediction. A paired bootstrap test showed a mean AUPR difference of 0.012, with a 95% confidence interval of 0.008-0.013.

Die Qualität der von der KI generierten Profile wurde ebenfalls mithilfe eines Kolmogorov-Smirnov (KS)-Tests getestet, der misst, wie gut ein Modell verwandte von nicht verwandten Nebenwirkungs-Paaren trennt. Die LLM-abgeleiteten Darstellungen erreichten einen KS-Wert von 0.3939, was die grundlegenden textlichen Beschreibungen (KS = 0.0195) bei Weitem übertrifft. Dies unterstützte die Erkenntnis, dass PromptSE Nebenwirkungen effektiver basierend auf pharmakologisch relevanten Beziehungen gruppierte als anhand oberflächlicher sprachlicher Ähnlichkeiten.

Schlussfolgerungen

Die vorliegende Studie adressiert wichtige Einschränkungen in der Daten- und Vorhersagekraft konventioneller rechnergestützter Modelle zur Vorhersage unerwünschter Ereignisse. Sie zeigt erfolgreich, dass geführtes Denken, das das Modell anregt, chemische und biologische Einflussfaktoren von Nebenwirkungen zu berücksichtigen, aktuellen KI-Modellen ermöglicht, informativere Darstellungen und verbesserte Vorhersagen über die potenziellen Nebenwirkungen eines bestimmten Medikaments zu generieren.

Darüber hinaus könnte dieses Rahmenwerk, obwohl es speziell für Nebenwirkungen getestet wurde, prinzipiell auch zur Vorhersage von Wechselwirkungen zwischen Arzneimitteln oder zur Entdeckung neuer therapeutischer Anwendungen vorhandener Medikamente angewendet werden. Weitere Validierungen mithilfe externer Datensätze, kuratierter pharmakologischer Wissensdatenbanken und veröffentlichter pharmakologischer Beweise sind jedoch notwendig, um seine biologische Fundierung und Allgemeingültigkeit zu stärken. Zusammenfassend deutet die vorliegende Studie darauf hin, dass die Integration strukturierten KI-Denkens mit Deep Learning das Potenzial hat, die Arzneimittelentdeckung erheblich zu beschleunigen und rechnergestützte Ansätze zur Patientensicherheit zu verbessern.

Quellen:

Journal reference:

Xia, Y., Wang, H., Li, T., & Niu, Y. (2026). PromptSE: drug side effect prediction with LLM-derived pharmacological representations. Scientific Reports. DOI: 10.1038/s41598-026-55667-7. https://www.nature.com/articles/s41598-026-55667-7

Hintergrund

Über die Forschung

Ergebnisse

Schlussfolgerungen

Ähnliche Artikel