Ein Echtzeitsystem entschlüsselte, wer zuhörte, verstärkte die Stimme des Sprechers und lieferte so einen Machbarkeitsnachweis für intelligentere Hörtechnologien, die auf Aufmerksamkeit und nicht nur auf Geräusche reagieren.
In einer kürzlich in der Zeitschrift veröffentlichten Studie Naturneurowissenschaftenhaben Forscher ein gehirngesteuertes Hörsystem entwickelt, das Menschen dabei helfen kann, sich in lauten Umgebungen auf eine einzelne Stimme zu konzentrieren. Sie zeichneten in Echtzeit die Gehirnaktivität von Patienten auf, die sich einer Neurochirurgie unterzogen, und testeten die Fähigkeit des Systems, den anwesenden Sprecher zu identifizieren und seine Stimme zu verstärken.
Das System zeigte konsistente Ergebnisse bei der Verbesserung des Sprachverständnisses, selbst bei ähnlichen Stimmen und Hintergrundgeräuschen, bei Teilnehmern mit normalem Hörvermögen, während eine separate Gruppe von Zuhörern mit Hörverlust die systemverstärkte Audioqualität bevorzugte und besser verstand.
Die Ergebnisse eröffnen Möglichkeiten für die Entwicklung gehirngesteuerter Hörgeräte, um die Spracherkennung und das Hören in belebten Umgebungen wie Restaurants oder Partys zu verbessern.
Hintergrund des gehirngesteuerten Hörgeräts
Menschen, insbesondere Menschen mit Hörproblemen, haben oft Schwierigkeiten, Gesprächen an überfüllten Orten zu folgen, selbst mit Hörgeräten. Dies liegt daran, dass normale Hörgeräte normalerweise alle Geräusche verstärken, einschließlich Hintergrundgeräusche.
Um dieses Problem anzugehen, haben Wissenschaftler die AAD-Technologie (Auditory Attention Decoding) entwickelt. Dieser Ansatz erkennt die Stimme, der eine Person zuhört, und macht diese bestimmte Stimme lauter, basierend auf Gehirnaktivitätssignalen. Frühere Studien haben diese Technologie unter kontrollierten Laborbedingungen getestet; Es bleibt jedoch unklar, ob es wahrnehmungsbezogene Vorteile in Echtzeit bieten kann.
Studiendesign für intrakranielles EEG-Hören
In der vorliegenden Studie testeten Forscher das gehirngesteuerte Hörsystem bei vier Erwachsenen, die sich im Rahmen einer Epilepsiebehandlung einer Gehirnüberwachung unterzogen. Sie zeichneten mit klinisch implantierten Elektroden für die intrakranielle Elektroenzephalographie (iEEG) auf und deckten dabei die sprach- und klangverarbeitenden Regionen der Gehirne der Teilnehmer während der Neurochirurgie ab. Mit diesen Elektroden konnten Forscher hochauflösende Gehirnaktivitäten aufzeichnen, während die Teilnehmer Gesprächen zuhörten. Diese Teilnehmer hatten nach eigenen Angaben ein normales Gehör.
Das Team trainierte das System zunächst, bevor es es in Echtzeit testete. In dieser Offline-Trainingsphase hörten die Teilnehmer Gespräche gleichzeitig aus zwei räumlich getrennten Sprachströmen. Diese simulierten mehrere Personen, die in einem geschlossenen Raum redeten. Die Gespräche drehten sich um Alltagsthemen. Das Team erhöhte den Schwierigkeitsgrad der Aufgabe, indem es ähnliche Stimmen verwendete, beispielsweise die von Sprechern des gleichen Geschlechts. Sie enthielten auch Hintergrundgeräusche wie Straßenlärm und Stimmengewirr, um reale Szenarien noch besser nachzuahmen.
Das Team wies die Teilnehmer an, nur einem Gespräch zu folgen und das andere zu ignorieren. Die Teilnehmer überprüften dies, indem sie einen Knopf drückten, als sie wiederholte Wörter in einem Gespräch hörten. Während sie zuhörten, zeichnete das Team die Gehirnaktivität auf. Anschließend trainierten sie AAD-Modelle, um Muster in Gehirnsignalen zu erkennen und den Rhythmus oder die „Sprachhülle“ der anwesenden Stimme zu rekonstruieren.
In der kontrollierten Online-Testphase unter Verwendung realistischer Multi-Talker- und Geräuschbedingungen analysierte die Technologie kontinuierlich die Gehirnsignale der Teilnehmer, um herauszufinden, auf welchen Sprecher sie aufmerksam achteten. Nach der Identifizierung des Sprechers verstärkte die Technologie diese Stimme automatisch und sorgte gleichzeitig dafür, dass der Gesamtschallpegel stabil blieb.
Die Forscher verglichen die Hörleistung vor und nach den gehirngesteuerten Verbesserungen. Anschließend überprüften sie, ob sich das System schnell anpassen konnte, wenn die Teilnehmer ihren Fokus auf einen anderen Redner verlagerten. Anschließend testeten sie, ob das System natürliche Veränderungen in der Sprecheridentität verfolgen kann. Darüber hinaus maßen sie die Pupillenerweiterung, um die geistige Anstrengung zu beurteilen.
Abschließend spielten sie die Audioaufnahmen 40 Personen mit Hörbehinderung vor und analysierten ihre Reaktionen. Generalisierte lineare gemischte Modelle (GLMMs) ermöglichten statistische Analysen.
Ergebnisse der selektiven Hörsystemleistung
Das System zeigte in verschiedenen Tests und Hörsituationen eine konstante Leistung. Über dem oberen Schläfengyrus angebrachte Elektroden lieferten die nützlichsten Gehirnsignale. Während des Offline-Tests erkannte das System die Stimme, auf die der Zuhörer achtete, in 72,0 % bis 90,3 % der Dekodierungsfenster aller Teilnehmer korrekt. Die Technologie funktionierte auch in schwierigen Situationen, einschließlich ähnlicher Stimmen und Hintergrundgeräuschen, zuverlässig.
In Echtzeit verstärkte das System automatisch die Stimme, auf die sich der Zuhörer konzentrierte. Die Forscher fanden eine Verbesserung des Ziel-zu-Maskierer-Verhältnisses um 12 dB, was darauf hindeutet, dass die Stimme des anwesenden Sprechers viel klarer wurde als unbeaufsichtigte Stimmen und Hintergrundgeräusche.
Die Teilnehmer zogen es deutlich vor, bei eingeschaltetem System zuzuhören, und berichteten von einem verbesserten Sprachverständnis. Die Forscher beobachteten eine geringere Pupillenerweiterung, wenn das System aktiv war, was auf eine geringere mentale Belastung der Teilnehmer beim Verfolgen von Gesprächen schließen lässt. Eine genauere gehirnbasierte Aufmerksamkeitsdekodierung war mit einer stärkeren Präferenz der Teilnehmer verbunden.
Als die Teilnehmer angewiesen wurden, sich auf eine andere Stimme zu konzentrieren, passte sich das System mit einer durchschnittlichen Wechselzeit von 5,1 Sekunden schnell an solche Aufmerksamkeitsveränderungen an. Die Technologie könnte natürlich auch Veränderungen in der Aufmerksamkeit eines Zuhörers folgen.
Teilnehmer mit laut eigenen Angaben normalem Hörvermögen zeigten Verbesserungen bei der Verwendung des Closed-Loop-Systems, und einzelne Zuhörer mit Hörverlust zeigten Verbesserungen beim Sprachverständnis und bevorzugten deutlich die verbesserte Audioqualität.
Auswirkungen der gehirngesteuerten Hörtechnologie
Die Ergebnisse zeigen, dass gehirngesteuerte Hörsysteme Menschen helfen könnten, Sprache in lauten Umgebungen besser zu verstehen, indem sie die gezielt angesprochene Stimme erkennen und verstärken. Die Ergebnisse deuten darauf hin, dass solche Systeme aufgrund ihrer Fähigkeit, sich an natürliche Aufmerksamkeitsveränderungen anzupassen, besonders für alltägliche Situationen relevant sein könnten, in denen sich die Aufmerksamkeit ständig ändert. Diese Technologie erfordert jedoch invasive Verfahren zur Implantation von Elektroden und ist daher möglicherweise nicht für den breiten Routineeinsatz geeignet.
Dennoch können Wissenschaftler dieses System als Goldstandard-Benchmark und Proof of Concept nutzen, um intelligentere, personalisiertere Versionen unter Verwendung weniger invasiver Gehirn-Computer-Schnittstellentechnologien zu entwickeln.
Laden Sie Ihr PDF-Exemplar herunter, indem Sie hier klicken.
Quellen:
- Choudhari, V., Nentwich, M., Johnson, S. et al. (2026). Real-time brain-controlled selective hearing enhances speech perception in multi-talker environments. Nature Neuroscience. DOI:10.1038/s41593-026-02281-5, https://www.nature.com/articles/s41593-026-02281-5