Supersnel computermodel menselijk gehoor: grote stap in ontwikkeling hoorapparaten en spraakherkenning

(08-02-2021) UGent-onderzoekers ontwikkelden een nieuwe manier om de werking van ons gehoor 'na te bouwen'. Met deze technologie verbeteren ze de ontwikkeling van hoorapparaten en spraakherkenning.

Ons oor werkt zo goed dat we er (te) weinig bij stilstaan. Wanneer je minder goed hoort, of als je robots wilt leren 'horen', besef je hoe vernuftig ons gehoor in elkaar zit. UGent-onderzoekers ontwikkelden een nieuwe manier om de werking van ons gehoor 'na te bouwen' en in te zetten voor 'realtime' audiotoepassingen. Met deze technologie kunnen ze de werking van hoorapparaten verbeteren en werken ze aan een toekomst waarin spraakherkenning feilloos wordt en robots even goed zullen kunnen horen als mensen. 

 

Tweeduizend keer sneller

Het speciale aan ons menselijk gehoor is dat we geluid 'niet-lineair' verwerken. Dat wil zeggen dat je bepaalde geluiden (bijvoorbeeld een persoon die aan het woord is) zeer goed uit achtergrondlawaai kunt filteren, ook al zit je in een rumoerig restaurant. Gehoorschade tast dit vermogen aan, en ook audiotoepassingen die aan automatische spraakverwerking doen presteren niet zo goed als mensen in deze situaties. Dit komt omdat audiotoepassingen geluid vaak lineair verwerken, zodat er minder rekenkracht nodig is en de applicaties in ‘real time’ kunnen werken.

Andere, meer realistische, gehoormodellen werken niet-lineair maar hebben daardoor zó veel rekenkracht nodig dat ze de geluidsignalen niet in 'real time' verwerken. Deze vertraging (seconden of zelfs minuten) zorgt ervoor dat deze modellen niet ingezet kunnen worden in audiotoepassingen, hoorapparaten of robotica.

UGent-onderzoekers pakten dit probleem aan, en ontwikkelden een nieuw soort computermodel dat geluidssignalen snel én niet-lineair kan verwerken. Ze combineerden hiervoor neurowetenschappelijke kennis met geavanceerde technieken voor machinaal leren. Zo ontwikkelden ze een model van ons gehoor dat tweeduizend keer sneller werkt dan bestaande niet-lineaire gehoormodellen, en dat op die manier ingezet kan worden in realtime audiotoepassingen. Tergelijkertijd behoudt het model de superieure eigenschappen van niet-lineaire gehoormodellen en kan het ook verschillende vormen van gehoorschade simuleren.  

CoNNear

Betere hoorapparaten en spraakherkenning

Dankzij dit nieuwe computermodel kan al het basisonderzoek naar de complexiteit van ons binnenoor (en naar gehoorschade) gebruikt worden om bestaande audiotoepassingen te verbeteren.

  • Ten eerste zijn er de commerciële toepassingen, zoals betere algoritmen voor hoorapparaten, en een robuustere automatische spraakherkenning die ook werkt in rumoerige omgevingen.
  • Daarnaast draagt het model ook bij aan verder onderzoek naar het auditieve centrale zenuwstelsel. De verwerking van complexe geluiden zoals spraak en muziek, is immers gebaseerd op de niet-lineaire signalen die via het oor onze hersenen bereiken.

Meer informatie

  • Lees hier het volledige artikel in Nature Machine Intelligence
  • De code van het nieuwe model werd hier gepubliceerd , zodat andere onderzoekers er ook verder mee kunnen werken (Open-Science)

Contact