Dialectstemmen uit het verleden klaar voor de toekomst
(31-01-2025) Meer dan 430 uur dialectopnames uit de jaren '60 zijn nu met ondertitels beschikbaar op www.dialectloket.be. Die ondertitels zijn cruciaal voor taalonderzoek en de ontwikkeling van inclusievere spraakherkenners.
Dankzij een grootschalige transcriptie-actie krijg je op www.dialectloket.be nu ook ondertitels te zien bij de gesproken levensverhalen van meer dan 330 dialectsprekers uit heel Vlaanderen. Zo blijven de verhalen en dialecten voor iedereen toegankelijk, ook voor wie geen dialect kent. Voor de verdere ontsluiting van de collectie zoekt de vakgroep Taalkunde nog extra vrijwilligers.
Dialectschatten
De verzameling dialectopnames die in de jaren 60 en 70 van de vorige eeuw aan de faculteit werden gemaakt, vormden lang een verborgen schat. De collectie biedt een unieke inkijk in de 20e eeuwse dialecten en het Vlaamse volksverleden, maar stond lang ongeraadpleegd stof te vergaren in een kast in de Blandijn. In 2009 werd de collectie gedigitaliseerd en op dialectloket.be geplaatst. Verschillende Vlamingen lieten toen weten voor het eerst de stem van hun (over)grootouder gehoord te hebben en het fantastisch te vinden om de verhalen die al lang in de familie circuleerden nu ook vanuit eerste hand te horen. Om het Vlaamse dialecterfgoed en de levensverhalen toegankelijk te houden voor toekomstige generaties werd een team van jobstudenten en vrijwilligers aan het ondertitelen gezet om de banden te transcriberen en themacodes aan te brengen. Via een nieuwe zoekmodule kan je gericht passages uit een specifieke gemeente of over een bepaald thema opsporen.
Een speeltuin voor taalkundigen
De transcripties zijn er niet louter voor dialectliefhebbers, maar ook voor taalkundig onderzoek. Dialecten zijn voor taalkundigen wat dieren in het wild zijn voor biologen: door de vrijheid die ze kennen – in tegenstelling tot bijvoorbeeld standaardtalen die strakker beregeld zijn – bieden dialecten een uniek inzicht in hoe taal en taalverandering werken. Opnames van spontaan gesproken dialect zijn dus heel waardevol onderzoeksmateriaal. Dankzij de transcripties (en ook nog andere informatie die aan de transcripties werd toegevoegd) kunnen taalwetenschappers de banden nu eindelijk makkelijker doorzoeken.
Rute 98
Ook voor taaltechnologen brengt het transcriptieproject goed nieuws. Taalvariatie vormt vandaag immers nog een grote uitdaging voor spraakherkenners. De Alexa’s, Google Assistants, Siri’s en Bixby’s van deze wereld slagen er bijvoorbeeld vaak niet in om de instructies van niet-standaardtaalsprekers te decoderen, ook wanneer die laatste hun uiterste best doen om zich verstaanbaar te maken. En onderzoekers die via taalanalyse bijvoorbeeld vroege tekenen van Alzheimer of dementie automatisch willen detecteren, ervaren dialect als uitdaging in de ontwikkeling van hun software. Om die problemen op te lossen, hebben taaltechnologen trainingsdata nodig: geluidsopnames met de bijhorende tekstweergave, waarop spraakherkenners zich kunnen baseren om dialectpatronen te leren decoderen. Zulke trainingsdata zijn dankzij de transcriptie van de 'Stemmen uit het Verleden' nu beschikbaar. Wie weet kunnen we onze pc’s en smartphones in de nabije toekomst dus met commando’s als stik mor an (‘start’) of kirrekiwere (‘backspace’) instrueren, net als Wim Opbrouck in de legendarische sketch Rute 98.
Help je mee?
Dankzij de steun van het Vlaamse Fonds voor Wetenschappelijk Onderzoek loopt nu een vervolgproject om nog meer opnames (ook uit Nederland) te transcriberen en te annoteren. Daarvoor is de hulp van vrijwilligers broodnodig, onder andere om:
- Transcripties van studenten te controleren: de oude opnames zijn voor jongere studenten vaak moeilijk te begrijpen, niet alleen omdat het gesproken dialect vaak ver afstaat van hun eigen taalgebruik, maar ook omdat ze soms weinig voeling hebben met de gespreksonderwerpen (zoals traditionele landbouwtechnieken of het arbeidersleven). Om zo nauwkeurig mogelijke transcripties te garanderen, roepen we de hulp in van dialectsprekende vrijwilligers die de teksten van studenten willen corrigeren en waar nodig aanvullen. Voor deze taak zijn we op dit moment vooral (en dringend) op zoek naar vrijwilligers uit Limburg en Nederland.
- Themacodes aan te brengen in de transcripties: in de transcripties brengen we gestandaardiseerde trefwoorden aan (zoals ‘collaboratie’ of ‘visteelt’) om de collectie thematisch doorzoekbaar te maken.
Meewerken aan dit project? Neem dan contact op met Lien Hellebaut via gcnd@ugent.be.
Meer info?
Raadpleeg het persdossier
Contact
- Anne Breitbarth – anne.breitbarth@ugent.be
- Anne-Sophie Ghyselen – annesophie.ghyselen@ugent.be - 0494 205 030
- Melissa Farasyn – melissa.farasyn@ugent.be - 0494 181 342
- Lien Hellebaut – lien.hellebaut@ugent.be