Applied Deep Learning for Bird Bioacoustics

Promovendus/a
Ghaffari Jadidi, Houtan
Faculteit
Faculteit Ingenieurswetenschappen en Architectuur
Vakgroep
Vakgroep Informatietechnologie
Curriculum
Master of Science in Computer Engineering, Iran University of Science and Technology (Iran), 2021
Academische graad
Doctor in de ingenieurswetenschappen: computerwetenschappen
Taal proefschrift
Engels
Vertaling titel
Toegepast diep leren voor de bioakoestiek van vogels
Promotor(en)
prof. Paul Devos, vakgroep Informatietechnologie
Examencommissie
voorzitter prof. Joris Degroote (ondervoorzitter Facultaire Doctoraatscommissie) - prof. Dick Botteldooren, vakgroep Informatietechnologie - prof. Thierry Dutoit, Université de Mons - prof. Sam Leroux, vakgroep Informatietechnologie - prof. Dan Stowell, Tilburg University (Nederland) - promotor prof. Paul Devos, vakgroep Informatietechnologie

Korte beschrijving

Deze thesis belicht open problemen binnen de bioakoestiek van vogels en biedt praktische oplossingen aangaande annotatiekost, efficiëntie, kenmerkselectie, zwakke supervisie en robuustheid tegen ruis. Twee hoofdtaken staan centraal: vogelzanganalyse en vogelsoortherkenning. Vogelzanganalyse bestudeert de vogelzangstructuur door vocale eenheden (noten) te segmenteren en te categoriseren. Bestaande tools maken gebruik van handmatig bepaalde drempelwaarden voor individuele vogels. Deze thesis presenteert een semi-gesuperviseerde methode voor consistente segmentatie op nootniveau, die met slechts enkele seconden annotatie resultaten behaalt vergelijkbaar met expertannotatie. Bovendien kunnen met één enkel model meerdere vogels verwerkt worden. De methode wordt vervolgens uitgebreid tot een data-efficiënt raamwerk voor grootschalige en reproduceerbare studies. De kern hiervan bestaat uit twee zelfgesuperviseerde algoritmen, aangepast voor nieuwe vormen van vogelzanganalyse. Daarnaast behandelt deze thesis het detecteren van vogelsoorten ten behoeve van natuurbehoud en milieustudies. Een onderzoek naar het ontwerp van leerbare audio-frontends toont aan dat normalisatie- en compressie-operaties de belangrijkste factoren zijn voor goede resultaten. Verder laat een gedetailleerde analyse van leerbare filters zien dat vogelakoestiek neigt naar een log-lineair gespreide frequentierepresentatie, vergelijkbaar met menselijke psycho-akoestiek. Tot slot presenteert deze thesis een nieuw zwak-gesuperviseerd trainingsraamwerk waarbij piekdetectie en aandacht-aggregatie gebruikt worden om verspreide context efficiënt vast te leggen voor de classificatie van vogelsoorten.

Praktisch

Datum
Dinsdag 30 juni 2026, 16:00
Locatie
Auditorium P Jozef Plateau, Plateaustraat 22, 9000 Gent
Livestream
Volg online

Meer info

Contact
doctoraat.ea@ugent.be