Applied Deep Learning for Bird Bioacoustics
- Promovendus/a
- Ghaffari Jadidi, Houtan
- Faculteit
- Faculteit Ingenieurswetenschappen en Architectuur
- Vakgroep
- Vakgroep Informatietechnologie
- Curriculum
- Master of Science in Computer Engineering, Iran University of Science and Technology (Iran), 2021
- Academische graad
- Doctor in de ingenieurswetenschappen: computerwetenschappen
- Taal proefschrift
- Engels
- Vertaling titel
- Toegepast diep leren voor de bioakoestiek van vogels
- Promotor(en)
- prof. Paul Devos, vakgroep Informatietechnologie
- Examencommissie
- voorzitter prof. Joris Degroote (ondervoorzitter Facultaire Doctoraatscommissie) - prof. Dick Botteldooren, vakgroep Informatietechnologie - prof. Thierry Dutoit, Université de Mons - prof. Sam Leroux, vakgroep Informatietechnologie - prof. Dan Stowell, Tilburg University (Nederland) - promotor prof. Paul Devos, vakgroep Informatietechnologie
Korte beschrijving
Deze thesis belicht open problemen binnen de bioakoestiek van vogels en biedt praktische oplossingen aangaande annotatiekost, efficiëntie, kenmerkselectie, zwakke supervisie en robuustheid tegen ruis. Twee hoofdtaken staan centraal: vogelzanganalyse en vogelsoortherkenning. Vogelzanganalyse bestudeert de vogelzangstructuur door vocale eenheden (noten) te segmenteren en te categoriseren. Bestaande tools maken gebruik van handmatig bepaalde drempelwaarden voor individuele vogels. Deze thesis presenteert een semi-gesuperviseerde methode voor consistente segmentatie op nootniveau, die met slechts enkele seconden annotatie resultaten behaalt vergelijkbaar met expertannotatie. Bovendien kunnen met één enkel model meerdere vogels verwerkt worden. De methode wordt vervolgens uitgebreid tot een data-efficiënt raamwerk voor grootschalige en reproduceerbare studies. De kern hiervan bestaat uit twee zelfgesuperviseerde algoritmen, aangepast voor nieuwe vormen van vogelzanganalyse. Daarnaast behandelt deze thesis het detecteren van vogelsoorten ten behoeve van natuurbehoud en milieustudies. Een onderzoek naar het ontwerp van leerbare audio-frontends toont aan dat normalisatie- en compressie-operaties de belangrijkste factoren zijn voor goede resultaten. Verder laat een gedetailleerde analyse van leerbare filters zien dat vogelakoestiek neigt naar een log-lineair gespreide frequentierepresentatie, vergelijkbaar met menselijke psycho-akoestiek. Tot slot presenteert deze thesis een nieuw zwak-gesuperviseerd trainingsraamwerk waarbij piekdetectie en aandacht-aggregatie gebruikt worden om verspreide context efficiënt vast te leggen voor de classificatie van vogelsoorten.
Praktisch
- Datum
- Dinsdag 30 juni 2026, 16:00
- Locatie
- Auditorium P Jozef Plateau, Plateaustraat 22, 9000 Gent
- Livestream
- Volg online
Meer info
- Contact
- doctoraat.ea@ugent.be