Neural Approaches to Sequence Labeling for Information Extraction

Promovendus/a
Ioannis Bekoulis
Faculteit
Faculteit Ingenieurswetenschappen en Architectuur
Vakgroep
Vakgroep Informatietechnologie
Curriculum
Master Computer Engineering and Informatics, University of Patras, Griekenland, 2012
Academische graad
Doctor in de ingenieurswetenschappen: computerwetenschappen
Taal proefschrift
Engels
Vertaling titel
Neurale netwerkoplossingen voor het labelen van tekstsequenties bij informatie-extractie
Promotor(en)
prof. Chris Develder, vakgroep Informatietechnologie - dr. ir. Thomas Demeester, vakgroep Informatietechnologie
Examencommissie
voorzitter prof. Filip De Turck (academisch secretaris) - prof. Isabelle Augenstein (University of Copenhagen, Denmark) - dr. ir. Thomas Demeester (Vakgroep Informatietechnologie) - prof. Kris Demuynck (Vakgroep Elektronica en Informatiesystemen) - prof. Chris Develder (Vakgroep Informatietechnologie) - prof. Tom Dhaene (Vakgroep Informatietechnologie) - prof. Veronique Hoste (Vakgroep Vertalen, tolken en communicatie) - prof. Sofie Van Hoecke (Vakgroep Elektronica en Informatiesystemen)

Korte beschrijving

Een belangrijk aspect binnen artificiële intelligentie (AI) is het interpreteren van menselijke taal uitgedrukt in tekstuele (geschreven) vorm: natural Language processing (NLP) is belangrijk gezien tekstuele informatie nuttig is voor veel toepassingen. Toch is het verstaan ervan (zogenaamde natural Language understanding, (NLU) een uitdaging, gezien de ongestructureerde vorm van tekst, waarvan de betekenis vaak dubbelzinnig en contextafhankelijk is. In dit proefschrift introduceren we oplossingen voor tekortkomingen van gerelateerd werk bij het behandelen van fundamentele taken in natuurlijke taalverwerking, zoals named entity recognition (i.e. het identificeren van de entiteiten die in een zin voorkomen) en relatie-extractie (het identificeren van relaties tussen entiteiten). Vertrekkend van een specifiek probleem (met name het identificeren van de structuur van een huis aan de hand van een tekstueel zoekertje), bouwen we stapsgewijs een complete (geautomatiseerde) oplossing voor de bovengenoemde taken, op basis van neutrale netwerkarchitecturen. Onze oplossingen zijn algemeen toepasbaar op verschillende toepassingsdomeinen en talen. We beschouwen daarnaast ook de taak van het identificeren van relevante gebeurtenissen tijdens een evenement (bv. een doelpunt tijdens een voetbalwedstrijd), in informatiestromen op Twitter. Meer bepaald formuleren we dit probleem als het labelen van woord sequenties (vergelijkbaar met named entity recognition), waarbij we de chronologische relatie tussen opeenvolgende tweets benutten.

Praktisch

Wanneer
Vrijdag 11 oktober 2019, 16:00
Waar
auditorium 1, iGent, eerste verdieping, Technologiepark Zwijnaarde 126, 9052 Zwijnaarde

Meer info

Contact
doctoraat.ea@UGent.be