Automated Learning of Biologically Relevant Features from Primary Sequence Using Convolutional Neural Networks

Promovendus/a
Jasper Zuallaert
Faculteit
Faculteit Ingenieurswetenschappen en Architectuur
Vakgroep
Vakgroep Elektronica en Informatiesystemen
Curriculum
Master of Science in de ingenieurswetenschappen: computerwetenschappen— afstudeerrichting software engineering, Universiteit Gent, 2014
Academische graad
Doctor in de ingenieurswetenschappen: computerwetenschappen
Taal proefschrift
Engels
Vertaling titel
Geautomatiseerd leren van biologisch relevante kenmerken uit primaire sequentie aan de hand van convolutionele neurale netwerken
Promotor(en)
prof. Wesley De Neve, vakgroep Elektronica en Informatiesystemen - prof. Nico Callewaert, vakgroep Biochemie en Microbiologie - prof. Yvan Saeys, vakgroep Toegepaste Wiskunde, Informatica en Statistiek
Examencommissie
voorzitter prof. Hennie De Schepper (onderwijsdirecteur) -prof. Nico Callewaert (Vakgroep Biomoleculaire Geneeskunde en Vakgroep Biochemie en Microbiologie) - prof. Joni Dambre (Vakgroep Elektronica en Informatiesystemen) - prof. Wesley De Neve (Vakgroep Elektronica en Informatiesystemen) - dr. Sven Degroeve (Vakgroep Biomoleculaire Geneeskunde) - prof. Jan Fostier (Vakgroep Informatietechnologie) - dr. Ken Heyndrickx (Inari Agriculture, Zwijnaarde) - prof. Yvan Saeys (Vakgroep Toegepaste Wiskunde) - dr. Xi Wang (BASF Agricultural Solutions Belgium, Zwijnaarde

Korte beschrijving

Het voorbije decennium heeft diep machinaal leren doorbraken geforceerd in verschillende domeinen. Verscheidene voorspellingsopdrachten (bv. beeldherkenning) worden vandaag de dag voltooid met een lagere foutenlast dan de mens. Diep machinaal leren doet dit voornamelijk door het verwerken van grote hoeveelheden data. Moleculaire biologie is één van de onderzoeksvelden waarin data in steeds grotere hoeveelheden beschikbaar zijn. In dit domein wordt onderzoek verricht naar de structuur, samenstelling, en interacties van DNA-, RNA-, en eiwitmolecules. Interessante informatie extraheren uit die grote hoeveelheden aan data is echter niet vanzelfsprekend. In deze dissertatie wordt onderzocht in welke mate convolutionele neurale netwerken aangewend kunnen worden om relevante informatie uit DNA- en eiwitsequenties te halen. Hiervoor werden structurele voorspellingsopdrachten op DNA (predictie van splits- en translatiestartplaatsen) en functionele voorspellingsopdrachten op eiwitten (predictie van Gene Ontology-klassen, toxiciteit, en secreteerbaarheid) onderzocht. Naast de vooruitgang in predictieve nauwkeurigheid, ligt de nadruk in deze dissertatie grotendeels op de interpretatie van de bekomen voorspellingen. Er wordt getracht te begrijpen waarom een beslissing genomen wordt, welke delen in de sequenties belangrijk zijn, en of dit biologisch te verantwoorden valt.

Praktisch

Wanneer
Woensdag 27 mei 2020, 16:00
Waar
Via livestream

via livestream/videoconferentie, zie link hierboven, maatregel COVID19

Meer info

Contact
doctoraat.ea@UGent.be