Hadoop-Based Solutions for Variant Calling and Variant Analysis

Promovendus/a
Dries Decap
Faculteit
Faculteit Ingenieurswetenschappen en Architectuur
Vakgroep
Vakgroep Informatietechnologie
Curriculum
Master of Science in de industriële wetenschappen: informatica, Hogeschool Gent, 2011
Academische graad
Doctor in de ingenieurswetenschappen: computerwetenschappen
Taal proefschrift
en
Vertaling titel
Hadoop-gebaseerde oplossingen voor de identificatie en de analyse van varianten
Promotor(en)
prof. Jan Fostier, vakgroep Informatietechnologie
Examencommissie
voorzitter prof. Daniël De Zutter (eredecaan) - prof. Bart Dhoedt (Vakgroep Informatietechnologie) - prof. Tim De Meyer (Vakgroep Wiskundige Modellering, Statistiek en Bio-informatica) - prof. Jim Dowling (KTH Royal Institute of Technology, Stockholm, Sweden) - prof. Jan Fostier (Vakgroep Informatietechnologie) - dr. Joke Reumers (The Janssen Pharmaceutical Companies of Johnson & Johnson, Mechelen) - prof. Roel Wuyts (KU Leuven)

Korte beschrijving

Het genetisch materiaal van de mens bestaat uit DNA, een sequentie van ongeveer 3 miljard nucleotiden A, C, G en T. In 2003 werd deze sequentie voor de eerste maal ontrafeld in een project dat meer dan 10 jaar duurde en meer dan 3 miljard USD kostte. Sindsdien is de technologie voor het sequentiëren van DNA enorm geëvolueerd en kan ruwe sequentiedata voor een menselijk genoom geproduceerd worden op enkele dagen tijd aan een kostprijs onder 1000 euro. Deze data wordt gebruikt om genetische verschillen tussen een patiënt en een gekend referentiegenoom te identificeren. Deze verschillen of varianten maken ons uniek maar kunnen tevens de oorzaak zijn van ziektes. Het tijdig en accuraat detecteren en analyseren van deze varianten is daarom van belang in een klinische omgeving. Het verwerken van ruwe sequentiedata duurt ongeveer 12 dagen wanneer dit sequentieel wordt uitgevoerd. In dit doctoraat wordt Halvade, een parallel, cloud-gebaseerd platform geïntroduceerd, waarbij de rekentijd wordt gereduceerd tot 1 uur en 30 minuten op een cluster met 15 machines. Halvade implementeert dit proces met het MapReduce programmeermodel. Gebruikmakend van Spark werd er een bijbehorende tool gemaakt die deze varianten kan analyseren op een interactieve en schaalbare wijze.

Praktisch

Wanneer
Maandag 26 juni 2017, 17:00
Waar
auditorium 1, iGent, eerste verdieping, Technologiepark Zwijnaarde 15, 9052 Zwijnaarde

Meer info

Contact
doctoraat.ea@UGent.be