"Eesti Teadusfondi uurimistoetus" projekt ETF7437
ETF7437 "Paljude geeniekspressiooniandmete ühisanalüüs (MEM) (1.01.2008−31.12.2011)", Jaak Vilo, Tartu Ülikool, Matemaatika-informaatikateaduskond.
ETF7437
Paljude geeniekspressiooniandmete ühisanalüüs (MEM)
Multi-experiment gene expression data matrix analysis (MEM)
1.01.2008
31.12.2011
Eesti Teadusfondi uurimistoetus
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP170 Arvutiteadus, arvutusmeetodid, süsteemid, juhtimine (automaatjuhtimisteooria)1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)34,0
4. Loodusteadused ja tehnika4.16. Biotehnoloogia (loodusteadused ja tehnika)T490 Biotehnoloogia 2.3. Teised tehnika- ja inseneriteadused (keemiatehnika, lennundustehnika, mehaanika, metallurgia, materjaliteadus ning teised seotud erialad: puidutehnoloogia, geodeesia, tööstuskeemia, toiduainete tehnoloogia, süsteemianalüüs, metallurgia, mäendus, tekstiilitehnoloogia ja teised seotud teadused).33,0
3. Terviseuuringud3.1. BiomeditsiinB726 Kliiniline bioloogia 3.1. Biomeditsiin (anatoomia, tsütoloogia, füsioloogia, geneetika, farmaatsia, farmakoloogia, kliiniline keemia, kliiniline mikrobioloogia, patoloogia)33,0
PerioodSumma
01.01.2008−31.12.2008271 200,00 EEK (17 332,84 EUR)
01.01.2009−31.12.2009260 352,00 EEK (16 639,53 EUR)
01.01.2010−31.12.2010236 660,00 EEK (15 125,33 EUR)
01.01.2011−31.12.201115 124,80 EUR
64 222,50 EUR
92288,42

Viimase kümne aasta jooksul on geeniekspressiooni (mRNA) mõõtmine mikrokiipe kasutades muutunud igapäevaseks rutiiniks, mis võimaldab kiiresti mõõta rakkude sisemist „olekut“ ehk rakkude aktiivsust geenide transkriptsiooni tasemel. Enamik publitseeritavaid ekspressiooni andmeid avaldatakse avalikes andmebaasides (GEO, ArrayExpress), soodustades vaba info vahetust. Senini on andmebaasid toiminud peamiselt andmete hoidlana, kuid praegune uurimise fookus suundub küsimustele – kuidas muuta andmed lihtsamini tõlgendatavaks ning millised peavad olema päringusüsteemid ja kasutajaliidesed, mis võimaldavad kasutajatel kasutada ning analüüsida kõiki (või paljusid, olulisi) andmestikke korraga. Meie projekti eesmärk on töötada välja intelligentsetel andmeladudel baseeruvad meetodid, mis võimaldavad interaktiivseid ühispäringuid mahukatest andmetest ning anda kasutajatele mugavalt tõlgendatavaid vastuseid. Projekti käigus vajavad lahendamist erinevate andmestike normaliseerimine; erinevate platvormide võrreldavaks tegemine; tulemuste tõlgendamine ja visualiseerimine; statistilise olulisuse hindamine; päringute kiiruse tagamine mahukamate andmestike peale jne. Seejuures võivad andmestikud pärineda erinevatelt tehnoloogilistelt platvormidelt (Affymetrix, Illumina) ning kirjeldada sarnast või erinevat bioloogilist tingimust (mõõdetavad tingimused võivad varieeruda kiipide vahel). Samuti on vaja luua mõistete süsteem, mis aitaks kasutajatel tõlgendada tulemusi (näit. geen on reeglina ekspresseerunud maksas; geen avaldub embrüo arengu algfaasis). Käesolev bioinformaatika teadusvaldkonna projekt sisaldab algoritmika, statistika, tekstide kaevandamise kui kasutajaliideste disaini ja graafilise visualiseerimise komponente.
Gene expression (mRNA) data measurements using DNA microarrays have in the last ten years become a mainstream technology for measuring cellular „states“ of the cells. Most of the published data is being submitted into databases like ArrayExpress and GEO. This supports the free exchange of information and promises many new advances by combining these different data. The major microarray databases have so far acted mostly like data repositories, storing individual data sets with enough attached annotations. The focus is however turning into the question, of how to make a combined use out of all the stored data. Most importantly, which query formalisms and user interfaces allow users to better interpret the overall meaning of the data when combining many, if not all the data. The goal of our project is to develop warehousing strategies and tools for enabling interactive exploratory querying from large collections of public high-throughput data sets. During the project we will need to deal with the issues like normalization of data from different labs and data acquisition platforms; making different data sets “comparable”; interpreting and visualization of the query results; estimation of the statistical significance; and scaling the query speed for very large data sets to support the interactive on-line use. The data sets, we assume, will come from different platforms (Affymetrix, Illumina, etc), different species and conditions. We want to provide users with higher-level understanding like where (e.g. healthy liver or breast tumor) and when (e.g. embryo; or adult) are the genes of interest expressed, when do they show differential expression (stress; aging), etc. Current research proposal in bioinformatics will also combine the elements of algorithmic research, statistics, text mining, graphical user interface design and visualization.

Vastutav täitja (1)

IsikKraadTöökoht ja ametCVOsalemise periood
Jaak VilodoktorikraadEST / ENG01.01.2008−31.12.2010

Põhitäitjad (16)

IsikKraadTöökoht ja ametCVOsalemise periood
Priit AdlerdoktorikraadEST / ENG01.01.2008−31.12.2011
Egon ElbreEST / ENG08.09.2010−31.12.2011
Sten IlmjärvdoktorikraadEST / ENG01.01.2008−31.12.2011
Raivo KoldedoktorikraadEST / ENG01.01.2008−31.12.2011
Kristjan KorjusdoktorantEST / ENG01.09.2011−31.12.2011
Darja Kruševskajamagistrikraad (teaduskraad)doktorantEST / ENG01.01.2008−31.12.2011
Meelis Kulldoktorikraaderakorraline teadurEST / ENG01.01.2008−31.12.2011
Anna LeontjevamagistrikraadEST / ENG01.09.2011−31.12.2011
Tauno MetsaludoktorikraadEST / ENG01.09.2011−31.12.2011
Hedi PetersondoktorikraadEST / ENG01.01.2008−31.12.2011
Jüri ReimanddoktorikraadEST / ENG01.01.2008−31.12.2011
Elena Sügismagistrikraad (teaduskraad)EST / ENG08.09.2010−31.12.2011
Kristo TammeojaEST / ENG01.01.2008−31.12.2009
Andres TikodoktorikraadEST / ENG01.01.2008−30.06.2009
Aleksandr TkatšenkomagistrikraadEST / ENG01.09.2008−31.12.2011
Konstantin Tretjakovmagistrikraad (teaduskraad)EST / ENG08.09.2010−31.12.2011
Publikatsioonid
Publikatsioonid
Tretyakov, K.; Laur, S.; Vilo, J. (2011). G = MAT: Linking Transcription Factor Expression and DNA Binding Data. PLoS ONE, 6 (1), e14559.10.1371/journal.pone.0014559.
Reimand, J.; Arak, T. ; Vilo, J. (2011). g:Profiler—a web server for functional interpretation of gene lists (2011 update). Nucleic Acids Research, 39 (2), w307−w315.
Billon, Nathalie; Kolde, Raivo; Reimand, Juri; Monteiro, Miguel C; Kull, Meelis; Peterson, Hedi; Tretyakov, Konstantin; Adler, Priit; Wdziekonski, Brigitte; Vilo, Jaak; Dani, Christian (2010). Comprehensive transcriptome analysis of mouse embryonic stem cell adipogenesis unravels new processes of adipocyte development. Genome Biology, 11 (8), R80.10.1186/gb-2010-11-8-r80.
Adler, P.; Kolde, R.; Kull, M.; Tkachenko, A.; Peterson, H.; Reimand, J.; Vilo, J. (2009). Mining for coexpression across hundreds of datasets using novel rank aggregation and visualisation methods. Genome Biology, 10 (12), R139.10.1186/gb-2009-10-12-r139.
Krushevskaya, D.; Peterson, H.; Reimand, J.; Kull, M.; Vilo, J. (2009). VisHiC—hierarchical functional enrichment analysis of microarray data. Nucleic Acids Research, 37, W587−W592.10.1093/nar/gkp435.
Reimand, J. ; Tooming, L. ; Peterson, H.; Adler, P.; Vilo, J. (2008). GraphWeb: mining heterogeneous biological networks for gene modules with functional significance. Nucleic Acids Research, 36, W452−W459.10.1093/nar/gkn230.
Tkatchenko, A.; Tretjakov, K.; Adler, P.; Vilo, J. (2008). Text mining for automatic annotation of microarray experiment clusters. Databases and Information Systems: 8th International Baltic Conference on Databases and Information Systems; Tallinn; 02-05 June 2008. Ed. Haav, H.-M.; Kalja, A. Tallinn University of Technology Press, 423−426.
Kolde, Raivo; Laur, Sven ; Adler, Priit ; Vilo, Jaak (2012). Robust Rank Aggregation for gene list integration and meta-analysis. Bioinformatics, x.10.1093/bioinformatics/btr709.
Adler, P.; Peterson, H.; Agius, P.; Reimand, J.; Vilo, J. (2009). Ranking genes by their co-expression to subsets of pathway members. In: Challenges of Systems Biology: Community Effort to Harness Biological Complexity (1−13).. Oxford: Blackwell Publishing. (Annals of the New York Academy of Sciences).10.1111/j.1749-6632.2008.03747.x.
Juhendamised
Juhendamised
Meelis Kull, doktorikraad, 2011, (juh) Jaak Vilo, Statistical enrichment analysis in algorithms for studying gene regulation (Statistilise rikastatuse analüüs geeniregulatsiooni uurimiseks loodud algoritmides), Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut.
Jüri Reimand, doktorikraad, 2010, (juh) Jaak Vilo, Functional Analysis of Gene Lists, Networks and Regulatory Systems (Geenigruppide, võrgustike ja regulatoorsete süsteemide funktsionaalne analüüs), Tartu Ülikool, Matemaatika-informaatikateaduskond.
Sten Ilmjärv, magistrikraad, 2009, (juh) Hedi Peterson; Jaak Vilo, Promootorjärjestuste uurimine BxD hiireliini geeniekspressiooni dünaamika alusel, Tartu Ülikool, Loodus- ja tehnoloogiateaduskond, Tartu Ülikooli Molekulaar- ja Rakubioloogia Instituut, Bioinformaatika õppetool.
Andres Tiko, magistrikraad, 2009, (juh) Meelis Kull; Jaak Vilo, Ripple-Down Rule Sets and MDL Learning (Hierarhilised eranditega reeglid ja minimaalsel kirjelduspikkusel põhinev õppimine), Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut.
Raivo Kolde, magistrikraad (teaduskraad), 2008, (juh) Jaak Vilo; Sven Laur; Jüri Lember, Co-expression queries across multiple experiments (Ko-ekspressiooni päringud üle mitmete eksperimentide), Tartu Ülikool, Matemaatika-informaatikateaduskond.
Konstantin Tretjakov, magistrikraad (teaduskraad), 2008, (juh) Jaak Vilo; Sven Laur, G=MAT: Linking Transcription Factor Expression with DNA Binding (G=MAT: meetod geeniekspressiooni ja DNA seondumisandmete ühendamiseks), Tartu Ülikool, Matemaatika-informaatikateaduskond.