"Institutsionaalne uurimistoetus" projekt IUT34-4
IUT34-4 "Andmeteaduse meetodid ja rakendused (DSMA) (1.01.2015−31.12.2020)", Jaak Vilo, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, Arvutiteaduse instituut.
IUT34-4
Andmeteaduse meetodid ja rakendused (DSMA)
Data Science Methods and Applications (DSMA)
1.01.2015
31.12.2020
Teadus- ja arendusprojekt
Institutsionaalne uurimistoetus
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP170 Arvutiteadus, arvutusmeetodid, süsteemid, juhtimine (automaatjuhtimisteooria)1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)80,0
1. Bio- ja keskkonnateadused1.12. Bio- ja keskkonnateadustega seotud uuringud, näiteks biotehnoloogia, molekulaarbioloogia, rakubioloogia, biofüüsika, majandus- ja tehnoloogiauuringudT490 Biotehnoloogia 1.5. Bioteadused (bioloogia, botaanika, bakterioloogia, mikrobioloogia, zooloogia, entomoloogia, geneetika, biokeemia, biofüüsika jt20,0
PerioodSumma
01.01.2015−31.12.2015116 600,00 EUR
01.01.2016−31.12.2016116 600,00 EUR
01.01.2017−31.12.2017116 600,00 EUR
349 800,00 EUR

Andmete kogumine ja seega ka analüüsivajadus kasvab üha seoses paljude uute mõõtetehnoloogiate ja IT-lahenduste arenguga. Andmeteadus tegeleb nii väga suurte, keskmiste, kui ka väiksemate andmetega, eemärgiga tuvastada kasulikku ja “ennustavat” infot. Käesoleva uurimistoetuse raames arendame uusi andmeanalüüsi meetodeid (masinõpe, andmekaeve, klasteranalüüs, statistika, mustrite otsimine, jne) ja algoritme, teadusarvutuste platvorme, andmete kaitset kõrvaliste isikute eest ja teadusuuringuteks vajalikku tarkvara. Uute meetodite vajadusi dikteerivad rakendused. Käesoleva taotluse põhifookuses on bioloogilised andmed ja bioinformaatika alane andmete integratsioon, terviseandmete analüüs, ning teised andmetüübid nagu asukohapõhised mobiilpositsioneerimise andmed. Käesolev IUT koondab TÜ Arvutiteaduse instituudi andmekaeve ja hajusarvutuste alase ekspertiisi ja arendab neid oluliselt edasi.
Data Science is a rapidly developing and growing area with the goal to extract useful and predictive knowledge from big, medium, and small data. We are focusing on new methods in data analytics (data mining, machine learning, clustering, pattern extraction, statistics), scaling of algorithms to high-performance computing and cloud platforms, improving data security and privacy. The entire field, as well as our proposal, is dominated by intimate interplay between application areas and methods development. Focusing primarily on biological and health data exposes the current shortcomings and limitations of data integration and mining. Especially in integration of many different data types and evidences that are being produced across a very broad area of molecular biology. We will also contribute to other data and calculations rich areas, especially weather prediction, mobile location based services, and social networks.