See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Eesti Teadusfondi uurimistoetus (ETF)" projekt ETF9127
ETF9127 "Kõrgdimensionaalsed ja asümmeetrilised statistilised mudelid (1.01.2012−30.06.2016)", Tõnu Kollo, Tartu Ülikool, Matemaatika-informaatikateaduskond.
ETF9127
Kõrgdimensionaalsed ja asümmeetrilised statistilised mudelid
High-dimensional and skewed statistical models
1.01.2012
30.06.2016
Teadus- ja arendusprojekt
Eesti Teadusfondi uurimistoetus (ETF)
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
4. Loodusteadused ja tehnika4.5. StatistikaP160 Statistika, operatsioonanalüüs, programmeerimine, finants- ja kindlustusmatemaatika 1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)100,0
PerioodSumma
01.01.2012−31.12.20128 496,00 EUR
01.01.2013−31.12.20138 496,00 EUR
01.01.2014−31.12.20148 496,00 EUR
01.01.2015−31.12.20158 496,00 EUR
33 984,00 EUR

Alates 1996. aastast on kiiresti arenenud mitmemõõtmeliste asümmeetriliste jaotuste teooria lähtudes A. Azzalini ja tema kaasautorite artiklitest asümmeetrilise normaaljaotuse kohta. Kasutusele on võetud rida asümmeetriliste elliptiliste jaotuste klasse ja on rakendatud neid andmemudelites. 1990ndate teisel poolel hakkas arenema ka teine suund mitmemõõtmeliste jaotuste teoorias ja selle rakendamisel - koopulate teooria. Koopulate abil on võimalik esitada mitmemõõtmelise sõltuvate koordinaatidega juhusliku vektori tõenäosusjaotus ka juhul, kui koordinaatide jaotused on eri tüüpi jaotustest. Saadavad jaotused on osutunud eriti sobivateks mudeliteks finants-ja kindlustusmatemaatikas ning keskkonnauuringutes. Viimastel aastatel on kiiresti arenenud ka teine valdkond - kõrgdimensionaalsete andmete korral rakendatavad statistlised meetodid - seoses eelkõige geneetiliste andmete töötlemisvajadusega, kus uuritavate tunnuste arv võib ületada vaadeldud objektide arvu. Selles olukorras klassikalised statistikameetodid ei ole rakendatavad. Meie uurimisrühm Tartus on lülitunud uurimistöösse mõlemas suunas. Alates 2000. aastast on arendatud edasi mitmemõõtmeliste asümmeetriliste jaotuste teooriat ja aastast 2007 oleme alustanud tööd kõrgdimensionaalsete andmete kirjeldamiseks kasutatavate meetodite väljatöötamisega, ilmunud on ka esimesed artiklid koostöös Rootsi ja Kanada kolleegidega. Projekti käigus on kavas pöörata peamine tähelepanu järgmistele probleemidele: - töötada välja meetodid kolme- ja enamaparameetriliste mitmemõõtmeliste asümmeetriliste jaotuste parameetrite hindamiseks, - kirjeldada asümmeetriliste jaotuste parameetrite hinnangufunktsioonide jaotusi, - rakendada asümmeetrilisi jaotusi ja koopulaid statistilistes mudelites, - arendada kõrgdimensionaalse statistika meetodeid mitte-normaaljaotusega üldkogumite juhul, - uurida asümmeetrilistel elliptilistel jaotustel põhinevate koopulate matemaatilisi omadusi. Uurimistöö toimub koostöös eri maade teadlastega. Projekti raames peab valmima grandi täitjate juhendamisel vähemalt kolm doktoritööd ja viis magistritööd. Töö tulemused publitseeritakse artiklites ja kantakse ette konverentsidel.
Theory of skew-elliptical multivariate distributions has rapidly developed after publication of papers by A. Azzalini and co-authors on the multivariate skew-normal distribution (starting from 1996). Several new classes of distributions have been introduced and applied to different data sets. On the second half of 1990ies also another direction in multivariate distribution theory – copula theory – started to develop. It is possible to present through a copula multivarite distribution of a random vector as a joint distribution of possibly different marginal distributions and given dependence structure. Copula models have become extremely popular and useful in financial applications as well as in environmental studies. Another area of interest - methods of high-dimensional statistical analysis - has quickly developed in last years. Study of these methods is initiated mainly by the need for the analysis of gene data where number of variables under investigation can be much higher than the sample size. In such situation most of the classical procedures do not work. Our research group in Tartu is taking part in research in both described above research directions. From the year 2000 we have started to work with multivariate skew-symmetric distributions, paying attention to both – theory and applications. From 2007 we have started to work with problems from high-dimensional statistics. The first joint papers with colleagues from Sweden and Canada have been published on testing problems in high-dimensional set-up. Main attention will be payd to the following problems: - work out methods for estimation of skewed distributions with three and more multivariate parameters, - describe distributions of estimators of parameters of skewed distributions, - to apply asymmetric distributions and copulas in statististical models, - develop high-dimensional statistical methods for non-normal populations, - investigate mathematical properties of asymmetric elliptical copulas. On the topic of grant three PhD dissertations have to be finished and five master theses defended under supervision of the investigators of the grant. Results of the research will be published in papers and presented at international conferences.
Grandi täitmise käigus töötati välja meetod koopulajaotuste konstrueerimiseks asümmeetrilistest elliptilistest jaotustest. Koopulad võimaldavad kasutada andmete kirjeldamiseks eri tüüpi marginaaljaotustega tunnuseid ja nendevahelisi korrelatsioone. Metoodikat rakendati asümmeetrilise normaaljaotuse, asümmeetrilise t-jaotuse ja Laplace’i jaotuse korral. Leiti asümmeetrilise normaaljaotuse parameetrite piirjaotused protsessis, kus valimimaht läheneb lõpmatusele. Tulemus võimaldab jaotuse parameetrite käitumist tõenäosuslikult kirjeldada ja konstrueerida parameetritele igikaudsed usalduspiirkonnad. Seni oli võimalik leida üksnes parameetrite punkthinnanguid. Kirjeldati asümmeetrilise t-jaotuse korral kahe tunnuse sabasõltuvus, mis iseloomustab tõenäosust, et ühe tunnuse suurte väärtustega kaasnevad teise tunnuse suured väärtused. Selgus, et asümmeetrilise t-jaotuse korral võib sabasõltuvuse tugevus erineda kordades sabasõltuvusest tavalise t-jaotuse korral. Tulemus on oluline finantsriskide hindamisel. Kovariatsioonimaatriksi struktuuride uurimisel selgitati välja, et normaaljaotusega üldkogumi korral on Rao skooritest parem teistest meetoditest. Mitte-normaaljaotusega üldkogumi korral tuletati kovariatsioonimaatriksi jäljel põhinevad teststatistikud kovariatsioonimaatriksi struktuuri kohta käivate hüpoteeside kontrollimiseks. Töötati välja meetod stabiilsete jaotuste parameetrite hindamiseks lähtudes karakteristlikest funktsioonidest. Tegemist on neljaparameetriliste jaotustega, mis võimaldavad modelleerida väga erineva kujuga andmeid. Hinnangute omadusi uuriti ulatuslikes simuleerimis-eksperimentides ja rakendati kindlustuskahjude modelleerimisel. Töötati välja transpordivoogude kirjeldamiseks uus adekvaatsem mudel, kus mudeli vigade jaotuseks on asümmeetriline normaaljaotus. Valikuuringute alases uurimuses näidati, kuidas lisainformatsiooni kasutamisega on võimalik korrigeerida küsitluste mittevastamisest tingitud hinnangute nihet. Grandi täitjate juhendamisel kaitsti kümme magistritööd grandi temaatikas ja saadi tulemusi kolme doktorandi poolt.