See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Eesti Teadusfondi uurimistoetus" projekt ETF7313
ETF7313 "Tõenäosusjaotuste lähendamise teoreetilised ja praktilised aspektid matemaatilises statistikas ja kindlustusmatemaatikas (1.01.2008−31.12.2011)", Meelis Käärik, Tartu Ülikool, Matemaatika-informaatikateaduskond.
ETF7313
Tõenäosusjaotuste lähendamise teoreetilised ja praktilised aspektid matemaatilises statistikas ja kindlustusmatemaatikas
Theoretical and practical aspects of approximation of distributions in mathematical statistics and insurance mathematics
1.01.2008
31.12.2011
Teadus- ja arendusprojekt
Eesti Teadusfondi uurimistoetus
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
4. Loodusteadused ja tehnika4.5. StatistikaP160 Statistika, operatsioonanalüüs, programmeerimine, finants- ja kindlustusmatemaatika 1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)100,0
PerioodSumma
01.01.2008−31.12.2008150 000,00 EEK (9 586,75 EUR)
01.01.2009−31.12.2009144 000,00 EEK (9 203,28 EUR)
01.01.2010−31.12.2010130 896,00 EEK (8 365,78 EUR)
01.01.2011−31.12.20118 365,20 EUR
35 521,01 EUR

Tõenäosusjaotuste lähendamine hulkadega on oluline ülesanne nii klassikalises statistikas ja tõenäosusteoorias kui mitmetes praktilistes valdkondades. Senistes töödes oleme tähelepanu pööranud põhiliselt tõenäosusjaotuste lähendamise teoreetilistele aspektidele. Fikseerime teatava kaofunktsiooni, mis näitab, kui hästi teatav hulk lähendab etteantud jaotust. Erilist huvi pakub optimaalsete hulkade (st hulkade, mis minimiseerivad kaofunktsiooni) omadused. Peatähelepanu all olid optimaalsete lähendhulkade leidumise ja koondumise küsimus, samuti kaofunktsiooni infiimumväärtuste koondumise teema. Kaofunktsiooni infiimumväärtuste koondumine õnnestus tõestada suvalise lähendhulkade klassi ja separaabli meetrilise ruumi korral. Optimaalsete lähendhulkade leidumine ja koondumine sai tõestatud lokaalselt kompaktses separaablis meetrilises ruumis teatud tõkestatud ja parameetriliste hulkade jaoks. Kui seni on tegeldud eeskätt teoreetiliste küsimustega, siis edasises uurimustöös on plaanis käsitleda toodud valdkonnaga seotud rakenduslikke probleeme. Oleme välja valinud kolm aktuaalset teemat, kus tõenäosusjaotuste lähendamine ülesanne on suure tähtsusega: 1. k-tsentrite leidmine grupeeritud andmete pealt: andmete mahu pidev kasv sunnib otsima järjest efektiivsemaid meetodeid mudelite koostamiseks. Pakume k-keskmiste leidimiseks välja meetodi, kus andmed eelnevalt grupeeritakse ja seejärel leitakse k-keskmine grupeeritud andmete pealt. Kirjeldatud algoritm on küll kiire, aga seda teatava vea hinnaga. Põhieesmärgiks on analüüsida toodud protseduuri juures tekkivat viga ja pakkuda välja meetodeid, mis tagaksid, et viga on võimalikult väike. 2. Puuduvate andmete analüüs: puuduvate väärtuste probleem on praktikas väga levinud. Võtmeküsimusteks on kuidas kasutada olemasolevate andmete jaotusi puuduvate andmete hindamisel võimalikult optimaalselt rakendada. Innovaatiliseks ideeks siinjuures on kasutada abivahendina ka koopulate teooriat. 3. Kindlustusmatemaatika riskimudelid: jaotuste lähendamise teema on kindlustusmatemaatikas riskiprotsesside mudelite juures kriitilise tähtsusega. Antud temaatika on eriti oluline just praegu, sest praegune kindlustusandja riskimahtude jaoks nõutava kapitali suurust reguleeriv võrdlemisi lihtne raamistik Solventsus I on välja vahetumas uue dünaamilise ja riskipõhise raamistikuga Solventsus II. Et see raamistik reguleerib kõiki Euroopa Liidu kindlustusandjaid, on tulenevad mõjud riskimudelitele on kindlasti lähemat uurimist nõudev teema.
Approximation of distributions by certain sets or models is the key problem of several probabilistic and statistical methods. It is natural to minimize the information loss, caused by the model, in the sense of a chosen loss-function. The behaviour and properties of optimal approximative sets (i.e. sets that minimize the loss-function) are of great interest. In the past works we mainly focused on the theoretical questions on existence and convergence of the optimal sets and the convergence of the infimum values of the loss-function. The convergence of the infimum values of the loss-function is proved in separable metric spaces for arbitrary class of sets. The classes of multiple bounded sets and parametric sets were studied thoroughly in locally compact separable metric spaces and the existence and convergence of optimal sets are proved. While the past research was oriented to theoretical aspects, the future directions are of much more practical character. We will focus on three main topics that are related to the problem of approximation of distributions and are of actual importance: 1. k-centers clustering based on grouped data: the increasing volume of the data forces the researcher to search for more effective algorithms. We will consider approach where initial data will be grouped and the k-means are calculated based on the grouped data, thus reducing the volume of data several times. Since this method provides a bias, or main aim is to study the properties of the bias and to search for grouping methods that generate smaller bias. 2. Analysis of missing data: missing values in data is in an old and common issue in statistics. Key question here is how to estimate the missing points using the approximations based on the distributions of available data. As an innovative idea we also plan to use the copula theory as a tool in this research. 3. Risk models in insurance mathematics: the approximation of distributions is a critical issue in designing the risk models. The problem is extremely important at the very moment, since current simple Solvency I framework that regulates the allowed risk volumes and capital requirements is being soon replaced by new dynamic and risk-oriented Solvency II. Since the framework regulates behaviour of insurance companies in whole European Union, its influences to the financial risk models is a topic that can hardly be overestimated.