See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Riiklik programm: Eesti keel ja rahvuslik mälu" projekt EKRM04-8
EKRM04-8 "Eesti murrete korpus II (1.01.2004−31.12.2008)", Karl Pajusalu, Tartu Ülikool, Tartu Ülikool, Filosoofiateaduskond.
EKRM04-8
Eesti murrete korpus II
1.01.2004
31.12.2008
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja rahvuslik mälu
AsutusRollPeriood
Tartu Ülikoolkoordinaator01.01.2004−31.12.2008
Tartu Ülikool, Filosoofiateaduskondkoordinaator01.01.2004−31.12.2008
PerioodSumma
01.01.2004−31.12.2004125 000,00 EEK (7 988,96 EUR)
01.01.2005−31.12.2005150 000,00 EEK (9 586,75 EUR)
01.01.2006−31.12.2006150 000,00 EEK (9 586,75 EUR)
01.01.2007−31.12.2007190 000,00 EEK (12 143,21 EUR)
01.01.2008−31.12.2008225 000,00 EEK (14 380,12 EUR)
53 685,79 EUR

Tartu Ülikooli ja Eesti Keele Instituudi ühistööna koostatav eesti murrete korpus on kõiki eesti murdeid hõlmav andmekogu, mis sisaldab autentseid murdetekste. Selle põhieesmärk on teha hästi valitud ja võimalikult täpselt litereeritud murdematerjalid uurijatele ka elektrooniliselt kättesaadavaks. Korpuse teine eesmärk on luua võimalus eesti murrete kõrvutavaks uurimiseks võimalikult suure andmehulga põhjal. Eesti murrete korpuse I järk valmis riikliku programmi Eesti keel ja rahvuskultuur toetusel aastatel 1999-2003. See hõlmab 0,5 miljonit sõnet vanapäraseid murdetekste kõigist eesti murretest. Küllalt põhjalike fonoloogiliste ja morfoloogiliste analüüside tegemiseks on aga vaja vähemalt miljoni sõne suurust korpust. Selle saavutamine ongi selle projekti eesmärk. Eesti murrete korpus koosneb: (1) murdelindistustest; (2) soome-ugri foneetilises transkriptsioonis murdetekstidest; (3) lihtsustatud transkriptsioonis murdetekstidest (foneetilises transkriptsioonis tekstide morfoloogiliseks ja süntaktiliseks analüüsiks optimeeritud variant); (4) morfoloogiliselt märgendatud tekstidest, mis on sisestatud MySQL-andmebaasi; (5) andmebaasist, mis sisaldab andmeid keelejuhtide ning lindistuse kohta. Projekti Eesti murrete korpus II käigus suurendatakse korpuse mahtu vähemalt l miljoni sõneni nii foneetilises kui lihtsustatud transkriptsioonis. See võimaldaks korpuse põhjal teha juba mitmesuguseid kõrvutavaid eesti murrete häälikusüsteemi ja grammatika alaseid uurimusi. Morfoloogiliselt märgendatud tekstisõnade arvu on kavas 2008. aasta lõpuks suurendada vähemalt 0,5 miljonini, mis annab võimaluse eesti murrete korpuspõhise grammatika tegemise alustamiseks. Kavas on digitaliseerida kõik korpuses käsutatavad helilindistused, et muuta need uurijatele paremini kättesaadavaks. Välja antakse korpust tutvustavad ja korpuse käsutamist hõlbustavad teatmikud 2004. aasta lõpus ja 2008. aasta lõpus. Internetis avaldatakse tutvustavad materjalid ning otsinguprogrammid, mis aitavad korpusest päringuid teha. Ka selle tööga on juba algust tehtud, praeguseks on olemas aadressil www.murre.ut.ee esialgne otsingumootor, mille täiustamisega tuleb siiski veel tegeleda. Internetis on kavas avaldada ka eesti murdeid tutvustavaid ja murdekeele käsutust populariseerivaid materjale, mis on suunatud laiemale üldsusele, eelkõige aga koolidele ja asjahuvilistele. Projekti lõppedes peaks olema loodud hea baas põhjalikeks uurimusteks Eesti murrete foneetika, fonoloogia, morfoloogia ja süntaksi kohta, mitmesuguseid uuringuid saab aga teha juba varasematel aastatelgi. Projekti teostamiseks odavaimal, st siinesitatud viisil on vajalik tagada Tartu Ülikoolis vähemalt ühe murdekorpuse andmebaaside arendamisega tegeleva teaduri 0,5 köha palk (60 075 krooni aastas), ühe märgendustöid koordineeriva ja juhendava teaduri 0,5 köha palk (60 075 krooni aastas) ning koostada korpust lisatööjõu abil (tööettevõtulepingute alusel 50 000 krooni eest aastas). Sellele lisanduvad korpuse arendamise riist- ja tarkvara kulud (30 000 krooni aastas), muud tarvikute- ja materjalikulud (15 000 krooni aastas), lähetuskulud korpuse arendamisega seotud sõitudeks (10 000 krooni aastas) ja asutuse halduskulud (20% üldkuludest).