"Riiklik programm: Eesti keel ja kultuurimälu" projekt EKKM14-298
EKKM14-298 "Eesti vana kirjakeele ressursid (1.01.2014−31.12.2018)", Külli Habicht, Tartu Ülikool, Humanitaarteaduste ja kunstide valdkond, eesti ja üldkeeleteaduse instituut.
EKKM14-298
Eesti vana kirjakeele ressursid
Resources for old written Estonian
1.01.2014
31.12.2018
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja kultuurimälu
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus100,0
PerioodSumma
01.01.2014−31.12.20148 800,00 EUR
01.01.2015−31.12.20158 800,00 EUR
01.01.2016−31.12.20168 800,00 EUR
01.01.2017−31.12.201710 000,00 EUR
01.01.2018−31.12.201810 000,00 EUR
46 400,00 EUR

Projekti toel tahetakse tuua avalikku käibesse hulk vanema kirjakeele materjali, mis on seni oma harulduse ja komplitseeritud kättesaadavuse tõttu olnud lingvistilisest uurimistööst väljas. Vana kirjakeele korpuse kasutajaliidese kaudu päringuteks avatud materjali hulga laiendamine võimaldab kõigil uurijatel ja huvilistel haruldasele keelematerjalile suhteliselt lihtsalt ligi pääseda. Projekti käigus tahetakse 19. sajandi tekstide korpust laiendada igal aastal vähemalt 100 000 tekstisõna mahus. See eeldab tekstide sisestamist ja elektrooniliselt töödeldavale kujule viimist (korpuse poolautomaatset märgendamist), milleks vajatakse 1-2 väljaõppinud sisestajat, kes vastutavad oma töö kvaliteedi eest. Teine oluline eesmärk on süstematiseerida teadmist vanema kirjakeele perioodi kirjakeele arengust, täiendades praeguseks juba alustatud kirjakeele sõnade esmaesinemuste elektroonilist andmebaasi. See teave on väga oluline eesti sõnavara etümologiseerimisel ja leksikaalse dünaamika uurimisel. Esmaesinemuste andmebaasi täiendamine eeldab töömahukat tekstide lemmatiseerimist ja grammatilist märgendamist. Seda tööd tahetakse projekti käigus pidevalt jätkata, lemmatiseerides aastas 40 000 tekstisõna mahus 17. sajandi lõpu tekste. Tahetakse jätkata ka vanimate allikate sõnavara publikatsioonide avaldamist. Eesmärgiks on projekti neljandal tööaastal publitseerida Christoph Blume teoste sõnastik. Blume on 17. sajandi teise poole olulisim autor, kellelt on säilinud märkimisväärsel hulgal teksti. Tänu oma uuendusmeelsusele tõi Blume kirjakeelde ortograafilisi ja morfosüntaktilisi lihtsustusi, mis mõjutasid ka hilisemat kirikliku kirjakeele kujunemise protsessi. Et Blume keelekasutuse eripärast ei ole tänini piisavalt andmeid, oleks väga vajalik tema kui n-ö kirjakeele suure murrangu eelse/aegse autori keelekasutuse põhjalikum uurimine ja tema teoste leksika täismahus avaldamine. Neljandaks olulisemaks töösuunaks on vana kirjakeele korpuse kasutajaliidese pidev ajakohastamine, töörühma kodulehe täiendamine ning selle kaudu vana kirjakeele uurimisseisu laiem tutvustamine. Projektis kavandatud elektroonilised leksikonid avardavad keeleteadlaste ja -huviliste teadmisi kirjakeele arengu dünaamikast ning võimaldavad prognoosida kirjakeele tulevikumuutusi ja -väljavaateid. Vanast kirjakeelest adekvaatset arengudünaamilist pilti omamata on võimatu mõista (kirja)keele arengut nt ka praegusaja prestiižsete võõrkeelte kontaktimõju tingimustes. Seega on projektil lisaks minevikumaterjali laiemasse käibesse toomisele ka tulevikku suunatud prognostiline väljund. Kogu töö on samal ajal vajalikuks sisendiks eesti keele grammatika eri tasandite tervikkäsitlustele (fonoloogia, morfoloogia, süntaks), eriti aga eesti keele ajaloo ja kirjakeele ajaloo tervikkäsitlustele, sest ilma seda tüüpi usaldusväärsete andmeteta ei ole võimalik keelt adekvaatselt kirjeldada.
Töö oli planeeritud neljas põhilises valdkonnas, millest kõik on projekti lõpuks jõudnud kavandatud tulemusteni. 1) Projekti toel toodi TÜ vana kirjakeele korpuse kaudu (http://vakk.ut.ee) avalikku käibesse vanema kirjakeele tekstimaterjali, mis pole seni olnud uurimistööks kättesaadav. 2) Projekti käigus suurendati 19. sajandi tekstide korpuse mahtu 450 000 tekstisõna võrra. 3) Projekti jooksul täiendati kirjakeele sõnade esmaesinemuste elektroonilist andmebaasi. See materjal annab olulise sisendi eesti keele sõnavara etümologiseerimisse, toetab leksikaalse dünaamika uurimist ja seda kajastava ülevaatliku vana kirjakeele sõnaraamatu koostamist. Lemmatiseerimistöö keskendus 17. sajandi teise poole ja 18. sajandi alguse tekstidele ning hõlmas kokku 150 000 tekstisõna märgendamist. Selle töö ühe tulemusena valmis elektrooniline Christoph Blume teoste sõnastik (vt http://kodu.ut.ee/~kyllip/). Tänu süstematiseeritud materjalile on võimalik edaspidi uurida Blume uuenduslikkust 17. sajandi lõpu kirjakeele reformi eelsel ajal. 4) Oluliseks töösuunaks oli ka vana kirjakeele korpuse kasutajaliidese ajakohastamine, töörühma kodulehe täiendamine ning selle kaudu vana kirjakeele uurimisseisu laiem tutvustamine. Projekti perioodil, 2017. aastal, uuendati täielikult korpuse kasutajaliidest (vrd vana veebilehte murre.ut.ee/vakkur ja uut vakk.ut.ee). Korpusesse lisati eesti keelt ja selle allkeeli iseloomustavaid metatekste, korpusetekste iseloomustavaid taustaandmeid ning ka käsikirjalist materjali, et suurendada materjali sotsiolingvistilist haaret. Projekti toel loodud elektroonilised leksikonid avardavad keeleteadlaste ja -huviliste teadmisi kirjakeele arengust ning võimaldavad prognoosida kirjakeele tulevikumuutusi ja -väljavaateid. Niisiis oli projektil lisaks minevikumaterjali laiemasse käibesse toomisele ka tulevikku suunatud prognostiline väljund. Kogu tehtud töö oli 4 aasta jooksul sisendiks eesti keele ajaloo ja kirjakeele ajaloo tervikkäsitlustele.