"Riiklik programm: Eesti keel ja kultuurimälu" projekt EKKM14-319
EKKM14-319 "Eesti murrete ja sugulaskeelte andmebaas II (1.01.2014−31.12.2018)", Liina Lindström, Tartu Ülikool, Humanitaarteaduste ja kunstide valdkond, eesti ja üldkeeleteaduse instituut.
EKKM14-319
Eesti murrete ja sugulaskeelte andmebaas II
1.01.2014
31.12.2018
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja kultuurimälu
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus100,0
PerioodSumma
01.01.2014−31.12.20146 850,00 EUR
01.01.2015−31.12.201510 000,00 EUR
01.01.2016−31.12.201610 000,00 EUR
01.01.2017−31.12.201712 500,00 EUR
01.01.2018−31.12.201815 000,00 EUR
54 350,00 EUR

Moodul 1.2. Eesti keele uurimiseks ja õppeks vajalike andmebaaside koostamine, allikmaterjalide digiteerimine ja publitseerimine. Projekti põhieesmärk on suurendada märgatavalt murdekorpuse mahtu, seda eriti morfoloogiliselt märgendatud tekstide osas. Projekti lõpuks suureneb korpuse maht märgatavalt: foneetilises transkriptsioonis tekstide maht 2 miljoni tekstisõnani (lisandub ca 0,5 miljonit tekstisõna) ning morfoloogiliselt märgendatud tekstide maht 1,4 miljonini (suureneb 460000 tekstisõna võrra). Tekste lisatakse nii neilt aladelt, mis murdekorpuse varasemas etapis on jäänud katmata, kui ka suurendatakse juba korpuses esindatud kihelkondade mahtu, et võimaldada ka andmete statistilist käsitlemist. Lisaks eesti murretele lisatakse mõnevõrra ka vadja ja liivi tekste, mis on eesti murretega vahetus kontaktis. Enamik morfoloogilisi ja süntaktilisi nähtusi, mis eesti murretes esinevad, on levinud ka neil vahetutel kontaktaladel ning uurijate jaoks on see oluline informatsioon. Töö tulemusena tekib piisavalt suur ning hõlpsalt veebi kaudu kasutatav andmebaas, mida asjahuvilistel on hõlpus kasutada. Murdekorpuse tekstidest on võimalik otsida nii korpuslingvistiliste töövahenditega kui veebipõhiselt (www.murre.ut.ee/murdekorpus), samuti on uurijate kasutuses märgendusprogrammiga Liivike seotud otsivõimalused. Murdekorpuse foneetilises transkriptsioonis tekstid on kättesaadavad eesti murrete ja sugulaskeelte arhiivi kaudu, selle kaudu on võimalik neid tekste ka kuulata. (Vt www.murre.ut.ee/arhiiv) Morfoloogiliselt märgendatud tekstide kasutamiseks arendatakse edasi murdekorpuse veebipõhist otsimootorit. Otsimootorit uuendatakse ning muudetakse kasutajasõbralikumaks, lisaks tekstidest otsimisele lisatakse võimalus ka otsitavat nähtust sisaldavaid tekstilõike kuulata ning andmeid ka kaardina kuvada. Lisaks murdekorpuse täiendamisele ning otsimootorile on kavas pidevalt ajakohastada murdekorpuse kodulehekülge. Kavas on koostada murdeid tutvustav nii kooliõpilastele kui üliõpilastele suunatud populaarteaduslik veebilehekülg, mille peamine eesmärk on tekitada huvi murrete ja eesti keele vastu laiemalt. Veebilehekülg sisaldab informatsiooni murrete kohta, esitab olulisemad murrete erijooned, võimaldab lugeda ja kuulata tekstinäiteid, vaadata videolõike jms.