"Riiklik programm: Eesti keel ja rahvuslik mälu" projekt EKRM05-55
EKRM05-55 (EKRM05-55) "Eesti kõnekäändude ja fraseologismide andmebaas (1.01.2005−31.12.2008)", Asta Õim, Eesti Kirjandusmuuseum.
EKRM05-55
Eesti kõnekäändude ja fraseologismide andmebaas
1.01.2005
31.12.2008
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja rahvuslik mälu
AsutusRollPeriood
Eesti Kirjandusmuuseumkoordinaator01.01.2005−31.12.2008
PerioodSumma
01.01.2005−31.12.2005100 000,00 EEK (6 391,16 EUR)
01.01.2006−31.12.2006100 000,00 EEK (6 391,16 EUR)
01.01.2007−31.12.2007100 000,00 EEK (6 391,16 EUR)
01.01.2008−31.12.2008100 000,00 EEK (6 391,16 EUR)
25 564,64 EUR

Tööl on kaks üldist eesmärki: (1) eesti kultuuri, täpsemalt aga retoorilise folkloori populariseerimine elektroonilistel andmekandjatel, (2) eesti kultuuri krestomaatiliste suurteoste sarja «Monumenta Estoniae Antiquae» lühivormide allsarja jätkamine. Eesti kõnekäändude ja fraseologismide täisteabelise andmebaasi (kogumahuga 164 000 kirjet) loomist alustati 1998. a. Tegemist on materjali eri liigitusaluste ühendiga, mis ühe lõppeesmärgi kohaselt peaks võimaldama saada informatsiooni püsiväljendite, s.o kõnekäändude, fraseologismide jm struktuuri, kasutuse, funktsiooni ja semantika kohta. Internetipõhise andmebaasi funktsioonid on järgmised: 1) andmete väljastus – andmebaas edastab andmed vastavalt päringutüübile (komplekspäringud ja loogilised avaldised), 2) andmete sisestus, muutmine, eemaldamine reaalajas, mis võimaldab samaaegselt Internetis andmeid töödelda või esitada päringuid. Andmebaasi kasutajaliides võimaldab korrigeerida arhiiviandmeid, kontrollida väljendite autentsust, ühtlustada tüpoloogiat, määratleda püsiväljendite struktuuri ja tähendust. 2005. a jaanuarikuu seisuga on kogu andmebaasi materjalist süntaktilis-semantiliselt analüüsitud 90 000 kirjet, murdekeelt on korrigeeritud 30 000 kirje ulatuses, ühtlustatud on 10 000 kõnekäänutüüpi. Kuna andmebaas on muudetud elektrooniliselt tasuta üldkasutatavaks (vt http://www.folklore.ee/justkui/ ja ka http://keeleveeb.edu.ee), siis on äärmiselt oluline, et kõnealune andmekogu saaks nii lingvistiliselt kui ka tüpoloogilis-süstemaatiliselt ammendavalt korrastatud. ETF-i ja Eesti Kultuurkapitali toel tehtud eeltööd ja analüüs andmaks väljendite kohta ka mõistelist, s.o tähendusepõhist infot, on jõudnud olulisse ühtlustamise etappi. Esitusviisi eesmärgiks on võimaldada juurdepääs kõnealusele materjalile semantilisest aspektist, arvestades eelkõige väljendite tähendust ja üldistatult ka kasutussituatsioone. See süsteem võimaldaks teha üldistavaid järeldusi eesti keeleruumis sagedamini käibivatest semantilistest teisendusmehhanismidest ja kinnistunud kognitiivsetest fenomenidest. Paralleelselt on andmebaasi loojatel kujunemas üldpilt eesti kõnekäändude/fraseologismide süntaktilisest struktuurist sõnaliigitasandil. Materjali morfoloogilis-süntaktiline märgendamine võimaldab peatselt välja tuua sagedasemad väljendimoodustusmallid – nii oleks neid edaspidi võimalik kasutada näiteks tänapäeva eesti keelt hõlmavatest korpustest püsiväljendite leidmisel. Seega on andmebaasi morfoloogilise, süntaktilise ja semantilise analüüsi tulemuste näol tegemist mahuka infoallikaga folkloristlikeks ja keeleteaduslikeks alusuuringuteks ja teaduslikeks töödeks. Kahtlemata on andmebaasi suurimaks väljundiks eesti kõnekäändude žanripõhine antoloogia. Töö lähemad eesmärgid on järgmised. 1. Lõpetada andmebaasi, s.o 74000 kirjes sisalduva püsiväljendi analüüs a) morfoloogilis-süntaktilisest aspektist, b) semantilisest aspektist (fikseerida väljatöötatud mõistestikule toetudes väljendi tähendus), c) tüpoloogilisest aspektist. Eesti kõnekäändude ja fraseologismide andmebaas on kujundkõneuurijatele praktiliseks materjaliallikaks ning selle põhjal on hõlpus valida materjali kõnekäändude paberväljaandeks. 2. Välja töötada püsiühendite semantilise esituse põhimõtted. 3. Kirjutada koondülevaade eesti kõnekäändudest. 4. Täiendada keeletehnoloogilis-tarkvaralisi vahendeid vastavalt töö eesmärkide. Töö tähtsus 1. Eesti kõnekäändude ja fraseologismide andmebaasi valmimisel oleks võimalik lõpetada akadeemilise lühivormide sarja «Monumenta Estoniae Antiquae» (Eesti vanasõnad I – IV 1980 –1988, Eesti mõistatused I – II 2001, 2002) III osa – Eesti kõnekäänud. 2. Andmebaasi eri liigitusalustelt analüüsitud materjal on tõhus alusmaterjal nii kujundkõne kui ka keeleuurijatele, seda eelkõige diakroonilisest seisukohast. 3. Väljaarendatav üldkasutatav andmebaas teenib laiemale üldsusele folkloori tutvustamise eesmärki. Sellise andmekogu praktiliseks väljundiks on olla abivahendiks leksikograafidele, tõlkijatele jt asjast huvitatuile.