"Riiklik programm: Eesti keele keeletehnoloogiline tugi" projekt EKKTT08-29
EKKTT08-29 (EKKTT08-29) "Eesti fraseologismide elektroonilise alussõnastiku loomine (1.01.2008−31.12.2010)", Katre Õim, Eesti Kirjandusmuuseum.
EKKTT08-29
Eesti fraseologismide elektroonilise alussõnastiku loomine
1.01.2008
31.12.2010
Teadus- ja arendusprojekt
Riiklik programm: Eesti keele keeletehnoloogiline tugi
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH352 Grammatika, semantika, semiootika, süntaks 6.2. Keeleteadus ja kirjandus100,0
AsutusRollPeriood
Eesti Kirjandusmuuseumkoordinaator01.01.2008−31.12.2010
PerioodSumma
01.01.2008−31.12.2008200 000,00 EEK (12 782,33 EUR)
01.01.2009−31.12.2009188 200,00 EEK (12 028,17 EUR)
01.01.2010−31.12.2010140 000,00 EEK (8 947,63 EUR)
33 758,13 EUR

Toota Eesti kõnekäändude ja fraseologismide andmebaasi materjali põhjal eesti fraseologismide mõisteline alussõnastik elektroonsel kujul. Internetis üldkasutatav alussõnastik tagaks üld- ja erisõnastikega võrreldes hõlpsama ligipääsu fraseologismidele, võimaldaks kajastada fraseologismide kõige üldisemaid suhteid ja vahekordi. Fraseologisme iseloomustab eelkõige institutsionaalsus (neid aktsepteeritakse leksikaalsete keeleüksustena (erinevate korpuste puhul on see näitaja eelkõige kvantitatiivne)), leksikogrammatiline püsivus (fraseologismide vorm on piiratud) ja mittekompositsioonilisus (komponentidel võivad fraseologismis olla oma eritähendused, mis ei välista nende esinemist muudes ühendites) (Moon 1998). Neile keeleüksustele on tunnuslik, et varieeruda võivad kõik või kõik olulised komponendid, esimene sõna või sõnaraamatutes suhteliselt vabalt lisatav märksõna, samuti tähendus, leksikaalsed suhted. Otsustamaks, millises sõnaraamatu sõnaartiklis võib fraseologism olla fikseeritud ja kirjeldatud, tuleb teada selle täpset vormi, selles sisalduvaid sõnu ja/või fraseologismi tähendust. Tihti ei õnnestu fraseologisme nimetatud formaalseid tunnuseid pidi sõnaraamatuist leida, põhiliseks takistuseks on nende suur süntaktiline ja leksikaalne paindlikkus. Projekt toetub Eesti kõnekäändude ja fraseologismide andmebaasile (lühendatult EKFA), mis sisaldab infot ligikaudu 20 000 eesti fraseologismi kohta. EKFA materjal pärineb Eesti Rahvaluule Arhiivi kõnekäänukartoteegist, põhiosa sellest on kogutud 20. sajandi esimesel poolel, hilisemad andmed piirduvad 1980ndate aastatega. Uueaegseid fraseologisme andmebaasi seni süsteemselt lisatud ei ole. Projekti rakendusliku toena kasutatakse nii elektrooniliselt kui ka paberkandjal ilmunud katalaani idioomide mõistelise sõnaraamatu (Espinal 2004) koostamispõhimõtteid. Projekti raames tehakse koostööd EKKTT projekti „Leksikograafi töökeskkond“ (vastutav täitja Ülle Viks) täitjatega. Praeguseks on rohkem kui 160 000 arhiiviteksti digitaliseeritud, käsitsi lemmatiseeritud ning märgendatud morfoloogilis-süntaktiliselt ja semantiliselt. EKFA kasutajaliides võimaldab (1) teha leksikaalseid lihtpäringuid, (2) otsida fraseologisme struktuuri järgi, (3) otsida fraseologisme üldise tähenduse järgi (eristatud on ligi 1000 põhitasandi mõistet). Andmebaasi märgendustase võimaldab koondada eri mõistetega seonduvad fraseologismid vastavatesse mõisteartiklitesse. Lisaks semantilisele infole plaanitakse anda teavet fraseologismide süntaktilise kategooria ja kasutuse kohta lingvistilistes kontekstides. Andmebaas on Internetis kasutatav aadressil http://www.folklore.ee/justkui. Andmebaasi arendamist on rahastatud sihtfinantseeritava teema nr 0032472s03 „Eesti ja teiste rahvaste folkloor: pärimus, identiteet ja globaliseerumine“ ja riikliku programmi „Eesti keel ja rahvuslik mälu“ projekti EKRM05-55 „Eesti kõnekäändude ja fraseologismide andmebaas“ raames. Eesti fraseologismide elektrooniline alussõnastik täidaks mitut funktsiooni. Sõnastikus esitatavad tänapäevaselt märgendatud (XMLis) keeleandmed ja grammatiline info moodustaksid eesti lähtekeelega tõlkesõnaraamatute fraseoloogiapoole aluse. Projekti käigus täiendatakse Eesti kõnekäändude ja fraseologismide andmebaasi tänapäevase fraseoloogilise materjaliga ja vormistatakse see vastavalt andmebaasi struktuurile. Statistiliselt esindusliku vanema ja nüüdisaegse materjali kõrvutus võimaldab selgitada nii ühe- kui ka mitmesõnaliste fraseoloogiliste üksuste tähenduse kujunemist, kujunditekkemehhanismi arenemist ja muutumist eelkõige diakroonilisest aspektist. Sõnastiku mõistepõhine esitusviis aitab kokku viia semantiliselt seotud fraseologismid: sünonüümid, antonüümid, osa-tervik jm leksikaalsetes suhetes fraseologismid. Projekti väljund oleks kasutatav EKKTT projektides "Leksikograafi töökeskkond", "Masintõlge I " ja "TÜ eesti keele tesauruse (eesti wordneti) täiendamine". Viited: Espinal, Maria Teresa 2004. Diccionari de sinonims de frases fetes. Barcelona / Val?ncia: Universitat Auton?ma de Barcelona. Servei de Publicacions / Publicacions de la Universitat de Val?ncia / Publicacions de l'Abadia de Montserrat. Moon, Rosamund 1998. Fixed Expressions and Idioms in English: a Corpus-based Approach, (Oxford Studies in Lexicography and Lexicology). Oxford University Press.