See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Riiklik programm: Eesti keele keeletehnoloogiline tugi (EKKTT)" projekt EKKTT06-3
EKKTT06-3 "Leksikograafi töökeskkond" (1.01.2006−31.12.2010); Vastutav täitja: Ülle Viks; Eesti Keele Instituut; Finantseerija: Haridus- ja Teadusministeerium; Eraldatud summa: 411 155 EUR.
EKKTT06-3
Leksikograafi töökeskkond
1.01.2006
31.12.2010
Teadus- ja arendusprojekt
Riiklik programm: Eesti keele keeletehnoloogiline tugi (EKKTT)
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus100,0
AsutusRollPeriood
Eesti Keele Instituutkoordinaator01.01.2006−31.12.2010
PerioodSumma
01.01.2006−31.12.2006700 000,00 EEK (44 738,15 EUR)
01.01.2007−31.12.2007700 000,00 EEK (44 738,15 EUR)
01.01.2008−31.12.20081 570 000,00 EEK (100 341,29 EUR)
01.01.2009−31.12.20091 863 180,00 EEK (119 078,91 EUR)
01.01.2010−31.12.20101 600 000,00 EEK (102 258,64 EUR)
411 155,14 EUR

PROJEKTI EESMÄRGID JA TÄHTSUS (kuni 1 lk) : Eelkäijad ja eesmärgid Projekti eelkäijateks on kaks varasemat allprojekti programmist Eesti keel ja rahvuslik mälu: (1) Keeletehnoloogia. Tarkvara rakendusalad: Leksikograafi töövahendid ja (2) Tänapäeva eesti keele baassõnastikud: Eesti–X-keele sõnastik. Projektil on kaks põhieesmärki: 1. Luua leksikograafidele sobiv interaktiivne töökeskkond, st töövahendid, mis ühilduvad kehtiva rahvusvahelise märgistusstandardiga (XML) ja rakendavad nii universaalseid kui ka eesti keele põhiseid keeletehnoloogia vahendeid: keeleressursse (elektroonilisi sõnastikke, andmebaase, tekstikorpusi) ja keeletarkvara (morfoloogia, sõnamoodustuse, süntaksi, semantika programme). Uues töökeskkonnas on võimalik luua uusi elektroonilisi sõnastikke mitmeks eri otstarbeks: nii tavalisele sõnastikukasutajale kui ka keeletehnoloogia sisetarbeks. 2. Koostada eesti lähtekeele andmebaas kakskeelsete sõnaraamatute jaoks ehk Eesti–X-keele sõnastik (= EXS). Seni on seda ülesannet teatud määral täitnud EKI-s koostatava suure Eesti-vene sõnaraamatu eesti pool, mida on kasutatud eesti-läti ja eesti-prantsuse sõnaraamatute projektides. See baas on aga liigselt mõjutatud vene keelest, vaja on universaalset baassõnastikku, mis ei sõltu vastete keelest. Ideaalse kakskeelse sõnastiku aluseks on kaks iseseisvat ükskeelset andmebaasi, mille vahel konkreetse sõnaraamatu koostamise käigus luuakse vajalikud seosed (Atkins 2002). Lähteseis Eelnevate projektide käigus on tehtud eeltöid mõlema eesmärgi suunas. 1. On välja töötatud sõnastike haldussüsteemi (Loopmann jt) esialgsed veebirakendused (XML-editori tüüpversioonid) ükskeelse sõnastiku toimetamiseks (ÕS 2006) ja kakskeelse sõnastiku koostamiseks-toimetamiseks (Eesti-vene sõnaraamatu 4. köide). Kummagi sõnastiku lähtetekstid on teisendatud XML-vormingusse ja on loodud vastavad XML-skeemid. 2. On koostatud EXS-i jaoks keskmise mahuga märksõnastik (40 000), olemasolev andmestik on teisendatud XML-vormingusse ja on loodud XML-skeem. Välja on töötatud süntaktilise info lisamise põhimõtted (Langemets jt). Ülesanded 1. Leksikograafi töökeskkond luuakse kahes järgus. Minimaalne konfiguratsioon (sõnastike haldussüsteem) koosneb järgmistest moodulitest: • sõnastike eeltöötlus: olemasolevate (sageli muus vormingus) sõnastike teisendamine XML-vormingusse ja XML-skeemi (struktuurikirjelduse) loomine; • sõnastiku leksikograafiline töötlus: sõnaartiklite koostamine ja toimetamine (XML-editor); • struktuuripõhised päringud üle sõnastiku; • sõnastikuteksti eksport küljendusvormingusse (nt MS Word); • rühmatöö haldamine veebis. Laiendatud konfiguratsioon (leksikograafi töökeskkond) võimaldab lisaks eelnevale: • genereerida sõnaartiklisse morfoloogilisi kirjeid vastavalt sõnastikutüübile; • teha päringuid muudes sõnastikes ja andmebaasides ning importida sobivaid infoelemente; • teha päringuid tekstikorpustes ja importida näideteks sobivaid tekstilõike. 2. Töö EXS-iga kulgeb kahes suunas: (a) koostamisvahendi arendamine vastavalt EXS-i erivajadustele (elemendipõhine koostamine), (b) sõnastikuressursi loomine. Ressursi poolelt on kavas: • erimahuliste (väike, keskmine ja suur) sõnastikustandardite koostamine, mis erinevad nii märksõnade arvu poolest kui ka sõnastikuinfo valiku ja ulatuse poolest; • leksikaalse info lisamine sisuliste struktuurielementide kaupa: hääldus, morfoloogia, süntaks, semantika, pragmaatika jne. Kirjandus Atkins, B.T.S. (2002). Then and Now: Competence and Performance in 35 Years of Lexicography. – The Tenth EURALEX International Congress (Copenhagen – Denmark. August 13-17, 2002. Proceedings. Vol I: 1–28. Langemets, M., Mägedi, M., Viks, Ü. (2005). Süntaktiline info sõnastikus: probleeme ja väljavaateid. – Eesti Rakenduslingvistika Ühingu aastaraamat 1 (2004). Koostaja Margit Langemets, toimetaja Maria-Maren Sepper. Eesti Keele Sihtasutus. Tallinn: 71–98. Loopmann, A., Sein, K., Viks, Ü. (2006). Sõnastike haldussüsteem Eesti Keele Instituudis. – Keel