See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Riiklik programm: Eesti keel ja rahvuslik mälu" projekt EKRM05-46
EKRM05-46 "Leksikoloogia töövahendid (1.01.2005−31.12.2005)", Ülle Viks, Eesti Keele Instituut.
EKRM05-46
Leksikoloogia töövahendid
1.01.2005
31.12.2005
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja rahvuslik mälu
AsutusRollPeriood
Eesti Keele Instituutkoordinaator01.01.2005−31.12.2005
PerioodSumma
01.01.2005−31.12.2005300 000,00 EEK (19 173,49 EUR)
19 173,49 EUR

Projekti eesmärk on luua eesti leksikograafidele sobivad töövahendid, mis ühilduvad kehtiva rahvusvahelise märgistusstandardiga (XML) ja rakendavad nii universaalseid kui ka eesti keele põhiseid keeletehnoloogia vahendeid: keeletarkvara ja -ressursse. Keeletehnoloogia eri valdkondades on üha rohkem tarvis sisult kvaliteetseid ja hästi formaiiseeritud keeleressursse. See aga eeldab kvaliteetsete struktuuripöhiste töövahendite olemasolu selliste ressursside tekitamiseks. Lähteseis on järgmine. 1. Praeguseks on elektroonilisele kujule viidud suur osa seni Eesti Keele Instituudis loodud leksikaalsetest keeleressurssidest, sh suured bäassõnaraamatud, mitmed andmebaasid jms. Digitaliseerimist alustati juba 1977.a ja seetõttu on selles töös läbi aegade käsutatud väga mitmesuguseid vahendeid ja erinevaid põhimõtteid (vastavalt oma aja tehnilistele võimalustele). Nüüdseks on välja kujunenud ühtsed rahvusvahelised standardid (XML-märgistuskeel) ja on loodud nendel põhinevat baastarkvara (nt XML-editor). 2. Eesti keeletehnoloogias on viimasel aastakümnel loodud hulk tekstitöötluse tarkvara (nt morfoloogiline analüüs ja süntees, morfoloogiline ühestamine, süntaktiline analüüs jne) ning keeleressursse (nt märgendatud tekstikorpused, elektroonilised sõnastikud, keeleandmebaasid jne). Nende käsutamine sõnastiku koostamise käigus võimaldaks seda protsessi oluliselt kiirendada ja tõsta töö kvaliteeti. 3. EKl-s on käsutusel poolautomaatne grammatiline kirjegeneraator morfoloogilise info lisamiseks sõnaartiklisse, kuid suurem osa uutest võimalustest on seni rakendamata. Leksikograafias on vaja saavutada uus tehniline tase. Ülesanded. Leksikograafidel tuleb vähemalt mõnda aega paralleelselt tegelda kähe eri tööga: (a) olemasolevate sõnastike struktureerimise ja standardiseerimisega - et saada kogu varem arvutisse viidud materjal ühtsesse vormingusse - ja (b) uute sõnastike koostamisega, mis oleksid algusest peale tehtud uute nõuete kohaselt. Sellest tulenevalt koosneb leksikograafi töövahendite komplekt kolmest komponendist: 1) olemasolevate sõnastike jaoks: vahendid sõnastiku struktuurianalüüsiks ning teisendamiseks XML- vormlngusse; 2) uute sõnastike jaoks: vahendid sõnastiku lähtematerjali (tekstide, leksikograafiliste allikate jne) töötlemiseks, sh teksti eeltöötlus, lemmatiseerimine v morfoloogiline analüüs, näitematerjali valik, ulatuslik sõnastikepäring jne; 3) kõigi sõnastike jaoks: XML-editor, mille põhimooduiid vastavad sõnastiku koostamise etappidele: sisestamine, infopäringud üle sõnastiku, toimetamine, parandamine, küljendus jne; erineva struktuuriga sönastikutüübid (kakskeelsed, ükskeelsed, tekstipöhised jne) vajavad igaüks oma editori-versiooni. Projekt on seotud EK! teiste sama programmi projektidega ja selle tulemused on üheks eelduseks kõigi nende edukale valmimisele: l. 1.1. Eesti õigekeelsuse aiussõnaraamatud l. 1.1. Eesti kirjakeele seletussõnaraamat l. 1.1. Eesti-vene sõnaraamat l. 1.1. Eesti-X-keele sõnastik l. 1.2. Eesti keele etümoloogiline sõnaraamat l. 1.3. Eesti murrete sõnaraamat III 1. Eesti piiblitõlgete leksikaalne ja grammatiline andmebaas