See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Riiklik programm: Eesti keel ja kultuurimälu" projekt EKKM14-315
EKKM14-315 "Eesti keele kollokatsioonisõnaraamat (1.01.2014−31.12.2018)", Jelena Kallas, Eesti Keele Instituut.
EKKM14-315
Eesti keele kollokatsioonisõnaraamat
Estonian Collocations Dictionary
1.01.2014
31.12.2018
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja kultuurimälu
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH360 Rakenduslingvistika, võõrkeelte õpetamine, sotsiolingvistika 6.2. Keeleteadus ja kirjandus100,0
AsutusRollPeriood
Eesti Keele Instituutkoordinaator01.01.2014−31.12.2018
PerioodSumma
01.01.2014−31.12.201421 200,00 EUR
01.01.2015−31.12.201524 000,00 EUR
01.01.2016−31.12.201624 000,00 EUR
01.01.2017−31.12.201724 000,00 EUR
01.01.2018−31.12.201824 000,00 EUR
117 200,00 EUR

Eesmärk on koostada eesti keele kollokatsioonisõnaraamat. Sõnastiku sihtgrupp on eesti keele õppijad (nii emakeele kui ka teise keele või võõrkeelena). Sõnastik ilmub veebis ja võimalusel ka raamatuna. Sõnastiku koostamise põhimõtete aluseks on: 1) süntagmaatiliste sõnastike koostamise leksikograafiateooriad (Atkins jt 2010; Benson 1989; Coffey 2011; Siepmann 2006; Svensén 2009); 2) seni ilmunud kollokatsioonisõnastike analüüs. Sõnastiku koostamisel on kavas rakendada võimalikult rohkem tänapäeva korpusleksikograafia võimalusi, seda eelkõige kollokatsioonide automaattuvastamisel (Kilgarriff jt 2004; Kallas 2013) ja näitelausete tasandil (heade sõnastikunäidete (Good Dictionary Example ehk GDEX) rakenduse loomisest vt Kilgarriff jt 2008; Kosem jt 2011). Sõnaartiklis on kavas esitada järgmine info: märksõna, seletus, kollokatsioonid, näitelaused. MÄRKSÕNAD Märksõnu on u 10 000, valikus arvestatakse sõnade esinemissagedust eesti keele koondkorpuses (250 mln sõnet) ja veebikorpuses etTenTen (350 mln sõnet) ja vajalikkust igapäevases elus. Materjali analüüsitakse programmi Sketch Engine abil. Eraldi analüüsitakse akadeemilises kirjutamises vajaminevat sõnavara (Metslang, Kibar 2012). TÄHENDUSE SELETUSED Tähendusinfo esitusel võetakse aluseks "Eesti keele põhisõnavara sõnastiku" (PSV 2014) ja üheköitelise eesti keele sõnaraamatu (Langemets jt 2010) tähendusjaotused ja seletused. Mõlema sõnastiku andmebaasis on igale märksõnale ja selle tähendustele lisatud semantiline tüüp, mis näitab kuuluvust teatud mõisterühma. KOLLOKATSIOONID Andmebaasi elemendid on kollokatsioon, kollokatsiooni rektsioon (vajadusel) ja näitelause. Kollokatsioonid on grupeeritud sõnaliikide ja morfoloogiliste ning süntaktiliste kategooriate alusel. Kollokatsiooniliigid on: N(S)+V nimisõna (subjekti funktsioonis) + tegusõna, nt päike tõuseb/loojub; N(O)+V nimisõna (objekti funktsioonis) + tegusõna, nt arvutit sisse lülitama / välja lülitama; N(A)+V nimisõna (adverbiaali funktsioonis) + tegusõna, nt aktsiatesse investeerima; Adj+V omadussõna + verb, nt määravaks saama/osutuma; Adv+V määrsõna + verb, nt kiiresti jooksma; N+N nimisõna + nimisõna, nt ekspertide hinnang/arvamus, kullast/hõbedast ehted; Adj+N omadussõna + nimisõna, nt hea/halb eeskuju; Adv+N määrsõna + nimisõna, nt eile hommikul/õhtul; Adv+Adj omadussõna + määrsõna, nt kergesti süttiv; Adv+Adv määrsõna + määrsõna, nt väga aeglaselt. Kollokatsioonid koondatakse ühiste tunnuste alusel semantilistesse alarühmadesse. Rühmitamise eesmärk on kergendada kasutajal materjali omandamist. NÄITELAUSED Kollokatsioonide kasutamist illustreerivad näitelaused. Kui tegemist on alarühmaga, siis esitatakse iga rühma kohta üks näitelause. Sõnastiku koostamisel on aluseks sõnastikuprofiil ehk koostamisjuhend. Sõnastiku koostamine hakkab toimuma Eesti Keele Instituudi sõnastikusüsteemis EELex (vt Langemets jt 2006), mis võimaldab töötada rühmana ja internetipõhiselt. Kirjandus Atkins, B. T. S., Kilgarriff, A., Rundell, M. 2010. The DANTE database. – Proceedings of the XIV EURALEX international congress. Leeuwarden/Ljouwent: Fryske Akademy, 293–295. Benson, M. 1989. The Structure of the Collocational Dictionary. – International Journal of Lexicography, 2, 1–4. Coffey, S. 2011. A new pedagogical dictionary of English collocations. – International Journal of Lexicography, 3, 328–342. Kilgarriff, A., Husak, M., McAdam, K., Rundell, M., Rychly, P. 2008. GDEX: Automatically finding good dictionary examples in a corpus. – Proceedings of the XIII EURALEX international congress. Barcelona: Universitat Pompeu Fabra, 425–431. Kallas, J. 2013. Eesti keele sisusõnade süntagmaatilised suhted korpus- ja õppeleksikograafias. (Doktoritöö, Tallinna Ülikool) Tallinn: Tallinna Ülikool. Kilgarriff, A., Rychly, P., Smrz, P., Tugwell, D. 2004. The Sketch Engine. – Proceedings of the 11th EURALEX international congress. Lorient, France: Université de Bretagne Sud, 105–115. Kosem, I., Husak, M., McCarthy, D. 2011. GDEX for Slovene. – Electronic lexicography in the 21st century: New applications for new users. Proceedings of eLex 2011, Bled, 10-12 November 2011. Ljubljana: Trojina, Institute for Applied Slovenian Studies, 151–159. Langemets, M., Loopmann, A., Viks, Ü. 2006. The IEL dictionary management system of Estonian. – DWS 2006: Proceedings of the 4th international workshop on dictionary writing systems. Turin: Turin University, 11–16. Langemets, M., Tiits, M., Valdre, T., Voll, P. 2010. In spe: üheköiteline eesti keele sõnaraamat. – Keel ja Kirjandus, 11, 793–810. Metslang, H., Kibar, T. 2012. Üldakadeemiline sõnavara.Tallinna Ülikool. PSV 2014 = Eesti keele põhisõnavarasõnastik. 2014. Tallinn: Eesti Keele Sihtasutus. Svensén, B. 2009. A Handbook of Lexicography. The Theory and Practice of Dictionary-Making. Cambridge: Cambridge University Press. Siepmann, D. 2006. Collocation, Colligation and Encoding Dictionaries. Part II: Lexicographical Aspects. – International Journal of Lexicography, 19, 1–39.
Projekti tulemusena on valminud veebisõnastik „Eesti keele naabersõnad 2019“. Kasutajasõbralikkuse huvides asendati sõnastiku pealkirjas keeleteaduslik termin "kollokatsioon" terminiga "naabersõnad". Sõnastik on kasutatav veebis Eesti Keele Instituudi uue keeleportaali Sõnaveeb (https://sõnaveeb.ee) osana. Sõnastiku andmebaasi põhjal on genereeritud kaks eraldi vaadet: A2 ja B1 keeleoskustasemega keeleõppijale (leitav Sõnaveebi lihtsas vaates) ning B2 ja C1 keeleoskustasemega keeleõppijale (leitav Sõnaveebi detailses vaates). Detailse vaate versioon sobib ka emakeelsele kasutajale. Sõnastikus on u 10 000 märksõna. Otsitava sõna juures on kollokatsioonid rühmitatud sõnaliikide kaupa, vastavalt sellele, kas märksõna esineb koos omadussõna, pärisnime, määrsõna, tegusõna, nimisõna või kaassõnaga. Kollokatsioonide kasutamist illustreerivad näitelaused. Kollokaadid on valitud keeles esinevate sõnade koosesinemiste statistilise analüüsi tulemusena 1,3 miljardi sõna suurusest eesti keele ühendkorpusest. Seega annab sõnastik statistiliselt põhjendatud pildi eesti keele kõnelejatele omastest keele ühisosa kajastavatest kasutusmallidest.