"Eesti Teadusfondi uurimistoetus" projekt ETF8222
ETF8222 "Ülekantud tähenduses fraasid eesti keele korpustes (1.01.2010−31.12.2013)", Katre Õim, Tallinna Ülikool, Eesti Keele ja Kultuuri Instituut.
ETF8222
Ülekantud tähenduses fraasid eesti keele korpustes
Idiomatic Phrases in Estonian Language Corpora
1.01.2010
31.12.2013
Teadus- ja arendusprojekt
Eesti Teadusfondi uurimistoetus
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH353 Leksikoloogia 6.2. Keeleteadus ja kirjandus100,0
PerioodSumma
01.01.2010−31.12.2010192 000,00 EEK (12 271,04 EUR)
01.01.2011−31.12.201112 271,20 EUR
01.01.2012−31.12.201212 271,20 EUR
01.01.2013−31.12.201312 271,20 EUR
49 084,64 EUR

Projekti eesmärk on uurida võimalusi ja otsida meetodeid, mis aitaks olemasolevatest eesti keele korpustest võimalikult tulemuslikult leida ülekantud tähenduses fraase. Ülekantud tähenduses fraaside all peetakse silmas nii sõnaühendeid kui ka liitsõnu, mille tähendus ei tulene komponentide tähenduste summast, vaid kujutab endast n.ö uut kvaliteeti, ja mis on keeles kinnistunud. Projekti käigus rakendatakse seniseid uurimistulemusi: eelkõige Eesti kõnekäändude ja fraseologismide andmebaasi (http://www.folklore.ee/justkui), Eesti kõnekäändude ja fraseologismide mõistestiku (http://www.folklore.ee/justkui/moiste.php) ning Eesti fraseologismide elektroonilise alussõnastiku loomise käigus kujunenud üldpilti sellest, mida kujutab endast eesti fraseoloogia: milline on fraseologismide morfosüntaktiline ehitus, milliste tegurite koostoimes kujuneb fraseologismide tähendus, Kuna nimetatud keeleüksuste ülesehitus ja leksikaalne koosseis on äärmiselt varieerumisaltid, on idiomaatiliste fraaside leidmine nii paberkandjal sõnaraamatutest kui ka elektroonilistest keelekorpustest raskendatud – teada tuleb kas fraseologismi täpset vormi, selles sisalduvaid sõnu või fraseologismi tähendust. Pidades silmas eesmärki luua nii keeleuurijate (kellel on vajadused ja oskused korpusi põhjalikult töödelda) kui ka tavakasutajate (kes otsivad korpustest põhiliselt kasutusnäiteid) jaoks uusi võimalusi leida nimetatud allikatest fraseologisme, on hädavajalik alustada fraaside struktuurimustrite ja ülekantud tähenduse vaheliste suhete ja korrapära uurimist. Arvestades seda, et Eesti kõnekäändude ja fraseologismide andmebaasi materjal pärineb suures osas 19. saj lõpust ja 20. saj esimesest poolest, ei ole seni tekkinud süsteemset üldpilti tänapäeva eesti keeles levivast ülekantud tähenduses keeleainesest. Paljud eesti keele korpused (vt http://www.cl.ut.ee/korpused/), s.h Eesti keele koondkorpus (plaanitud mahuga 200 miljonit sõna, http://www.cl.ut.ee/korpused/segakorpus/index.php?lang=et), Eesti vahekeelekorpus (http://evkk.tlu.ee/) jm sisaldavad aga juba ka 21. sajandi ning interneti keelekasutuse tekste. Selle materjali uurimine näitab, milliseid fraseologisme kasutatakse tänapäeva eesti keeles, kui palju on nende hulgas juba ammu tuntud ütlusi, kui palju nn uusi fraseologisme, kas need kaks väljendirühma on tekkemehhanismidelt täiesti sarnased või on nende vahel ka erinevusi, millised kvalitatiivsed nihked on täheldatavad fraseologismide tähenduste ja sisukategooriate kasutamises.
The objective of the project is to search for solutions and methods that would render the identification of idiomatic phrases in Estonian language corpora as efficient as possible. Idiomatic phrases include word combinations and compound words the meaning of which is not derived from the sum of the meanings of the phrase’s components but represents the new quality, and which have become fixed in language. The project relies on the results of research carried out so far, and mainly on the general understanding of the nature of Estonian phraseology, obtained in the course of compiling the database of Estonian phrases (http://www.folklore.ee/justkui), the lexicon of Estonian phrases (http://www.folklore.ee/justkui/moiste.php) and the electronic base dictionary: namely, the morphosyntactic structure of phrases and the factors which combination shapes the meaning of fixed phrases and idioms. Since the structure and lexical composition of the said language units are highly prone to variation, the identification of idiomatic phrases in printed dictionaries and electronic language corpora is rather complicated: to find a specific phrase one must know its exact form, the words it contains or the meaning of the idiom or a fixed phrase. As our aim is to search for new solutions and methods for facilitating the search for idiomatic expressions in the said sources for researchers of language (who have the needs and possess the skills to process the corpora in detail) and for common users (who mostly search for idiomatic uses of the phrases), it is vital that research into the relationships and regularities of the structural patterns and figurative or metaphorical meanings of the phrases is undertaken. The material included in the database of Estonian phrases, for the most part, dates back to the end of the 19th century and the first half of the 20th century. Owing to this fact, there is still no systematic overview of the distribution of metaphorical material in the Estonian language. Many Estonian language corpora already include texts from the 21st century and online language usage. The study of this material shows the use of idiomatic phrases in the Modern Estonian language, the number of established phrases among these and the number of new idiomatic expressions, the similarities and dissimilarities between these two groups of phrases, and the qualitative shifts that can be noticed in the use of the meanings of the idioms and fixed phrases and content categories.