"Sihtfinantseerimine" projekt SF0180078s08
SF0180078s08 "Loomulike keelte arvutitöötluse formalismide ja efektiivsete algoritmide väljatöötamine ning eesti keelele rakendamine (1.01.2008−31.12.2013)", Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.
SF0180078s08
Loomulike keelte arvutitöötluse formalismide ja efektiivsete algoritmide väljatöötamine ning eesti keelele rakendamine
Development and implementation of formalisms and efficient algorithms of natural language processing for the Estonian language
1.01.2008
31.12.2013
Teadus- ja arendusprojekt
Sihtfinantseerimine
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP170 Arvutiteadus, arvutusmeetodid, süsteemid, juhtimine (automaatjuhtimisteooria)1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)50,0
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus50,0
PerioodSumma
01.01.2008−31.12.20081 822 500,00 EEK (116 478,98 EUR)
01.01.2009−31.12.20091 680 096,00 EEK (107 377,71 EUR)
01.01.2010−31.12.20101 523 900,00 EEK (97 394,96 EUR)
01.01.2011−31.12.2011101 290,00 EUR
01.01.2012−31.12.2012101 290,00 EUR
01.01.2013−31.12.2013101 290,00 EUR
625 121,65 EUR

Taotletava projekti eesmärk on töötada välja eesti keele arvutitöötluseks sobivad, teoreetiliselt põhjendatud formalismid ja algoritmid erinevatel keeletasanditel, lähtudes varasemate uuringute tulemustest. Analüüsitakse ja modelleeritakse eesti keele muutusi leksikonitasandil, et tagada keele arvutitöötluse vahendite toimetulek tegeliku keelekasutusega. Uuritakse lause süvastruktuuri esitamise formalisme, et pindanalüüsilt üle minna süvaanalüüsile, ning lausete ja sidustekstide semantilise esituse konstrueerimiseks vajalikke kontseptuaalseid ja formaalseid vahendeid, mis sobiksid eesti keelele. Uuritakse intelligentsete kasutajaliideste loomise teoreetilisi probleeme ja suhtluse sujuvuse tagamise vahendeid eesti keeles. Selgitatakse masintõlke strateegiaid ja formalisme, mis oleksid optimaalsed vaba sõnajärje ja rikka morfoloogiaga lähte- ja/või sihtkeele puhul. Projekti tulemused aitavad tõhustada eesti keele keeletehnoloogilise toe loomist.
The goal of the proposed project is to develop theoretically sound formalisms and algorithms for various levels of language that would be suitable for the computational processing of the Estonian language. The linguistic changes of the Estonian language will be analysed and modelled on the lexical level to guarantee that the tools of the computational processing of the language cope with the actual language use. The formalisms for representing the deep structure of the sentence will be studied in order to move from surface analysis to deep analysis; various conceptual and formal means for the semantic representation of individual sentences, as well as the discourse, will be assessed as to their applicability to the Estonian language. The theoretical problems of dialogue modelling will also be studied. The strategies and formalisms of machine translation best suited in the case of a source and/or target language with free word order and rich morphology will be determined.