"Riiklik programm: Eesti keele keeletehnoloogiline tugi" projekt EKKTT09-63
EKKTT09-63 "Lihtlause semantiline analüüs 2 (1.01.2009−31.12.2010)", Haldur Õim, Tartu Ülikool, Filosoofiateaduskond.
EKKTT09-63
Lihtlause semantiline analüüs 2
1.01.2009
31.12.2010
Riiklik programm: Eesti keele keeletehnoloogiline tugi
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus50,0
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP170 Arvutiteadus, arvutusmeetodid, süsteemid, juhtimine (automaatjuhtimisteooria)1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)50,0
AsutusRollPeriood
Tartu Ülikool, Filosoofiateaduskondkoordinaator01.01.2009−31.12.2010
PerioodSumma
01.01.2009−31.12.2009602 240,00 EEK (38 490,15 EUR)
01.01.2010−31.12.2010520 000,00 EEK (33 234,06 EUR)
71 724,21 EUR

See projekt on jätkuprojektiks projektile "Lihtlause semaniline analüüs", 2006-2008, ning põhieesmärgiks on riikliku programmi järelejäänud 2 aasta jooksul lahendada ülesanded, mis eelmise projekti käigus jäid poolikuks ning millede lahendamine tekitaks teatud tervikmudeli - nii kontseptuaalses kui tehnilises mõttes - eesti keele lihtlause (nagu see oli määratletud eelmises projektis) semantilise analüüsi edasiarendamise alusena. Neiks edasiarendusteks peaksid tulevikus olema analüüsi laiendamiine keerulisema struktuuriga (nt lauselühendeid, s.t mitut predikaati sisaldavatele) lihtlausetele ja edasi samm-sammult liitlausetele, nt erinevat semantilist tüüpi kõrvallauseid (et-kõrvallaused, kui-kõrvallaused jne) sisaldavatele lausetele, kuni lõpuks mitmelauseliste tekstide kui semantiliste makrostruktuuride analüüsini välja, kaasa arvatud sõnade semantilise sisestruktuuri ja lausetevaheliste järeldussuhete arvestamine. Konkreetselt on siinsel 2-aastasel projektil järgmised alleesmärgid. 1. Lause prediaadist sõltuvate argumentide semantiliste rollide automaatne määratlemine. Lause argumentstruktuuri saame süntaktilise analüüsi mooduli väljundist, kuid semantilisele struktuurile üleminekuks tuleb argumentidele omistada semantilised rollid, mida nad vastavas sündmuses täidavad: nt predikaadiga 'viima' moodustatud lauses võib olla Agent, Object, Instrument, Locfrom (kust), Locto (kuhu) jne. Rollide automaatseks määratlemiseks tuleb meid huvitava predikaadi iga võimaliku rolli juures esitada vähemalt kaht liiki inormtsiooni:1) rolli võimaliku täitja semantiline iseloomustus (eelkõige semaniline kategooria/ kategooriad, nt Elusolend, Füüsiine Objekt, Vedelik jne, aga tihti on vaja ka lisainfot,nt mitte iga Füüsiline objekt ei saa veereda, oluline on ka objekti kuju jne) ja 2) rolli täitva väljendi morfoloogiline iseloomustus, nimisõnade puhul nt võimalikud käänded, kaassõnad. Praegu on tehtud teatud eeltööd ja esialgseid katseid, kuid süsteemne materjal ja arvutipogramm puuduvad. 2. Lausest järelduste tegemise programmi täiustamine. Lause tähendus ei piirdu teatavasti selles vahetult öelduga, sellesse kuulub ka järelduv info (kui teadmine, mille lause vastuvõtja saab ja millega arvestab kui kehtivaga). Eriti oluliseks muutubki see aspekt, kui üksiklihtlausetelt minna edasi liitlausete ja lõpuks eriti teksti analüüsi juurde. Et meie valdkonnaks on liikumis- ja liigutamissündmused, siis tuvastab praegune järeldusprogramm lauses need entiteedid, mis liiguvad (erinevate predikaatide puhul on need erinevad) ja fikseerib liikuva entiteedi asukoha pärast liikumissündmust. Kuid järelduste kaudu on võimalik tuvastada muudki infot, muudel alustel. Nii on võimalik ühe lause poolt esitatava sündmuse raames teha ühtede rollide esinemise põhjal järeldusi teiste rollide obligatoorsuse, võimalikkuse või võimatuse kohta (mis arvutianalüüsis on rollide määratlemises vägagi oluline piiranguid seadev info). Näiteks on omavahel seotud Agendi (kui tahtliku tegija), Goal-i (eesmärgi) ja Instrumendi rollid: kaks viimast eeldavad esimese olemasolu. Teine tüüp meid huvitavaid järeldusi seostub vastavas sündmuses osalevate entiteetide ontoloogiaga (maailmateadmuslike omadustega). Näiteks lausest "Poiss viskas kivi tänavale" järeldub, ja nt tekstis vastuvõtja arvestab sellega, et kivi on tänaval, kuni ei tule infot, et keegi/miski selle sealt mujale liigutas. Kuid lause puhul "Poiss viskas kivi õhku" selline järeldussituatsioon ei kehti. Niisugune sõnade, lausete, eriti aga teksti maailmateadmusliku/ontoloogilise aspekti arvestamine on vähemalt lausesemantikast alates, aga tekstisemantikas igal juhul vältimatu.Ja ontoloogiatele orienteeritud lähenemise roll keeletehnoloogias kasvab pidevalt, see on teatud mõttes reaalsete rakenduste alus (v nt semantilise veebi aregut).

Vastutav täitja (1)

IsikKraadTöökoht ja ametCVOsalemise periood
Haldur ÕimdoktorikraadTartu Ülikool, Filosoofiateaduskond, Eesti ja soome-ugri keeleteaduse osakond; erakorraline vanemteadur (1.00);EST / ENG01.01.2009−31.12.2009

Põhitäitjad (7)

IsikKraadTöökoht ja ametCVOsalemise periood
Neeme Kahuskmagistrikraad (teaduskraad)Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut; Teadur (1.00);EST / ENG01.06.2009−31.12.2010
Erkki LuukdoktorikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, Keeletehnoloogia õppetool; semantika spetsialist (1.00);EST / ENG01.07.2009−31.12.2010
Helen Nigolmagistrikraad (teaduskraad)Tartu Ülikool, Tartu Ülikooli Raamatukogu; referent (1.00);EST / ENG01.01.2010−31.12.2010
Siim OrasmaadoktorikraadEST / ENG01.01.2009−31.05.2010
Heili OravdoktorikraadTartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut, Üldkeeleteaduse osakond; Teadur (1.00);EST / ENG01.01.2009−31.12.2010
Piia TaremaadoktorikraadTartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut, Üldkeeleteaduse osakond; spetsialist (1.00);EST / ENG01.01.2009−31.12.2010
Karol ToompalumagistrikraadEST / ENG01.10.2009−31.03.2010

Projektiga seotud tööjõud (3)

IsikKraadAsutusAmetKoormusKoormus väljaspoolOsalemise periood
ProjektisKoormus väljaspool
Kaarel Kaljurandteadur0,50,501.01.2009−31.12.2010
Urve Talvikspetsialist0,2101.01.2009−31.12.2010
Urve Talvikspetsialist0,2101.01.2010−31.12.2010
Publikatsioonid
Publikatsioonid
Õim, H.; Orav, H.; Taremaa, P. (2009). Lihtlause semantika: teoreetiline kontseptsioon ja arvutianalüüsi võimalused. Keel ja Kirjandus, 7, 489−504.
Harbusch, K.; Koit, M.; Õim, H. (2009). A Comparison of Clausal Coordinate Ellipsis in Estonian and German: Remarkably Similar Elision Rules Allow a Language-Independent Ellipsis-Generation Module. Proceedings of the Demonstrations Session: The 12th Conference of the European Chapter of the Association for Computational Linguistics (EACL-09), Ateena, 30. märts - 3. aprill 2009. Ed. Kreutel, J. Athens, Greece: Association for Computational Linguistics, 25−28.
Koit, M.; Roosmaa, T.; Õim, H. (2009). Knowledge representation for human-machine interaction. Proceedings of the International Conference on Knowledge Engineering and Ontology Development: International Conference on Knowledge Engineering and Ontology Development, Madeira (Portugal), 6-8 October 2009. Ed. Ed. Jan L.G. Dietz. Portugal: INSTICC, 396−399.
Luuk, E. (2010). Nouns, verbs and flexibles: implications for typologies of word classes. Language Sciences, 32, 349−365.10.1016/j.langsci.2009.02.001.
Luuk, E. (2009). The noun/verb and predicate/argument structures. Tartu: Tartu University Press.
Koit, M.; Õim, H. (2009). Euroopa arvutilingvistika konverentsil. Keel ja Kirjandus, 724−725.
Luuk, E. (2009). The noun/verb and predicate/argument structures. Lingua, 119 (11), 1707−1727.10.1016/j.lingua.2009.02.009.
Õim, Haldur; Orav, Heili; Taremaa, Piia (2010). Lausesemantikast üldkeeleteaduse ja eesti keele kontekstis. Emakeele Seltsi Aastaraamat (201−223).. Tallinn: Teaduste Akadeemia Kirjastus.
Orav, Heili; Õim, Haldur; Kerner, Kadri; Kahusk, Neeme (2010). Main trends in semantic-research in Estonian language technology. Baltic HLT Proceedings: Human Language Technologies — the Baltic Perspective; Riga, Latvia; October 7–8, 2010. IOS Press, 201−207. (Frontiers in Artificial Intelligence and Applications).10.3233/978-1-60750-641-6-201.
Õim, Haldur; Orav, Heili; Kahusk, Neeme; Taremaa, Piia (2010). Semantic analysis of sentences: the Estonian experience. Baltic HLT Proceedings, 219: Human Language Technologies — the Baltic Perspective; Riga, Latvia; October 7–8, 2010. IOS Press, 208−213. (Frontiers in Artificial Intelligence and Applications).10.3233/978-1-60750-641-6-208.
Luuk, E. (2010). Struktuuride nimisõna/verb ja lingvistiline predikaat/argument evolutsioon. Keel ja Kirjandus, 6, 407−418.
Luuk, E. (2010). Linguistic arguments probably antedate linguistic predicates. In: The evolution of language (230−237).. New Jersey etc.: World Scientific.
Juhendamised
Juhendamised
Heili Orav, doktorikraad, 2006, (juh) Haldur Õim; Urmas Sutrop, Isiksuseomaduste sõnavara semantika eesti keeles, Tartu Ülikool, Filosoofiateaduskond, Eesti ja soome-ugri keeleteaduse osakond.
Ann Veismann, magistrikraad (teaduskraad), 2000, (juh) Haldur Õim, Aega väljendavad ruumimetafoorid : teoreetiline mudel ja rakendus eesti keelele, Tartu Ülikool, Filosoofiateaduskond, Eesti ja soome-ugri keeleteaduse osakond.
Kadri Vider, magistrikraad, 1999, (juh) Haldur Õim, Sagedasemad eesti verbid semantilises andmebaasis, Tartu Ülikool, Filosoofiateaduskond, Eesti ja soome-ugri keeleteaduse osakond.
Heili Orav, magistrikraad, 1998, (juh) Eesti keele direktiivverbide semantilise välja struktuur tesaurusena, Tartu Ülikool, Filosoofiateaduskond, Eesti ja soome-ugri keeleteaduse osakond.
Elo Rohult, (juh) Haldur Õim, Metafoorid teadustekstides, Tartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut, Üldkeeleteaduse osakond, Üldkeeleteaduse õppetool.
Kadri Vider, (juh) Haldur Õim, Eesti verbide tähenduse eristamise võimalused korpustes leksikaalsüntaktilise informatsiooni põhjal, Tartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut, Üldkeeleteaduse osakond, Üldkeeleteaduse õppetool.
Erkki Luuk, doktorikraad, 2009, (juh) Haldur Õim, The noun/verb and predicate/argument structures (Nimisõna/verb ja predikaat/argument struktuurid), Tartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut, Üldkeeleteaduse osakond.
Ann Veismann, doktorikraad, 2009, (juh) Haldur Õim, Eesti keele kaas- ja määrsõnade semantika võimalusi, Tartu Ülikool.