"Riiklik programm: Eesti keele keeletehnoloogiline tugi" projekt EKKTT09-63
EKKTT09-63 "Lihtlause semantiline analüüs 2 (1.01.2009−31.12.2010)", Haldur Õim, Tartu Ülikool, Filosoofiateaduskond.
EKKTT09-63
Lihtlause semantiline analüüs 2
1.01.2009
31.12.2010
Teadus- ja arendusprojekt
Riiklik programm: Eesti keele keeletehnoloogiline tugi
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus50,0
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP170 Arvutiteadus, arvutusmeetodid, süsteemid, juhtimine (automaatjuhtimisteooria)1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)50,0
AsutusRollPeriood
Tartu Ülikool, Filosoofiateaduskondkoordinaator01.01.2009−31.12.2010
PerioodSumma
01.01.2009−31.12.2009602 240,00 EEK (38 490,15 EUR)
01.01.2010−31.12.2010520 000,00 EEK (33 234,06 EUR)
71 724,21 EUR

See projekt on jätkuprojektiks projektile "Lihtlause semaniline analüüs", 2006-2008, ning põhieesmärgiks on riikliku programmi järelejäänud 2 aasta jooksul lahendada ülesanded, mis eelmise projekti käigus jäid poolikuks ning millede lahendamine tekitaks teatud tervikmudeli - nii kontseptuaalses kui tehnilises mõttes - eesti keele lihtlause (nagu see oli määratletud eelmises projektis) semantilise analüüsi edasiarendamise alusena. Neiks edasiarendusteks peaksid tulevikus olema analüüsi laiendamiine keerulisema struktuuriga (nt lauselühendeid, s.t mitut predikaati sisaldavatele) lihtlausetele ja edasi samm-sammult liitlausetele, nt erinevat semantilist tüüpi kõrvallauseid (et-kõrvallaused, kui-kõrvallaused jne) sisaldavatele lausetele, kuni lõpuks mitmelauseliste tekstide kui semantiliste makrostruktuuride analüüsini välja, kaasa arvatud sõnade semantilise sisestruktuuri ja lausetevaheliste järeldussuhete arvestamine. Konkreetselt on siinsel 2-aastasel projektil järgmised alleesmärgid. 1. Lause prediaadist sõltuvate argumentide semantiliste rollide automaatne määratlemine. Lause argumentstruktuuri saame süntaktilise analüüsi mooduli väljundist, kuid semantilisele struktuurile üleminekuks tuleb argumentidele omistada semantilised rollid, mida nad vastavas sündmuses täidavad: nt predikaadiga 'viima' moodustatud lauses võib olla Agent, Object, Instrument, Locfrom (kust), Locto (kuhu) jne. Rollide automaatseks määratlemiseks tuleb meid huvitava predikaadi iga võimaliku rolli juures esitada vähemalt kaht liiki inormtsiooni:1) rolli võimaliku täitja semantiline iseloomustus (eelkõige semaniline kategooria/ kategooriad, nt Elusolend, Füüsiine Objekt, Vedelik jne, aga tihti on vaja ka lisainfot,nt mitte iga Füüsiline objekt ei saa veereda, oluline on ka objekti kuju jne) ja 2) rolli täitva väljendi morfoloogiline iseloomustus, nimisõnade puhul nt võimalikud käänded, kaassõnad. Praegu on tehtud teatud eeltööd ja esialgseid katseid, kuid süsteemne materjal ja arvutipogramm puuduvad. 2. Lausest järelduste tegemise programmi täiustamine. Lause tähendus ei piirdu teatavasti selles vahetult öelduga, sellesse kuulub ka järelduv info (kui teadmine, mille lause vastuvõtja saab ja millega arvestab kui kehtivaga). Eriti oluliseks muutubki see aspekt, kui üksiklihtlausetelt minna edasi liitlausete ja lõpuks eriti teksti analüüsi juurde. Et meie valdkonnaks on liikumis- ja liigutamissündmused, siis tuvastab praegune järeldusprogramm lauses need entiteedid, mis liiguvad (erinevate predikaatide puhul on need erinevad) ja fikseerib liikuva entiteedi asukoha pärast liikumissündmust. Kuid järelduste kaudu on võimalik tuvastada muudki infot, muudel alustel. Nii on võimalik ühe lause poolt esitatava sündmuse raames teha ühtede rollide esinemise põhjal järeldusi teiste rollide obligatoorsuse, võimalikkuse või võimatuse kohta (mis arvutianalüüsis on rollide määratlemises vägagi oluline piiranguid seadev info). Näiteks on omavahel seotud Agendi (kui tahtliku tegija), Goal-i (eesmärgi) ja Instrumendi rollid: kaks viimast eeldavad esimese olemasolu. Teine tüüp meid huvitavaid järeldusi seostub vastavas sündmuses osalevate entiteetide ontoloogiaga (maailmateadmuslike omadustega). Näiteks lausest "Poiss viskas kivi tänavale" järeldub, ja nt tekstis vastuvõtja arvestab sellega, et kivi on tänaval, kuni ei tule infot, et keegi/miski selle sealt mujale liigutas. Kuid lause puhul "Poiss viskas kivi õhku" selline järeldussituatsioon ei kehti. Niisugune sõnade, lausete, eriti aga teksti maailmateadmusliku/ontoloogilise aspekti arvestamine on vähemalt lausesemantikast alates, aga tekstisemantikas igal juhul vältimatu.Ja ontoloogiatele orienteeritud lähenemise roll keeletehnoloogias kasvab pidevalt, see on teatud mõttes reaalsete rakenduste alus (v nt semantilise veebi aregut).