See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Riiklik programm: Eesti keel ja rahvuslik mälu" projekt EKRM04-11
EKRM04-11 "Eestikeelne infodialoog arvutiga (1.01.2004−31.12.2005)", Mare Koit, Tartu Ülikool.
EKRM04-11
Eestikeelne infodialoog arvutiga
1.01.2004
31.12.2005
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja rahvuslik mälu
AsutusRollPeriood
Tartu Ülikoolkoordinaator01.01.2004−31.12.2005
PerioodSumma
01.01.2004−31.12.2004140 000,00 EEK (8 947,63 EUR)
01.01.2005−31.12.2005175 000,00 EEK (11 184,54 EUR)
20 132,17 EUR

Seoses arvutite levikuga omandab järjest suurema tähtsuse tarkvara, mis vahendab inimese suhtlust arvutiga loomulikus keeles, sh kõne abil. Inglise jmt keele jaoks käsutatakse arvukalt kõnedialoogsüsteeme automaatsete telefoniteenuste osutamiseks erinevates valdkondades (sh reiside kavandamine, piletite reserveerimine, ülikooliastujate nõustamine). Eesti keele jaoks selline süsteem seni puudub. Projekti eesmärgiks on tarkvara väljatöötamine, mis võimaldaks eestikeelset küsimus-vastusdialoogi arvutiga inimestevahelise suhtluse reeglite kohaselt (sh täpsustavate küsimuste esitamine, tagasiside, kultuurispetsiifilised rituaalid jms). Seliise tarkvara loomiseks vajalik keeleressurss on märgendatud dialoogikorpus. Sihtprogrammi Eesti keel ja rahvuskultuur projektide Märgendatud dialoogikorpuse ioomine eesti suulise kõne korpuse baasil (2002) ja Märgendatud dialoogikorpus kui eestikeelse käsutajal i i dese alus (2003) on alustatud eesti dialoogikorpuse loomist, mille praegune maht on u 50000 dialoogiaktide tasemel märgendatud tekstisõna. Dialoogiaktide automaatse analüüsi- ja sünteesiprogrammide väljatöötamiseks ja treenimiseks on vaja suurendada korpuse mahtu vähemalt 200 000 tekstisõnani, kusjuures korpusesse tuleb lisaks praegu olemasolevatele infotelefoni- ja reisibüroodialoogidele lülitada muud liiki suulisi infodialooge (nt bussi- või lennujaama info) ning inimese ja arvuti vahel reaalselt asetleidnud või simuleeritud dialooge. Suuliste dialoogide allikaks on eesti suulise kõne korpus; inimese ja arvuti vaheliste dialoogide kogumiseks luuakse vajalik tarkvara - veebirakendused, mis võimaldavad inimestel eesti keeles suhelda kas tegeliku või simuleeritud arvutiga (nn võlur Ozi meetodil). Kohandatakse ja arendatakse varem olemasolevat dialoogiaktide märgendusskeemi, täiendatakse dialoogiaktide märgendamise tarkvara. Uuritakse dialoogiaktide automaatse tuvastamise erinevaid meetodeid (nt otsustuspuud, mis käsutavad dialoogiaktide keelespetsiifilisi morfoloogilisi, süntaktilisi, semantilisi tunnuseid, aga ka tehisnärvivõrgud, Markovi peitmudelid jmt), et valida eesti keelele sobiv formalism. Luuakse eestikeelse infodialoogi juhtimise mudel ja koostatakse vastav programm, millega lõimitakse olemasolevad või teiste keeietehnoloogiaprojektide toel loodavad eesti keele automaatse analüüsi ja sünteesi moodulid. Selle tulemusel valmib programm - eestikeelsele telefoniteenuste süsteemi prototüüp.