"Riiklik programm: Eesti keeletehnoloogia" projekt EKT85
EKT85 (EKT85) "Võru ja seto integreeritud keeleressursid (1.01.2015−31.12.2017)", Sulev Iva, Võru Instituut.
EKT85
Võru ja seto integreeritud keeleressursid
1.01.2015
31.12.2017
Teadus- ja arendusprojekt
Riiklik programm: Eesti keeletehnoloogia
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus100,0
AsutusRollPeriood
Võru Instituutkoordinaator01.01.2015−31.12.2017
PerioodSumma
01.01.2015−31.12.201534 000,00 EUR
01.01.2016−31.12.201634 000,00 EUR
68 000,00 EUR

Kui Võru ja seto keelekorpuse projektiga tehti algust võru-seto keeleressursside kogumisega ja nendest erinevate allkorpuste ülesehitamisega, siis käeosolev projekt on sammuks edasi. Projekti põhiidee on erinevate allkorpuste ja rakendustena loodud võru ja seto keeleressursside integreerimine läbi võru-eesti-võru elektroonilise sõnaraamatu, samas edasi arendades ja täiendades nii vastavaid allkorpusi kui ka neid integreerivat platvormi ehk Võru-eesti-võru elektroonilist sõnaraamatut (synaq.org). Viimane on kujunemas omalaadseks võru keele portaaliks ja on sellisena juba praegugi kättesaadavaim ja enim kasutatav võru keeleressurss. Selle külastatavus püsib stabiilselt kõrge, seda kasutavad õpilased, õpetajad, üliõpilased, tõlkijad kui ka lihtsalt keelehuvilised. Seepärast on mõistlik seda reaalsele kasutajale lähimat platvormi edasi arendada ja sellega hästi integreerida ka kõik teised loodud ja loodavad võru ja seto keeleressursid ja rakendused, mis leiaksid seeläbi tõenäoliselt enam kasutust kui muul moel. Sisutiheda, mitmekesise ja kasutajasõbraliku elektroonilise keelekeskkonna olemasolu, täiustumine ja populaarsuse tõus aitaks kindlasti kaasa võru, setu, laiemalt lõunaeesti ja kaudselt Eesti muudegi piirkonnakeelte ja murrete arendamisele ja populariseerimisele, kasutamisele ja säilimisena elavate keeletena.
Projekti tulemusena ja koostöös teiste projektidega on loodud uusi võru ja seto keeleressursse ja keeletehnoloogilisi rakendusi ning olemas olnuid täiendatud ja integreeritud ning kasutajale kättesaadavamaks muudetud. 1. Sõnaraamat ja keelekorpused - Võru-eesti sõnaraamatu baasilt on üles ehitatud uus Võru-eesti-võru veebisõnaraamat (synaq.org). Sellega on integreeritud kõik Võru ja seto keelekorpuse projektiga loodud korpused (Uma Lehe ja ajalehe Setomaa korpus, ilukirjanduskorpus ja eesti-võru paralleelkorpus, mida kõiki on täiendatud uute tekstidega). Sõnaraamatust on kujundatud keeleportaal, mis sobitub hästi ka nutiseadmetes kasutamiseks. - Korrastatud ja ühtlustatud sõnaraamatu andmebaasi, et seda mh saaks kasutada EELEXI süsteemis. - Eesti-võru sõnaraamatu helindamine. Näitelausete helindamiseks on sõnaraamatuga integreeritud võru kõnesünteesi rakendus. Sõnaraamatu salvestised on integreeritud võru keele veebiõppeprogrammiga Oahpa / Opiq võro kiilt! (http://oahpa.no/voro/leksa/), millega seoses on loodud API helikirjete ja korpuse automaatseks sidumiseks kolmandate rakendustega. 2. Eesti-võru masintõlke katserakendus - On jätkatud eesti-võru masintõlke katserakenduse edasiarendamist reeglipõhiselt, vt http://witm.voro.aader.org, lähtetekst https://github.com/aaader/witm. 3. Rahvusvaheline koostöö Eesti-Norra keeletehnoloogia projektiga "Saami-Eesti keeletehnoloogia-alane koostöö: sarnased keeled, ühesugune tehnoloogia": - Võru keele morfoanalüsaatori arendamine ja rakendamine keeleõpperakenduses Oahpa (http://oahpa.no/voro). - Võru klaviatuuridraiver Windowsi ja Maci opsüsteemile (http://divvun.no/doc/keyboards/kbdlangdocs/vro/doc/index.html). 4. Kõnesüntees Koostöös EKI kõnesünteesi töörühmaga on valminud esimesed võrukeelsed sünteeshääled: http://www.eki.ee/~indrek/voru/index.php, https://github.com/ikiissel/synthts_vr. Kõnesünteesi on rakendatud õpiprogrammis Oahpa / Opiq võro kiilt! (http://oahpa.no/voro/morfac/) ja eesti-võru sõnaraamatu näitelausete helindamiseks.