"Riiklik programm: Eesti keeletehnoloogia" projekt EKT88
EKT88 "KaMa: Kasutatav Eesti Masintõlge (1.01.2015−31.12.2017)", Mark Fišel, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, Arvutiteaduse instituut.
EKT88
KaMa: Kasutatav Eesti Masintõlge
1.01.2015
31.12.2017
Teadus- ja arendusprojekt
Riiklik programm: Eesti keeletehnoloogia
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP176 Tehisintellekt 1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)80,0
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus20,0
PerioodSumma
01.01.2015−31.12.201530 000,00 EUR
01.01.2016−31.12.201642 000,00 EUR
72 000,00 EUR

Projekti üldeesmärk on juurutada Eestis järel-toimetamise praktikat ning luua võimalusi tegelemiseks praktiliselt-orienteeritud keeletehnoloogilise arendamistööga Tartu Ülikoolis. Selleks vajalikud detailsemad alameesmärgid: * arendada üldvaldkonna eesti-inglise-eesti masintõlget mis oleks orienteeritud järel-toimetamisele; selleks rakendame läbi katsetatud state-of-the-art tõlkekvaliteedi parandamisviise, ning võtame kasutusele olemasolevad lisaressurssid nagu eesti keele morfoloogiline ja süntaktiline analüüs ning WordNet, * arendada lisaks üldvaldkonna tõlkesüsteemile prototüüp-versiooni eesti-inglise-eesti subtiitride tõlkimise süsteemist, et demonstreerida ka valdkonna-spetsiifiliste masintõlke süsteemide loomise võimalusi. Subtiitrid on üks potentsiaalne teksti valdkond, mille tõlkimisega Eestis tegeletakse, ning seetõttu oleks see sobiv prototüüprakenduse valik, * mõlemale süsteemile lisada usaldusväärsuse hindamist, et suurendada potentsiaalset kaubandusliku rakendatavust. Lisaks tehnilistele eesmärkidele on ka olulised majanduslikud lisaeesmärgid: * koguda ülevaadet Eestis tõlketehnoloogiate rakendatavusest detailse turu-uuringu teel, et välja selgitada kõige aktuaalsemad tõlkesuunad ja teksti valdkonnad, kus masintõlget ja järel-toimetamist rakendada saab, * luua kontakte tõlgivate firmade ja muude asutustega, et käivitada spetsiifiliselt kohendatud tõlkesüsteemide arendamise koostööprojekte nende firmade ja Tartu Ülikooli vahel, * veenda tõlkimist sooritavaid asutusi ja inimtõlkijaid, et masintõlke tehnoloogia ei ole mõeldud inimtõlkimise asendamiseks, vaid sellele, et tõlkimise tööd kergemaks teha ja selle rutiinseid külgi inimese eest ära lahendada, jättes inimtõlkijaile tõlkimise loomingulisema osa. Pikemas perspektiivis aitab meie projekt tõsta eesti keelt samale tasemele tehnilise tõlkimise toe suhtes inglise, saksa, rootsi, taani jm. keelte hulka, kus selliseid tehnoloogiaid juba edukalt rakendatakse. Samuti aitab see arendada koostööd õppe- ja uurimisasutuste ja ettevõtete vahel, et edendada keeletehnoloogia rakendusliku arengut ja praktiliselt orienteeritud spetsialistide kasvatamist. Meie tuleviku visioon on selline, et keeletehnoloogia-alane koostöö masintõlke ja muudes alades Eesti ülikoolide ja ettevõtete vahel oleks pidevalt käimas ja suurendamas, sedasi panustaes nii Eesti majandusse kui ka kõrgharidusse, lisades teoreetilistele õpingutele praktilisi kogemusi ja teadmisi.