"Riiklik programm: Eesti keel ja rahvuslik mälu" projekt EKRM04-41
EKRM04-41 "Eestikeelse kõnetuvastuse meetodite uurimine ja arendamine (1.01.2004−31.12.2005)", Einar Meister, Tallinna Tehnikaülikool, TTÜ Küberneetika Instituut.
EKRM04-41
Eestikeelse kõnetuvastuse meetodite uurimine ja arendamine
1.01.2004
31.12.2005
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja rahvuslik mälu
PerioodSumma
01.01.2004−31.12.2004150 000,00 EEK (9 586,75 EUR)
01.01.2005−31.12.2005150 000,00 EEK (9 586,75 EUR)
19 173,50 EUR

Maailmas laialdaselt käsutatav kõnetuvastustehnoloogia on välja töötatud eelkõige mitte-aglutineerivate keelte jaoks ja see baseerub leksikonis salvestatud sõnade äratundmisel. Piiratud sõnavara korral (ca 1000 sõna) on sõna kui tuvastusüksuse rakendamine võimalik ka eesti keele puhul. Suure ja piiramatu sõnavara korral (10 000 sõna ja rohkem) ei ole see käsutatav, sest eesti keeles on võimalike sõnavormide hulk ääretult suur ja nende salvestamine leksikonis on ebareaalne. Projekti eesmärgiks on eesti keelele sobivate kõnetuvastuse meetodite uurimine, arendamine ja testimine ning erinevate tuvastussüsteemi prototüüpide loomine. Projekti olulisemad ülesanded on: 1. uurida, millised on optimaalsed leksikonis salvestatavad tuvastusühikud (difoonid, silbid, pseudo-morfeemid, jms); 2. luua valitud tuvastusüksustel baseeruv morfo-süntaktiline keelemudel; 3. uurida kõneparameetrite varieeruvust erinevate kõnelejate vahel ja töötada välja vastavad normaliseerimismeetodid kõnelejast sõltumatu tuvastussüsteemi loomiseks; 4. luua algoritmid tuvastussüsteemi kureks adapteerumiseks kõneleja häälduse eripäraga; 5. tuvastussüsteemi käsutamiseks muutuvates akustilistes tingimustes on vajalik uurida ja arendada kõnesignaalide analüüsi, müratöötluse ja akustilise keskkonna modelleerimise meetodeid; 6. uurida kõnetuvastussüsteemide rakendusprobleeme mobiilside kanalis; 7. luua optimaalsed tehnoloogilised lahendused piiratud sõnavaraga (kuni 10 000 sõna) tuvastussüsteemide arendamiseks; 8. uurida ja arendada tehnoloogilisi lahendusi suure sõnavaraga (kuni 100 000 sõna) tuvastussüsteemide loomiseks; 9. välja töötada erinevaid tuvastussüsteemide prototüüpe. Projekti tähtsus: SJEERIIM Projekti raames luuakse eesti keelele sobiv kõnetuvastustehnoloogia ja arendatakse välja piiratud ning suure sõnavaraga tuvastussüsteemide prototüübid. Kõnetuvastustehnoloogia väljatöötamine võimaldab hakata arendama suulisel kommunikatsioonil baseeruvaid kasutaja-sõbralikke liideseid, mis leiaksid rakendust infotehnoloogilistes süsteemides. Samuti on võimalik luua inimene-masin dialoogsüsteeme, mis asendaksid rutiinset inimtööd infootsingul. Kõnetuvastus avardab oluliselt puuetega inimeste võimalusi käsutada arvuteid ning loob neile paremad võimalused osalemiseks tööturul ning nende integreerimiseks ühiskonda. Kõnetuvastustehnoloogia loomine tagab eesti keelele suurte keeltega võrdsed tingimused ja kasutusvõimalused infotehnoloogilises keskkonnas ning loob seega eeldused eesti keele säilimiseks ja arenguks infoühiskonnas.