See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Riiklik programm: Eesti keel ja rahvuslik mälu" projekt EKRM04-40
EKRM04-40 "Kõnekeele ressursid ja kõnetehnoloogia andmebaasid (1.01.2004−31.12.2005)", Einar Meister, Tallinna Tehnikaülikool, TTÜ Küberneetika Instituut.
EKRM04-40
Kõnekeele ressursid ja kõnetehnoloogia andmebaasid
1.01.2004
31.12.2005
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja rahvuslik mälu
PerioodSumma
01.01.2004−31.12.2004100 000,00 EEK (6 391,16 EUR)
01.01.2005−31.12.2005110 000,00 EEK (7 030,28 EUR)
13 421,44 EUR

Kõneuuringutes vajatakse suuremahulisi korduvkasutatavaid suulise keele ressursse, mis sisaldavad mitmekesist kõnematerjali erinevate uurimistööde tarvis. Projekti eesmärgiks on eesti keele foneetilisteks ja kõnetehnoloogilisteks uuringuteks ning arendustöödeks vajalike kõnekorpuste salvestamine, digitaliseerimine, märgendamine ja arhiveerimine kõne andmebaasides, samuti ühtse tehnoloogilise keskkonna loomine erinevate andmebaaside haldamiseks ja efektiivseks käsutamiseks. Varasemate aastatel on salvestatud mitmeid kõnekorpusi ja loodud nende baasil kõne andmebaase (Tempo-korpus, kõnelejatuvastuse korpus, aktsendiga kõne korpus, BABELi andmebaas, difoonide andmebaas), lõpufaasis on SpeechDat-tüüpi andmebaasi koostamine. Projekti olulisemad ülesanded on: 1. kõnetuvastuse uuringuteks, süsteemide treenimiseks ja testimiseks loodava SpeechDat-tüüpi andmebaasi lõplik formeerimine; täiendavate salvestuste teostamine (spontaanne kõne, dialoogid fikseeritud valdkondades, jms); 2. uute korpuste salvestamine kõnesünteesi uuringuteks ja arendamiseks, sealhulgas naishääle ja emotsionaalse kõne analüüsiks ning sünteesiks; 3. aktsendikorpuse loomine eri emakeelega isikute eesti keele hääldusnäidetest. Salvestatakse keelenäited vene, saksa, prantsuse, rootsi, soome, Ameerika ja Suurbritannia inglise, hispaania, itaalia, gruusia, aseri, norra, taani, hollandi, araabia, jaapani ja muu emakeelega eesti keele kõnelejatelt. Aktsendinähtuste analüüs ja modelleerimine on vajalikud nii eesti keele kui võõrkeele õpetamisel kui ka kõnetuvastuse tarkvara väljaarendamisel; 4. tehnoloogilise keskkonna loomine erinevate kõneandmebaaside haldamiseks ja efektiivseks käsutamiseks uurimistöös. Luuakse tehnoloogilised vahendid eri formaatides salvestatud kõnekorpuste ühildamiseks ja liides päringute esitamiseks. Projekti tähtsus: Keeleressursid moodustavad olulise osa uurimistööks vajalikust infrastruktuurist. Mitmekesise ja süstematiseeritud kõnematerjali olemasolu võimaldab uurida erinevaid suulise kõne aspekte; kõnelejate suur hulk on oluline statistiliselt usaldusväärsete analüüsitulemuste saamiseks. Kõnelejast sõltumatu tuvastussüsteemi loomiseks on treenimisel vajalik käsutada paljude inimeste hääldusnäiteid, sealhulgas ka aktsendiga kõnenäiteid. Kõnetehnoloogiline arendustöö on piisavate kõneressursside olemasoluta mõeldamatu.