See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Riiklik programm: Eesti keel ja kultuurimälu" projekt EKKM14-382
EKKM14-382 "Eesti laste- ja hoidjakeele korpuse täiendamine ja kaasajastamine (1.01.2014−31.12.2018)", Reili Argus, Tallinna Ülikool, Humanitaarteaduste instituut.
EKKM14-382
Eesti laste- ja hoidjakeele korpuse täiendamine ja kaasajastamine
Renewal of the Estonian database of child and child directed speech
1.01.2014
31.12.2018
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja kultuurimälu
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus100,0
AsutusRollPeriood
Tallinna Ülikool, Humanitaarteaduste instituutkoordinaator01.01.2014−31.12.2018
PerioodSumma
01.01.2014−31.12.20148 000,00 EUR
01.01.2015−31.12.20158 000,00 EUR
01.01.2016−31.12.20168 000,00 EUR
01.01.2017−31.12.20178 000,00 EUR
01.01.2018−31.12.20188 000,00 EUR
40 000,00 EUR

Projekt täidab eesti keele arenguks ja säilimiseks olulist valdkonda, mis on sõnastatud riikliku programmi ”Eesti keel ja kultuurimälu II” punktis 3.1.2 ”Eesti keele uurimiseks ja õppeks vajalike andmebaaside koostamine …”. Projekti põhieesmärk on eesti lastekeelekorpuse arendamine vähemalt 300 tunni lindistuste mahuni (praegune maht on u 140 tundi lindistusi). Arendatud andmebaas – eesti lastekeelekorpus – saab elektroonselt tasuta kättesaadavaks rahvusvahelise andmepanga CHILDES keskkonnas. Eesti lastekeelekorpuse jaoks vajalikke andmeid kogutakse, töödeldakse ja esitletakse vastavalt CHILDES-i eetikanõuetele ja töötlemispõhimõtetele. See omakorda toetab ja tugevdab nii projektimeeskonna tööd kui ka loob rahvusvahelise usaldusväärse pinnase kogutud andmete kasutamiseks teaduslikel eesmärkidel, nt lingvistika-alastes keeleomandamisuuringutes. Projekti käigus kogutavad spontaanse kõne audio- ja videolindistused transkribeeritakse ning tehakse vabalt kättesaadavaks andmepanga CHILDES keskkonnas. Seal hoitavaid litereeringuid saavad juba kohandatud otsimootorite abil kasutada nii lingvistid, keele- ja kõnehäiretega tegelejad, haridusteadlased ja miks mitte ka psühholoogid või sotsiaalteadlased. CHILDESi keskkond on maailma lastekeeleuurijate seas üldtunnustatud ning selle keskkonna eelisteks on ühtsetel alustel kogutud ja kirja pandud keelematerjal, automaattöötluse võimalus ning seega metoodiline võrreldavus teiste keelte lastekeeleandmetega. Projekti käigus lisame eesti lastekeele CHILDESi andmepanga koosseisu vähemalt ühe uue lapse pikiuuringu andmekogu ning täiustame olemasolevat Kapaneni alamkorpust kui ka Kõrgesaare alamkopust. Andmekogu koostamiseks vajaliku materjali kogumist on alustatud, st et praeguseks on olemas (ja esialgu transkribeerimata): 1) ühe lapse audiolindistused (tehtud vähemalt kord kuus regulaarselt 3 aasta jooksul) 105 tunni mahus, nn Linda alamkorpus; 2) Kõrgesaare korpuse täiendamiseks 20 tunni mahus audiolindistusi, mis on tehtud eri vanuses lastega ja kus lapsega räägivaks täiskasvanuks on nii isa kui ka ema; 3) Kapaneni korpuse täiendamiseks 5 tunni jagu audiolindistusi. Kogu see juba praegu olemasolev materjal tuleb transkribeeritakse ning viiakse CLAN-programmi abil joondatud kujule (CHAT). Lisaks transkribeerimisele tuleks audio- ja videofailid linkida transkriptsioonidega (CHILDES-is kasutades lahendust QuickTime Player). See muudab mis tahes keeletasandi uurimistöö palju hõlpsamaks ja kindlamaks, näiteks saab mõne vormi korrektsuses või vältes kaheldes kohe liikuda vastavasse kohta lindistuses ja see koht üle kuulata. Ainult nii on näiteks võimalik täpne pragmaatiliste tegurite arvestamine, sest kõnetegevuse taustaks olevat on hõlbus kontrollida ja täpsustada.
Projekti käigus täiendati oluliselt eesti laste- ja hoidjakeele korpust. Lisaks sünkroniseeriti suur osa korpusest helifailidega. See võimaldab uurijal igal hetkel transkriptsiooni kontrollida või leida audiomaterjalist tunnuseid, mida transkriptsioonis pole märgitud.