"Riiklik programm: Eesti keeletehnoloogia" projekt EKT10
EKT10 "Eesti Keeleressursside Keskus (1.01.2011−31.12.2014)", Kadri Vider, Tartu Ülikool, Matemaatika-informaatikateaduskond.
EKT10
Eesti Keeleressursside Keskus
1.01.2011
31.12.2014
Teadus- ja arendusprojekt
Riiklik programm: Eesti keeletehnoloogia
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus40,0
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP175 Informaatika, süsteemiteooria1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)60,0
PerioodSumma
01.01.2011−31.12.201146 003,00 EUR
01.01.2012−31.12.201262 245,00 EUR
01.01.2013−31.12.201337 100,00 EUR
01.01.2014−31.12.201437 100,00 EUR
182 448,00 EUR

Eesti keeleressursside keskus (EKRK) on infrastruktuur, mis tagab kõigile uurijatele keeleressursside ja tehnoloogiate (keeletarkvara, sõnastike, teksti- ja kõnekorpuste, keeleandmebaaside) kättesaadavuse. Selleks ühendatakse eksisteerivad digitaalsed arhiivid ja pakutakse keeletehnoloogia vahendeid kui veebiteenust, mis kasutab arhiveeritud andmeid. Seeläbi parandatakse nii keeleressursside nähtavust kui tehakse teadlastele olemasolevate ressursside kasutamine ja kombineerimine uute väärtuste loomisel oluliselt lihtsamaks, samuti tagatakse loodud ressursside säilimine. Et tagada keskusse kuuluvate keeleressursside pikemaajaline kasutusvõimalus, võimalus eri ressursside kombineerida, võrrelda ja kasutada koos erinevate eestisiseste või ka välismaiste rakendustega, viiakse ressursid vastavusse üldlevinud standarditega, dokumenteeritakse ning tehakse nende metaandmed kättesaadavaks ja automaatselt töödeldavaks. Keskuses töötatakse välja litsentsilepingud ja viiakse sisse kvaliteetne autentimissüsteem, et lubada ressursside kasutust võimalikult lihtsalt, järgides kasutuslepingute tingimusi ja kaitstes võimaluste piirides ressursiomanike huve. Autentimissüsteemi haaratakse esmajärjekorras teadus- ja arendusasutused, sõlmitakse lepingud vastastikuseks juurdepääsuks välismaiste riiklike akadeemiliste identiteedipakkujate liitudega (Identity provider federation), lisaks võimaldatakse kasutajakontod ning juurdepääs vabalt kasutatavatele ressurssidele ka mitteteadlastest kasutajatele. Keeleressursid tehakse eri liiki litsentsilepingute ja eraldi kokkulepetega kättesaadavaks ka avalikule ja erasektorile. Avaliku sektori puhul panustatakse eelkõige riigi infosüsteemide arendamisse. Erasektoril võimaldatakse erikokkulepete alusel keeleressursse kasutada ja rakendada ka oma toodetesse. Tartu Ülikooli, Eesti Keele Instituudi ja Tallinna Tehnikaülikooli Küberneetika Instituudi konsortsiumina on EKRK „Eesti teaduse infrastruktuuride teekaardi“ riikliku tähtsusega teadustaristu, mida rahastatakse ka ERFi vahenditest ja CLARIN (Common Language Resources andTechnology Infrastructure) ERIC (European Research Infrastructure Consortium) riiklik konsortsium. Eesti Keeleressursside Keskuse osalemine rahvusvahelises võrgustikus annab meie teadlastele juurdepääsu keskuste võrgustikus olevate keskuste teiste keelte jaoks loodud ressurssidele.