"Riiklik programm: Eesti keeletehnoloogia" projekt EKT69
EKT69 "Eesti Keeleressursside Keskus (1.01.2015−31.12.2017)", Kadri Vider, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, Arvutiteaduse instituut.
EKT69
Eesti Keeleressursside Keskus
1.01.2015
31.12.2017
Teadus- ja arendusprojekt
Riiklik programm: Eesti keeletehnoloogia
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus50,0
4. Loodusteadused ja tehnika4.6. ArvutiteadusedT120 Süsteemitehnoloogia, arvutitehnoloogia1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)50,0
PerioodSumma
01.01.2015−31.12.201540 000,00 EUR
01.01.2016−31.12.201660 000,00 EUR
100 000,00 EUR

Eesti Keeleressursside Keskuse (vt ka http://keeleressursid.ee/) tegevuse eesmärgiks on luua ja käigus hoida teadustaristu, mis teeb eestikeelsed keeleressursid (sõnastikud, teksti- ja kõnekorpused, keeleandmebaasid), keeletehnoloogilise tarkvara ja keele töötlemise vahendid eelkõige teadlastest huvilistele kättesaadavaks. Kasutuse hõlbustamiseks koondatakse juurdepääs digitaalsetele arhiividele ja pakutakse keeletehnoloogia vahendeid kui oskusteabega varustatud veebiteenust, mis kasutab arhiveeritud andmeid ja mida kasutajad saavad vajaduse korral ka oma tarbeks kohandada. Seeläbi tehakse olemasolevate ressursside kasutamine ja kombineerimine uute väärtuste loomisel lihtsamaks, samuti tagatakse loodud ressursside säilimine. Lisaks käivitab keskus süsteemi kogutud keeleressursside tutvustamiseks ja potentsiaalsete kasutajate koolitamiseks. Eestisiseselt on taristu avatud nii keeleressursside omanikele, arendajatele kui ka kasutajatele, kes nõustuvad kasutus- ja litsentsitingimustega. Eelistatud on teaduskasutajad ning eesti keele kasutajaskonnale avalikes huvides pakutavad keeleressursid ja keeletehnoloogilised vahendid. Kõik kogutavad keeleressursid peavad vastama rahvusvahelistele standarditele ja olema varustatud kasutuslitsentsiga. EKRK poolt saavad kogutud ressursid ka püsiidentifikaatorid (PID), mille kaudu on võimalik teadlastel oma töödes igale keeleressursile kui teadusandmestikule viidata. EKRK juhendab ressursside dokumenteerimist ja arhiveerimist ning arendab vajalikke keeletehnoloogia standardeid, töötab välja deponeerimislepinguid ja varustab digiressursse erinevat tüüpi (üldine avalik, akadeemiline, ärikasutus jne) kasutuslitsentsidega. Keskuse pakutavad teenused töötavad ühtse autentimise ja autoriseerimise süsteemi (AAI) kaudu, et lubada ressursside kasutust võimalikult lihtsalt, järgides kasutuslepingute tingimusi ja kaitstes ressursiomanike huve. Autentimissüsteemi haaratakse esmajärjekorras teadus- ja arendusasutused, sõlmitakse lepingud vastastikuseks juurdepääsuks välismaiste riiklike akadeemiliste identiteedipakkujate liitudega, lisaks võimaldatakse kasutajakontod ning juurdepääs vabalt kasutatavatele ressurssidele ka mitteteadlastest kasutajatele. EKRK tegeleb ka keeleressursside ja nende kasutusvõimaluste tutvustamisega oma võimalikele sihtgruppidele eeskätt sotsiaal- ja humanitaarteaduste valdkonnas.