See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Ülikoolide arengufondid" projekt TF2019
TF2019 "Tallinna Ülikooli eesti vahekeele korpuse uue platvormi prototüübi arendamine õppijakorpuseks (1.09.2019−1.09.2021)", Pille Eslon, Tallinna Ülikool, Digitehnoloogiate instituut.
TF2019
Tallinna Ülikooli eesti vahekeele korpuse uue platvormi prototüübi arendamine õppijakorpuseks
Development of the Estonian interlanguage corpus into a learner corpus
Tallinna Ülikooli eesti vahekeele korpuse uue platvormi prototüübi arendamine õppijakorpuseks
1.09.2019
1.09.2021
Teadus- ja arendusprojekt
Ülikoolide arengufondid
ETIS klassifikaatorAlamvaldkondCERCS klassifikaatorFrascati Manual’i klassifikaatorProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2 Keeled ja kirjandus30,0
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP175 Informaatika, süsteemiteooria1.2 Arvutiteadus ja informaatika70,0
AsutusRollPeriood
Tallinna Ülikool, Digitehnoloogiate instituutkoordinaator01.09.2019−01.09.2021
AsutusRiikTüüp
Tallinna ÜlikoolEesti Vabariikülikool
PerioodSumma
01.09.2019−31.08.202020 000,00 EUR
01.09.2020−01.09.202120 000,00 EUR
40 000,00 EUR

Projekti eesmärgiks on arendada Tallinna Ülikooli eesti vahekeele korpuse (edaspidi EVKK) uue platvormi prototüübi alusel välja õppijakorpuse kasutajaliides, mis võimaldab kompleksset otsingut ja keelekasutuse analüüsi paljude eri tunnuste alusel: nt lingvistilised tunnused (leksikaalsed, morfoloogilised, morfosüntaktilised, funktsionaalsed jm), statistilised (teksti pikkus sõnades, lause pikkus sõnades, sõna pikkus tähemärkides, sõnade ja vormide esinemus jm), metatekstilised (teksti autori emakeel, keeleoskuse tase, vanus, päritolumaa jm). Selgitus: eesti vahekeele korpus (sün eesti õppijakeele korpus) on eesti keelt teise või võõrkeelena õppivate erikeelsete õppijate kirjalike tekstide elektroonne kogu, millel kasutajaliides, erinevad funktsionaalsused ja teksti automaatse analüüsi vahendid (nt Klastrileidja – töötab andmekaeve põhimõttel, otsib tekstist ühe-, kahe-, kolme-, neljakomponendiseid keelekasutuse mustreid; silbitaja – koostab teksti pöördsõnastiku, reastab sõnad sõnalõpu alusel jne).
The aim of the project is to develop a learner corpus user interface based on the new platform prototype of the Estonian interlanguage corpus of the Tallinn University. It will allow for complex search and analysis of language use on the basis of various features: e.g, linguistic features (lexical, morphological, syntactic, etc.), statistical features (text length in words, sentence length in words, word length in characters, occurrence of words and inflectional forms, etc.) as well as meta-textual features (mother tongue of the text author, level of language proficiency, age, country of origin, etc.)
KirjeldusProtsent
Rakendusuuring100,0