See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus
"Riiklik programm: Eesti keel ja kultuur digiajastul (EKKD)" projekt EKKD84
EKKD84 "Kõne tekstiks süntees, NERi põhjal metaandmete genereerimine ja teemade modelleerimine ERRi audiovisuaalsetele arhiivisäilikutele perioodist 2003-2021" (1.01.2021−31.12.2022); Vastutav täitja: Andres Kõnno; Tallinna Ülikool, Balti filmi, meedia ja kunstide instituut; Finantseerija: Haridus- ja Teadusministeerium; Eraldatud summa: 49 960 EUR.
EKKD84
Kõne tekstiks süntees, NERi põhjal metaandmete genereerimine ja teemade modelleerimine ERRi audiovisuaalsetele arhiivisäilikutele perioodist 2003-2021
Speech to text synthesis, NER-based generation of metadata and topic modelling on ERR's audiovisual archive from 2003 to 2021
1.01.2021
31.12.2022
Teadus- ja arendusprojekt
Riiklik programm: Eesti keel ja kultuur digiajastul (EKKD)
ETIS valdkondETIS alamvaldkondCERCS valdkondFrascati Manuali valdkondProtsent
2. Ühiskonnateadused ja kultuur2.14. Kommunikatsiooni- ja infoteadusedS265 Meedia ja kommunikatsiooniteadused5.8 Meedia ja kommunikatsioon60,0
2. Ühiskonnateadused ja kultuur2.14. Kommunikatsiooni- ja infoteadusedH100 Dokumentatsioon, informatsioon, raamatukogundus, arhiivindus 5.8 Meedia ja kommunikatsioon40,0
PerioodSumma
01.01.2021−31.12.202249 960,00 EUR
49 960,00 EUR

Projekt "Kõne tekstiks süntees, NERi põhjal metaandmete genereerimine ja teemade modelleerimine ERRi arhiivisäilikutele perioodist 2003-2021" toimub koostöös juba käimasoleva PRG grandiga "Kultuuri avaandmelahenduste avaliku väärtuse ahelad" (PRG1191). ERR on nimetatud projekti küll kaasatud, aga PRG grandi vahendid ei kata vajalikul määral ERRi arhiivi olemasolevale sisule põhinevate uute metaandmete genereerimist. Projekt keskendub (a) ERRi arhiivi audiovisuaalse arhiivi muutmisele masinanalüüsitavaks tekstiks, (b) sellest tekstist nn named entity recognition (NER) tehnoloogia abil metaandmete genereerimisele (kohanimed, avaliku elu tegelased, olulisemad ajastuspetsiifilised temaatilised märksõnad) ja (c) linkandmete toimimiseks vajalike teemade modelleerimisele. Selliselt muutub ERRi arhiiv potentsiaalselt analüüsiobjektiks nii sotsiaal- kui ajalooteaduslike uurimistööde tegijatele. Samuti võimaldab see parendada ERRi poolt pakutavate avalike teenuste kvaliteeti.
The project "Speech to text synthesis, NER-based generation of metadata and modelling of topics on ERR's archive from 2003 to 2021" is an elaboration of an already existing PRG grant "The Public Value Chains of Cultural Open Data Solutions" (PRG1191). However, the existing grant doesn't cover the generation of metadata from already existing ERR's archived content. The project consists of 3 operations: (a) speech to text synthesis that is based on the audiovisual content of ERR's archive; (b) the generation of metadata with the help NER-technology (geographical places, public persons, institutions and relevant keywords for this period) and (c) the modelling of topics that is necessary to establish a linked database format in ERR's archive. This additional layer of metadata will make ERR's archive potentially analysable for the social scientists and historians. Also it will help to improve the quality of the ERR's public services and its cooperation with other memory institutions.