"Institutsionaalne uurimistoetus" projekt IUT20-56
IUT20-56 "Eesti keele arvutimudelid (1.01.2014−31.12.2019)", Heiki-Jaan Kaalep, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, Arvutiteaduse instituut.
IUT20-56
Eesti keele arvutimudelid
Computational models for Estonian
1.01.2014
31.12.2019
Institutsionaalne uurimistoetus
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus50,0
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP170 Arvutiteadus, arvutusmeetodid, süsteemid, juhtimine (automaatjuhtimisteooria)2.2. Elektroenergeetika, elektroonika (elektroenergeetika, elektroonika, sidetehnika, arvutitehnika ja teised seotud teadused)50,0
PerioodSumma
01.01.2014−31.12.2014128 400,00 EUR
01.01.2015−31.12.2015128 400,00 EUR
01.01.2016−31.12.2016128 400,00 EUR
01.01.2017−31.12.2017128 400,00 EUR
513 600,00 EUR
385200,00

Projekt seob Eesti keele- ja arvutiteadusliku kompetentsi. Arendatakse alusuuringuid, mille tulemused on sisendiks rakenduslikele projektidele ( Eesti Keeletehnoloogia sihtprogrammi ja rahvusvahelised projektid). Tööd jaotuvad nelja allvaldkonda: arvutimorfoloogia, -süntaks, -semantika ning -pragmaatika. Eesmärgid on ühelt poolt seotud arvutilingvistika üldiste arengusuundadega ja teiselt poolt arvestavad eesti keele jaoks oluliste rakenduste vajadusi. Teemad: (1) tekstipõhine morfoloogiline ühestamine ja eesti keele muutesüsteemi süstemaatiline esitus; (2) leksikaal-grammatiliste konstruktsioonide tuvastamine ning konstruktsioonipõhise lähenemise ühendamine sõltuvussüntaktilise analüsaatoriga; (3) semantika sidumine teiste analüüsitasanditega ja vahendite väljatöötamine terviktekstide tähenduse esitamiseks ; (4) eesti kultuuriruumis toimuva suhtluse uurimine multimodaalse agendi modelleerimiseks; (5) tulemuste masintõlkes rakendamise võimalused.
The proposed research topic belongs to the realm of computational linguistics, unifying competence from theoretical linguistics and computer science. The planned research has two goals: attaining a more adequate description of Estonian, suitable for computer implementations, and developing effective computational models for processing Estonian data. The planned research will concentrate on theoretical research, while its results help to fulfil the task of creating the language-technological support for Estonian, as formulated in “Development Plan of the Estonian Language, 2011-2017”. The research is planned in four subject areas: computational morphology, syntax, semantics and pragmatics, the latter entailing dialogue modelling and multimodal communication.

Vastutav täitja (1)

IsikKraadTöökoht ja ametCVOsalemise periood
Heiki-Jaan KaalepdoktorikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, keeletehnoloogia vanemteadur (1,00) Filosoft OÜ, juhatuse esimees Filosoft OÜ, juhatuse esimees (1,00)EST / ENG01.01.2014−31.12.2019

Põhitäitjad (4)

IsikKraadTöökoht ja ametCVOsalemise periood
Päivi Kristiina JokinendoktorikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, külalisprofessor (0,50)EST / ENG01.01.2014−31.12.2019
Mare KoitdoktorikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, keeletehnoloogia spetsialist (0,50) Tartu Ülikool, emeriitprofessor (1,00)EST / ENG01.01.2014−31.12.2019
Erkki LuukdoktorikraadDepartment of Mathematics, Stockholm University, Sweden, järeldoktor (1,00) Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, keeletehnoloogia vanemteadur (0,20) Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, keeletehnoloogia vanemteadur (1,00)EST / ENG01.01.2014−31.12.2019
Kadri MuischnekdoktorikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, keeletehnoloogia vanemteadur (0,75)EST / ENG01.01.2014−31.12.2019

Täitjad (6)

IsikKraadTöökoht ja ametCVOsalemise periood
Mark FišeldoktorikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, Keeletehnoloogia õppetool, keeletehnoloogia dotsent (1,00)EST / ENG01.01.2014−31.12.2019
Kaarel KaljuranddoktorikraadNuance Communications, Senior Research Scientist (1,00)EST / ENG01.01.2014−31.12.2019
Kaili MüürisepdoktorikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, keeletehnoloogia teadur (1,00)EST / ENG01.01.2014−31.12.2019
Tiina PuolakainendoktorikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, keeletehnoloogia lektor (0,50)EST / ENG01.01.2014−31.12.2019
Margus TreumuthdoktorikraadTartu Ülikool, Loodus- ja täppisteaduste valdkond, Arvutiteaduse instituut, keeleressursside analüütik (0,10)EST / ENG01.01.2014−31.12.2019
Haldur ÕimdoktorikraadTartu Ülikool emeriitprofessor Tartu Ülikool, FilosoofiateaduskondEST / ENG01.01.2014−31.12.2019
Projektid
Projekt
EKT66; "Eesti Wordneti täiendamine 2"; Heili Orav;
EKT67; "Sihipärane süntaks korpuste jaoks"; Kadri Muischnek;
EKT69; "Eesti Keeleressursside Keskus"; Kadri Vider;
EKT88; "KaMa: Kasutatav Eesti Masintõlge"; Mark Fišel;
EMP160; "Saami-Eesti keeletehnoloogia-alane koostöö: sarnased keeled, ühesugune tehnoloogia"; Heiki-Jaan Kaalep;
IUT20-56AP14; "Väikesemahulise teaduse infrastruktuuri kaasajastamine teadusteema IUT20-56 raames"; Heiki-Jaan Kaalep;
Publikatsioonid
Publikatsioonid
Birgitta Ojamaa, Kristiina Jokinen and Kadri Muischenk (2015). Sentiment Analysis on Conversational Texts. 23: Nodalida 2015 http://www2.lingfil.uu.se/nodalida2015/. Ed. Beata Megyesi. 233−238. (NEALT Proceedings Series).
Muischnek, Kadri; Müürisep, Kaili; Puolakainen, Tiina (2014). Ühendverbid eesti keele pindsüntaktilises analüüsis. Eesti Rakenduslingvistika Ühingu aastaraamat, 10, 227−240.10.5128/erya.v0i10.264.
Muischnek, Kadri; Müürisep, Kaili; Puolakainen, Tiina (2014). Dependency Parsing of Estonian: Statistical and Rule-based Approaches. Human Language Technologies – The Baltic Perspective: the Sixth International Conference “Human Language Technologies – The Baltic Perspective”, Kaunas, Leedu, 26–27 September 2014. Ed. Andrius Utka, Gintarė Grigonytė, Jurgita Kapočiūtė-Dzikienė, Jurgita Vaičenonienė. Amsterdam: IOS Press, 111−118. ( Frontiers in Artificial Intelligence and Applications; 268).10.3233/978-1-61499-442-8-111.
Muischnek, Kadri;Müürisep, Kaili; Puolakainen, Tiina; Aedmaa, Eleri; Kirt, Riin; Särg, Dage (2014). Estonian Dependency Treebank and its annotation scheme. In: Verena Henrich, Erhard Hinrichs, Daniël de Kok, Petya Osenova, Adam Przepiórkowski (Ed.). Proceedings of the Thirteenth International Workshop on Treebanks and Linguistic Theories (TLT13) (285−291).. Tübingen, Saksamaa: University of Tübingen.
Kaalep, Heiki-Jaan (2015). Eesti verbi vormistik. Keel ja Kirjandus, 1, 1−15.
Õim, Haldur; Koit, Mare (2014). Keele mõistmise modelleerimine arvutil. Semantika, ontoloogia ja sündmuste esitus kahe valdkonna näitel. Keel ja Kirjandus, 3, 169−194.
Koit, Mare (2015). Analysing Human-Human Negotiations with the Aim to Develop a Dialogue System. Speech and Computer. Lecture Notes in Artificial Intelligence. Subseries of Lecture Notes in Computer Science. Proceedings, 9319: 17th International Conference, SPECOM 2015, Athens, Greece, September 20-24, 2015. Ed. Andrey Ronzhin, Rodmonga Potapova, Nikos Fakotakis. Switzerland: Springer-Verlag, 73−80.10.1007/978-3-319-23132-79.
Koit, Mare (2015). Läbirääkimiste modelleerimine arvutil. Eesti Rakenduslingvistika Ühingu aastaraamat, 11, 127−140.10.5128/ERYa11.08.
Orasmaa, Siim (2015). Event coreference detection in Estonian news articles: preliminary experiments. In: Eesti Rakenduslingvistika Ühingu aastaraamat (189−203). Tallinn: Eesti Rakenduslingvistika Ühing.10.5128/ERYa11.12.
Orasmaa, Siim (2014). How Availability of Explicit Temporal Cues Affects Manual Temporal Relation Annotation. In: Utka, Andrius; Grigonytė, Gintarė; Kapočiūtė-Dzikienė, Jurgita; Vaičenonienė, Jurgita. (Ed.). Human Language Technologies – The Baltic Perspective (215−218).. IOS Press. (Frontiers in Artificial Intelligence and Applications).10.3233/978-1-61499-442-8-215.
Orasmaa, Siim (2014). Towards an Integration of Syntactic and Temporal Annotations in Estonian. Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14): The International Conference on Language Resources and Evaluation; Reykjavik, Iceland; 2014. Ed. Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Hrafn Loftsson an. Reykjavik, Iceland: ELRA, 1259−1266.
Luuk, Erkki (2015). Syntax-semantics interface. In: Wright, James D. (Ed.). International Encyclopedia of Social and Behavioral Sciences (900−905). Elsevier.
Luuk, E. (2015). Introducing a type-theoretical approach to Universal Grammar. Abstracts: 21st International Conference on Types for Proofs and Programs, TYPES 2015 (Tallinn, Estonia, 18-21 May 2015). Ed. T. Uustalu. Tallinn Technical University, Institute of Cybernetics, x.
Luuk, Erkki; Luuk, Hendrik (2014). The emergence of compound signals. The Evolution of Language. Proceedings of the 10th International Conference (EVOLANGX) (154−160).. World Scientific.10.1142/9789814603638_0018.
Jokinen, Kristiina; Wilcock, Graham (2014). Modelling User Experience in Human-Robot Interactions. In: Ronald Böck, Francesca Bonin, Nick Campbell, Ronald Poppe (Ed.). Multimodal Analyses enabling Artificial Agents in Human-Machine Interaction (45−56).The 2nd Interspeech Satellite Workshop on Multimodal Analyses Enabling Artificial Agents in Human-Machine Interaction (MA3HMI 2014). Singapore: Springer Verlag. (LNAI).
Saatmann, Pihel; Jokinen, Kristiina (2015). Experiments With Hand-tracking Algorithm in Video Conversations. The 2nd European and the 5th Nordic Symposium on Multimodal Communication. Linköping University Electronic Press; Linköpings universitet, 81−86.
Jokinen, Kristiina (2015). Multimodal engagement in the WikiTalk robot application. A Satellite workshop of INTERSPEECH 2015 International Workshop on Speech Robotics http://iwsr2015.org/. Dresden, Germany: Tartu Ülikool, x.
Vels, Martin; Jokinen, Kristiina (2015). Recognition of Human Body Movements for Studying Engagement in Conversational Video Files. The 2nd European and the 5th Nordic Symposium on Multimodal Communication. Ed. Jokinen, K.; Vels, M. Linköping: Linköping University Electronic Press; Linköpings universitet, 97−105.
Jokinen, Kristiina; Vels, Martin (2015). Proceedings from the 2nd European and the 5th Nordic Symposium on Multimodal Communication. Linköping University Electronic Press; Linköpings universitet.
Vels, Martin; Jokinen, Kristiina (2015). Detecting Body, Head, and Speech Signals for Conversational Engagement. The IVA (Interactive Virtual Agents) Conference Workshop 2: Engagement in Social Intelligent Virtual Agents http://iva2015.tudelft.nl/?q=node/11. Delft, The Neatherlands,.
Wilcock, Graham; Jokinen, Kristiina (2015). Multilingual WikiTalk: Wikipedia-based talking robots that switch languages. The 16th Annual SIGdial Meeting on Discourse and Dialogue (SIGDIAL 2015) http://www.sigdial.org/workshops/conference16/. Prague, Czech Republic,.
Särg, Dage; Jokinen, Kristiina (2015). Nodding in Estonian First Encounters. The 2nd European and the 5th Nordic Symposium on Multimodal Communication. Linköping University Electronic Press; Linköpings universitet, 87−95. (Linköping Electronic Conference Proceedings).
Jokinen, Päivi Kristiina; Vels, Martin (2015). Proceedings of the 2nd European and the 5th Nordic Symposium on Multimodal Communication, August 6-8, 2014, Tartu, Estonia. Linköping University Electronic Press, Linköpings universitet.
Jokinen, Kristiina; Wilcock, Graham (2014). Automatic and Manual Annotations in First Encounter Dialogues. Human Language Technologies – The Baltic Perspective, 268: The Sixth Baltic Conference Human Language Technologies (HLT) - the Baltic Perspective. Ed. Andrius Utka, Gintarė Grigonytė, Jurgita Kapočiūtė-Dzikienė, Jurgita Vaičenonienė. Kaunas, Lithuania: IOS Press,. ( Frontiers in Artificial Intelligence and Applications).
Jokinen, Kristiina; Wilcock, Graham (2014). Towards Automatic Annotation of Communicative Gesturing. Proceedings of the COLING Workshop Vision and Language (VL’14). Dublin, Ireland,.
Õim, Haldur; Koit, Mare (2017). Suundumusi inimsuhtluse keelelises analüüsis ja modelleerimises (I). Keel ja Kirjandus, 1, 71−80.
Koit, Mare (2017). Dialoogsüsteem ja läbirääkimiste struktuur. Margit Langemets, Maria-Maren Linkgreim, Helle Metslang (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat (37−51). Tallinn: Eesti Rakenduslingvistika Ühing.10.5128/ERYa13.03.
Koit, Mare (2017). Reasoning and Communicative Strategies in a Model of Argument-Based Negotiation. 2017 IEEE International Conference on Innovations in Intelligent Systems and Applications Proceedings: 2017 IEEE International Conference on Innovations in Intelligent Systems and Applications (INISTA), Gdynia, Poland, 3-5 July 2017. Ed. Piotr Jędrzejowicz, Tülay Yildirim, Ireneusz Czarnowski. Institute of Electrical and Electronics Engineers (IEEE),.
Aedmaa, Eleri (2017). Exploring Compositionality of Estonian Particle Verbs. In: Lohiniva, Karoliina; Wahle, Johannes (Ed.). Proceedings of the ESSLLI 2017 Student Session (197−208).29th European Summer School in Logic, Language & Information, Toulouse, France, July 17-28, 2017. Toulouse, France.
Juhendamised
Juhendamised
Dage Särg, magistrikraad, 2015, (juh) Kadri Muischnek, Internetikeele süntaktiline analüüs kitsenduste grammatikaga, Tartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut.
Eleri Aedmaa, magistrikraad, 2014, (juh) Kadri Muischnek; Kristel Uiboaed, Sõnadevahelise seose tugevuse mõõtmise statististilised meetodid ühendverbide tuvastamisel, Tartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut.