"Eesti Teadusfondi uurimistoetus" projekt ETF7503
ETF7503 "Suhtlusstrateegiad suhtlusmudelis: eestikeelse dialoogi modelleerimine arvutil (1.01.2008−31.12.2011)", Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.
ETF7503
Suhtlusstrateegiad suhtlusmudelis: eestikeelse dialoogi modelleerimine arvutil
Communicative strategies in a communication model: modelling Estonian dialogue on the computer
1.01.2008
31.12.2011
Eesti Teadusfondi uurimistoetus
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP176 Tehisintellekt 1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)50,0
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH360 Rakenduslingvistika, võõrkeelte õpetamine, sotsiolingvistika 6.2. Keeleteadus ja kirjandus50,0
PerioodSumma
01.01.2008−31.12.2008150 000,00 EEK (9 586,75 EUR)
01.01.2009−31.12.2009144 000,00 EEK (9 203,28 EUR)
01.01.2010−31.12.2010130 896,00 EEK (8 365,78 EUR)
01.01.2011−31.12.20118 365,20 EUR
35 521,01 EUR
41926,04

Antud projekti eesmärk on uurida ja analüüsida inimestevahelises eestikeelses suulises suhtluses rakendatavaid strateegiaid kui osalejate suhtluseesmärkide saavutamise meetodeid ning töötada välja formaalne dialoogimudel, mis võimaldab erinevaid strateegiaid esitada ja nendega opereerida, sh valida sobivat strateegiat, muuta strateegiat dialoogi käigus, pöörduda tagasi varasema strateegia juurde. Mudel realiseeritakse eksperimentaalse dialoogsüsteemina, mis suhtleb kasutajaga eesti keeles. Projektis arendatav dialoogsüsteem võimaldab kasutajal pidada eestikeelset dialoogi arvutiga inimestevahelise suhtlemise printsiipe järgides. Strateegiate rakendamine tagab sujuva suhtluse, minimiseerides suhtlustõrkeid. Dialoogsüsteemi integreeritakse olemasolevad eesti keele automaattöötluse vahendid. Uuritakse keelelisi vahendeid, mida kasutatakse eestikeelsetes dialoogides suhtlusstrateegiate väljendamiseks, ning võrreldakse neid teistes keeltes ja kultuurides kasutatavate vahenditega. Projekti käigus laiendatakse Eesti dialoogikorpust, millesse kogutakse erinevate eestikeelsete vestluste lindistusi, keskendudes infoandmis-, argumenteerimis- ja läbirääkimisdialoogidele. Korpuses märgendatakse dialoogiaktid, kasutades eelnevalt koostatud aktitüpoloogiat. Uuritakse erinevate andme- ja reeglipõhiste meetodite rakendatavust dialoogiaktide automaatseks tuvastamiseks Eesti dialoogikorpuses ja dialoogi juhtimiseks dialoogsüsteemis. Luuakse dialoogiaktide ja suhtlusstrateegiate automaatse märgendamise tarkvara.
The aim of this project is to study and to analyse communicative strategies as methods of achieving communicative goals of participants in Estonian spoken human-human conversations, and to work out a formal model of dialogue that makes it possible to represent and to use different communicative strategies, e.g. to choose a suitable strategy, to change it during communication, to return to an earlier strategy. The model will be implemented as an experimental dialogue system which interacts with a user in Estonian. The dialogue system that will be developed in the project gives an opportunity to a user to interact with the computer using norms and rules of human-human communication. Implementing a strategy makes it possible to reach fluency of interaction, communication problems will be minimised. Different existing software of automatic processing of Estonian will be integrated in the dialogue system. Linguistic means used for represention of communicative strategies in Estonian dialogues will be studied and compared with the means used in other languages and cultures. Estonian dialogue corpus will be extended during the project by collecting records of different spoken human-human conversations, first of all information seeking, argumentation and negotiation dialogues. Dialogue acts will be annotated in the corpus using the Estonian dialogue act typology. Different data-based and rule-based methods will be studied for automatic recognition of dialogue acts in Estonian dialogue corpus and dialogue management in a dialogue system. Software for automatic annotation of dialogue acts and conversation strategies will be created and implemented.

Vastutav täitja (1)

IsikKraadTöökoht ja ametCVOsalemise periood
Mare Koitdoktorikraadkeeletehnoloogia professorEST / ENG01.01.2008−31.12.2011

Põhitäitjad (17)

IsikKraadTöökoht ja ametCVOsalemise periood
Sven AllermagistrikraadTartu Ülikool, Sotsiaal- ja haridusteaduskond, Haridusteaduste instituut, Õpetajate seminar, Haridustehnoloogia lektor (0,25) Tartu Ülikool, Sotsiaal- ja haridusteaduskond, Haridusteaduste instituut, Õpetajate seminar, Haridustehnoloogia lektor (0,25)EST / ENG01.01.2011−31.12.2011
Liina Eskormagistrikraad (teaduskraad)EST / ENG01.01.2008−31.12.2010
Mark FišeldoktorikraadEST / ENG01.01.2008−31.12.2010
Olga Gerassimenkomagistrikraad (teaduskraad)EST / ENG01.01.2008−31.12.2010
Riina KasterpaluTartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut, Üldkeeleteaduse osakond, Muu ... (1,00)EST / ENG01.01.2008−31.12.2010
Harri KirikmagistrikraadEST / ENG01.01.2009−31.12.2010
Krista Mihkelsdoktorikraaderakorraline teadurEST / ENG01.01.2008−31.12.2010
Helen Nigolmagistrikraad (teaduskraad)Tartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut, spetsialist (0,20) Tartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut, spetsialist (0,20)EST / ENG01.01.2008−31.12.2010
Anni OjaEST / ENG01.01.2009−31.12.2011
Siim OrasmaadoktorikraadEST / ENG01.01.2009−31.12.2010
Siiri PärksondoktorikraadEST / ENG01.01.2009−31.12.2011
Anton RagnimagistrikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, Keeletehnoloogia õppetool, Doktorant (1,00) Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, Keeletehnoloogia õppetool, Doktorant (1,00)EST / ENG01.01.2008−30.06.2008
Tiit RoosmaadoktorikraadTartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, keeletehnoloogia dotsent (1,00) Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, keeletehnoloogia dotsent (1,00)EST / ENG01.01.2008−31.12.2010
Andriela Rääbisdoktorikraadarvutilingvistika teadurEST / ENG01.01.2008−31.12.2010
Raul SirelmagistrikraadEST / ENG01.01.2010−31.12.2011
Margus TreumuthdoktorikraadEST / ENG01.01.2008−31.12.2010
Haldur Õimdoktorikraaderakorraline vanemteadurEST / ENG01.01.2008−31.12.2010
Publikatsioonid
Publikatsioonid
Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Mihkels, K.; Laanesoo, K.; Oja, A.; Rääbis, A. (2011). Naabruspaarid ja kategoriseerimine netikommentaarides kui sidusa dialoogi loomise vahendid. Metslang, H.; Langemets, M.; Sepper, M.-M. (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat 7 (43−58).. Tallinn: Eesti Rakenduslingvistika Ühing.10.5128/ERYa7.03.
Koit, M. (2011). Automatic Recognition of Dialogue Acts in Complex Typology. Proc. of INISTA: International Symposium on INnovations in Intelligent SysTems and Applications, Istanbul, 15 - 18 June 2011. Ed. Akyokuş, S. et al. Istanbul: IEEE, 485−489.10.1109/INISTA.2011.5946122.
Koit, M. (2011). CONVERSATIONAL AGENT IN ARGUMENTATION: A Model and Evaluation on a Dialogue Corpus. ICAART 2011, 3rd International Conference on Agents and Artificial Intelligence, Proceedings, 1: 3rd International Conference on Agents and Artificial Intelligence, Rooma, 28.-30. jaanuar 2011. Ed. Joaquim Filipe and Ana Fred. SciTePress – Science and Technology Publications, 552−555.
Koit, M. (2011). Conversational Agent in Argumentation: Updating of Information States. Proceedings of the International Conference on Knowledge Engineering and Ontology Development: KEOD 2011 (International Conference on Knowledge Engineering and Ontology Development), Paris, France, 26 - 29 October, 2011. Ed. Joaquim Filipe and Jan L. G. Dietz. Paris: SciTEC Publications Ltd, 375−378.
Pärkson, Siiri (2011). Võlur Ozi eksperimentide kogumine ja partneri algatatud paranduste analüüs. Helle Metslang, Margit Langemets, Maria-Maren Sepper (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat = Estonian Papers in Applied Linguistics (197−214).. Tallinn: Eesti Rakenduslingvistika Ühing.10.5128/ERYa.1736-2563.
Koit, M. (2010). Eesti dialoogikorpus ja argumenteerimisdialoogi arvutil modelleerimine. Keel ja Kirjandus, 4, 241−262.
Gerassimenko, Olga; Kasterpalu, Riina; Koit, Mare; Rääbis, Andriela; Strandson, Krista (2010). Direktiivsed aktipaarid eestikeelsetes infodialoogides ja nende automaatne tuvastamine. Helle Metslang, Margit Langemets, Maria-Maren Sepper (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat 6 (67−86).. Tallinn: Eesti Keele Sihtasutus.
Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Laanesoo, K.; Oja, A.; Rääbis, A.; Strandson, K. (2010). The structure of a discontinuous dialogue formed by internet comments. In: Sojka, P.; Horak, A.; Kopecek, I.; Pala, K. (Ed.). Text, Speech and Dialogue (515−522).. Berlin/Heidelberg: Springer-Verlag.
Hennoste, Tiit; Gerassimenko, Olga; Kasterpalu, Riina; Koit, Mare; Laanesoo, Kirsti; Oja, Anni; Rääbis, Andriela; Strandson, Krista (2010). Internet Commentators as Dialogue Participants: Coherence Achieved through Membership Categorization. Proc. of the 4th International Conference Baltic HLT: 4th International Conference Human Language Technologies - the Baltic Perspective; Riga; 7.-8. oktoober 2010. Ed. Skadina, I.; Vasiljevs, A. IOS Press, 83−90. (Frontiers in Artificial Intelligence and Applications; 219).10.3233/978-1-60750-641-6-83.
Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K. (2009). Küsimused eestikeelses infodialoogis I. Küsimuste vorm. Keel ja Kirjandus, LII (5), 341−359.
Koit, M.; Gerassimenko, O.; Kasterpalu, R.; Rääbis, A.; Strandson, K. (2009). Towards computer-human interaction in natural language. International Journal of Computer Applications in Technology, 34 (4), 291−297.10.1504/IJCAT.2009.024082.
Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K. (2009). Suulise eesti keele korpus ja inimese suhtlus arvutiga. H. Metslang, M. Langemets, M.-M. Sepper, R. Argus (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat (111−130). Tallinn: Eesti Keele Sihtasutus.
Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K. (2009). Towards an Intelligent User Interface: Strategies of Giving and Receiving Phone Numbers. In: Text, Speech and Dialogue. 12th International Conference, TSD 2009 Pilsen, Czech Republic, September 2009 (347−354).. Springer. (Lecture Notes in Computer Science; 5729).
Koit, M. (2009). Experiments on Automatic Recognition of Dialogue Acts. Proceedings of SPECOM'2009: 13th International Conference Speech and Computer, St. Petersburg, 22-25 June 2009. Ed. A. Karpov. St. Petersburg, Russia: Institution of the Russian Academy of Sciences St. Petersburg Institute for Informatics and Automati, 533−538.
Koit, M.; Roosmaa, T.; Õim, H. (2009). Knowledge representation for human-machine interaction. Proceedings of the International Conference on Knowledge Engineering and Ontology Development: International Conference on Knowledge Engineering and Ontology Development, Madeira (Portugal), 6-8 October 2009. Ed. Ed. Jan L.G. Dietz. Portugal: INSTICC, 396−399.
Koit, M. (2009). Towards Human-Computer Interaction in Natural Language: Automatic Recognition of Users´ Queries. Proceedings of INISTA 2009: International Symposium on INnovations in Intelligent SysTems and Applications, Trabzon (Turkey), 29 June - 1 July 2009. Ed. I. Kaya. Trabzon: Karadeniz Teknik Universitesi, 75−79.
Koit, M.; Gerassimenko, O.; Kasterpalu, R.; Rääbis, A.; Strandson, K. (2008). Developing a Dialogue System: How to Grant a Customer’s Directive? TSD 2008. Proceedings: Text, Speech and Dialogue. 11th International Conference; Brno, Czech Republic; 8-12 September 2008. Ed. Sojka, P.; Horak, A.; Kopecek, I.; Pala, K. Heidelberg: Springer, 593−600. (Lecture Notes in Computer Science; 5246).10.1007/978-3-540-87391-4_75.
Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K. (2008). From Analysis of Human-Human Phone Calls to Intelligent User Interfaces. Proceedings of 4th International Conference on Intelligent Systems, II: 2008 4th International Conference on Intelligent Systems; Varna, Bulgaria; September 6-8, 2008. Ed. Yager, R.R.; Sgurev, V.S.; Jotsov, V.S. Sofia, Bulgaria: IEEE-Inst Electrical Electronics Engineers Inc, 10-30−10-35.
Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K. (2008). From Human Communication to Intelligent User Interfaces: Corpora of Spoken Estonian. Proceedings of the LREC-2008 (CD): 6th International Conference on Language Resources and Evaluation; Marrakech; 28-30 May 2008. Ed. Calzollari, N.; Chouki, K.; Mangaard, B.; Mariani, J.; Ojdik, J.; Piperidis, S.; Tapias, D. Morocco: ELRA, 1−8.
Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K. (2008). Recognition of Yes/No Questions: Analysis of the Estonian Dialogue Corpus. The Third Baltic Conference on Human Language Technologies. Proceedings: The Third Baltic Conference on Human Language Technologies; Kaunas; October 4-5, 2007. Ed. Cermak, F.; Marcinkeviciene, R.; Rimkute, E.; Zabarskaite, J. Vilnius, 95−101.
Koit, M.; Gerassimenko, O.; Kasterpalu, R.; Rääbis, A.; Strandson, K. (2008). Towards Computer-Human Interaction in Natural Language. The 5th International Conference on Information Technology and Applications: The 5th International Conference on Information Technology and Applications; Cairns, Queensland, Australia; 23.06.-26.06.2008. 77−82.
Pärkson, Siiri (2010). Human-Computer Interaction in Estonian: Collection and Analysis of Simulated Dialogues. Human Language Technologies - The Baltic Perspective. Proceedings of the Fourth International Conference Baltic HLT 2010: Human Language Technologies - The Baltic Perspective; Riga, Latvia; October 7–8, 2010. Ed. Skadina, Inguna; Vasiljevs, Andrejs. Latvia: IOS Press, 99−106.
Juhendamised
Juhendamised
Margus Treumuth, doktorikraad, 2011, (juh) Mare Koit; Päivi Kristiina Jokinen, A Framework for Asynchronous Dialogue Systems: Concepts, Issues and Design Aspects (Asünkroonsete dialoogsüsteemide raamistik: mõisted, probleemid ja kavandamise aspektid), Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut.
Mark Fišel, doktorikraad, 2011, (juh) Mare Koit; Joakim Nivre, Optimizing Statistical Machine Translation via Input Modification (Statistilise masintõlke optimeerimine sisendi modifitseerimise teel), Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut.