"Eesti Teadusfondi uurimistoetus" projekt ETF9124
ETF9124 "Suhtlusagendi modelleerimine ja Eesti dialoogikorpus (1.01.2012−31.12.2014)", Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.
ETF9124
Suhtlusagendi modelleerimine ja Eesti dialoogikorpus
Modelling of conversational agent and Estonian dialogue corpus
1.01.2012
31.12.2014
Eesti Teadusfondi uurimistoetus
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP170 Arvutiteadus, arvutusmeetodid, süsteemid, juhtimine (automaatjuhtimisteooria)1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)50,0
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus50,0
PerioodSumma
01.01.2012−31.12.20128 496,00 EUR
01.01.2013−31.12.20138 496,00 EUR
01.01.2014−31.12.20148 496,00 EUR
25 488,00 EUR
31200,00

Antud projekti eesmärk on välja töötada suhtlusagendi formaalne mudel, mis võimaldaks esitada eestikeelset dialoogi inimese ja suhtlusagendi vahel kui pidevalt ajakohastatavate infoseisundite järjendit, mille määravad lisaks lausungitele ja nendes väljendatud suhtlusaktidele ka osalejate arvamused, soovid ja eesmärgid ning suhtluseesmärkide saavutamise meetodid ehk strateegiad. Strateegia valik ja rakendamine sõltub tema oodatavast edukusest suhtluseesmärgi saavutamisel, mida omakorda saab prognoosida varem analoogilistes olukordades toimunud dialoogide alusel. Mudelis ühendatakse dialoogi automaattöötluse reeglipõhised ja andmepõhised meetodid ning arendatakse sellega edasi varasemates projektides loodud mudelit, milles rakendati tehisintellektist tuntud planeerimistehnikaid. Mudel realiseeritakse eksperimentaalse dialoogsüsteemina, mis suhtleb kasutajaga eesti keeles. Dialoogsüsteemis lõimitakse mõned olemasolevad eesti keele automaatse analüüsi ja sünteesi vahendid. Arendatava dialoogimudeli treenimiseks ja testimiseks kasutatakse Eesti dialoogikorpust. Projekti käigus laiendatakse korpust, kogudes sellesse inimestevaheliste eestikeelsete vestluste lindistusi ja eestikeelseid dialooge nii varem loodud dialoogsüsteemidega kui ka projekti käigus arendatava süsteemiga, samuti võrdlusmaterjalina venekeelseid dialooge. Selleks, et oleks võimalik suhtlusstrateegiate automaatne õppimine, märgendatakse korpuses dialoogiaktid, kasutades eelnevalt loodud aktitüpoloogiat ja märgendustarkvara, mida arendatakse vastavalt vajadusele.
The aim of this project is to work out a formal model of conversational agent, enabling to represent dialogue between human user and the agent in Estonian as a sequence of dynamically updated information states. Information states are determined not only by utterances and dialogue acts expressed in the utterances, but they also take into account beliefs, desires and intentions of dialogue participants and methods of achieving their communicative goals, or strategies. Choice and implementation of a strategy depends on its expected success to achieve a certain communicative goal. The success can be predicted using machine learning on dialogues which have taken place in similar situations. The model will integrate rule-based and data-based methods of dialogue processing. In this way, it will extend a former model where planning techniques known from the Artificial Intelligence were used. The model will be implemented as an experimental dialogue system which interacts with a user in Estonian. Existing modules of analysis and generation of Estonian will be integrated into the system. Estonian dialogue corpus will be used in order to train and test the model. The corpus will be extended, human-human conversations in Estonian and interactions between human user and dialogue systems (former and current) will be added into the corpus. Russian dialogues will be collected and analysed for comparison. Dialogue acts will be annotated in the corpus, in order to make it possible to learn strategies automatically from the corpus. Existing typology of Estonian dialogue acts and annotation tools will be used and developed.
Analüüsiti konversatsiooniagentides kasutatud arhitektuure (regulaaravaldistele, freimidele ja planeerimisele põhinev ning infoseisundeid kasutav). Töötati välja infoseisundi esitus, mis kaasab mõisted, mida siiani on kasutatud planeerimisele põhinevas arhitektuuris: ühendati agendi arvamused, soovid ja eesmärgid arutlusmudeli ja suhtlusstrateegiaga. Infoseisundid integreeriti konversatsiooniagendi mudelisse. Laiendati Eesti dialoogikorpust: salvestati ja litereeriti inimestevahelisi suulisi läbirääkimisdialooge (44 dialoogi), kus märgendati dialoogiaktid Eesti dialoogiaktide tüpoloogia alusel. Kahe varem loodud veebipõhise liidese abil koguti ja lisati korpusesse 240 uut kirjalikku simuleeritud dialoogi, kus arvuti rolli täidab kasutaja teadmata teine inimene. Arendati edasi veebipõhist tarkvara eestikeelsetes dialoogides dialoogiaktide poolautomaatseks ning dialoogi lineaarse ja hierarhilise struktuuri ning suhtlusstrateegiate automaatseks märgendamiseks. Seda tarkvara kasutades märgendati dialoogide struktuur ja suhtlusstrateegiad Eesti dialoogikorpuse suulistes inimestevahelistes infodialoogides ning kolme erinevat liiki läbirääkimisdialoogides (müügivestlused, reisibüroodialoogid ja argumenteerimist sisaldavad argivestlused). Analüüsiti ja võrreldi suhtlusstrateegiate kasutamist erinevat liiki dialoogides. Konversatsiooniagendi formaalset mudelit rakendati läbirääkimistele. Selleks lisati mudelisse argumendi formaalne mudel, mille koosseisu kuuluvad eeldused ja väide. Analüüsiti argumentide keelelist esitust ja vastavaid dialoogiakte kolmes Eesti dialoogikorpuse alamkorpuses. Analüüsiti argumendistruktuuri ja selle automaatse tuvastamise võimalusi müügivestlustes. Loodi eksperimentaalne dialoogsüsteem – konversatsiooniagent, mis argumenteerimisdialoogis suhtleb kasutajaga eesti keeles.

Vastutav täitja (1)

IsikKraadTöökoht ja ametCVOsalemise periood
Mare Koitdoktorikraadkeeletehnoloogia professorEST / ENG01.01.2012−31.12.2014

Põhitäitjad (6)

IsikKraadTöökoht ja ametCVOsalemise periood
Sven AllermagistrikraadEST / ENG01.01.2012−31.12.2014
Olga Gerassimenkomagistrikraad (teaduskraad)Tartu Ülikool, Teadur (1,00)EST / ENG01.01.2012−31.12.2014
Siiri PärksondoktorikraadEST / ENG01.01.2012−31.12.2014
Raul SirelmagistrikraadOÜ Tarkvara Tehnoloogia Arenduskeskus, Teadur (1,00)EST / ENG01.01.2012−31.12.2014
Margus TreumuthdoktorikraadanalüütikEST / ENG01.01.2012−31.12.2014
Haldur ÕimdoktorikraadEST / ENG01.01.2012−31.12.2014
Projektid
Projekt
EKKM09-104; "Tartu ülikooli süstemaatilise netiallkeelte korpuse koostamine"; Tiit Hennoste;
EKKTT09-57; "Intelligentne kasutajaliides andmebaasidele"; Mare Koit;
EKKTT09-61; "Tartu ülikooli eesti kõnekeele audio- ja videokorpuse kogumine ja otsingutarkvara loomine"; Tiit Hennoste;
ETF7503; "Suhtlusstrateegiad suhtlusmudelis: eestikeelse dialoogi modelleerimine arvutil"; Mare Koit;
ETF8558; "Eestikeelse spontaanse dialoogi struktuuri loomise keelelised vahendid"; Andriela Rääbis;
SF0180078s08; "Loomulike keelte arvutitöötluse formalismide ja efektiivsete algoritmide väljatöötamine ning eesti keelele rakendamine"; Mare Koit;
SF0180078s08AP; "Väikesemahulise teaduse infrastruktuuri kaasajastamine teadusteema SF0180078s08 raames"; Mare Koit;
SF0180078s08AP11; "Väikesemahulise teaduse infrastruktuuri kaasajastamine teadusteema SF0180078s08 raames"; Mare Koit;
Publikatsioonid
Publikatsioonid
Koit, Mare (2012). Konversatsiooniagendi modelleerimine argumenteerimisdialoogis: suhtlus kui infoseisundite värskendamine. H. Metslang; M. Langemets; M.-M. Sepper (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat = Estonian Papers in Applied Linguistics (109−122).. Tallinn: Eesti Rakenduslingvistika Ühing.10.5128/ERYa8.07.
Õim, Haldur; Koit, Mare (2014). Keele mõistmise modelleerimine arvutil. Semantika, ontoloogia ja sündmuste esitus kahe valdkonna näitel. Keel ja Kirjandus, 3, 169−194.
Aller, Sven; Gerassimenko, Olga; Hennoste, Tiit; Kasterpalu, Riina; Koit, Mare; Mihkels, Krista; Laanesoo, Kirsi; Rääbis, Andriela (2014). Dialoogide pragmaatilise analüüsi tarkvara. Helle Metslang, Margit Langemets, Maria-Maren Sepper (Toim.). Eesti Rakenduslingvistika Ühingu Aastaraamat = Estonian Papers in Applied Linguistics (23−36).. Eesti Rakenduslingvistika Ühing.10.5128/ERYa.1736-2563.
Koit, Mare; Õim, Haldur (2014). A computational model of argumentation in agreement negotiation processes. Argument & Computation, 5, 209−236.10.1080/19462166.2014.915233.
Muischnek, Kadri; Fišel, Mark; Kaalep, Heiki-Jaan; Koit, Mare; Müürisep, Kaili; Orav, Heili; Vare, Kadri; Õim, Haldur (2012). Arvutilingvistika ja keeletehnoloogia Tartu Ülikoolis. Erelt, Mati; Mäearu, Sirje (Toim.). Emakeele Seltsi Aastaraamat (66−102).. Tallinn: TA Kirjastus.
Koit, Mare (2013). Recognizing the dialogue phases: Analysis of human-human phone calls. Proc. of 2013 IEEE International Symposium Innovations in Intelligent Systems and Applications (INISTA): 2013 IEEE International Symposium Innovations in Intelligent Systems and Applications (INISTA); Albena, Bulgaria; 19-21 June 2013, . Ed. Kiril Alexiev; Petia Koprinkova-Hristova. Institute of Electrical and Electronics Engineers (IEEE), 1−5.10.1109/INISTA.2013.6577622.
Koit, Mare (2014). (Semi-)Automatic Analysis of Dialogues. Proceedings of the 6th International Conference on Agents and Artificial Intelligence, 1: 6th International Conference on Agents and Artificial Intelligence, ESEO; Angers, Loire Valley, France; 6 - 8 March, 2014. Ed. Béatrice Duval, Jaap van den Herik, Stephane Loiseau and Joaquim Filipe. Portugal: SciTePress, 445−452.
Koit, Mare (2014). Towards Automatic Recognition of the Negotiation Strategies: Analysis of Human-Human Dialogues. 2014 IEEE International Symposium on Innovations in Intelligent Systems and Applications (INISTA 2014) Proceedings: 2014 IEEE International Symposium on Innovations in Intelligent Systems and Applications (INISTA 2014), Alberobello, 23-25 June 2014. IEEE, 170−176.
Koit, Mare; Õim, Haldur (2014). Modelling Debates on the Computer. Proceedings of the International Conference on Knowledge Engineering and Ontoly Development: 6th International Conference on Knowledge Engineering and Ontoly Development, Rome, Italy, 21-24 October, 2014. Ed. Joaquim Filipe, Jan Dietz and David Aveiro. SciTEC Publications Ltd, 361−368.
Koit, Mare; Õim, Haldur (2013). From Study of Human-Human Dialogues to Reasoning Model. Conversational Agent in Argumentation Dialogue. Proc. of the 5th International Conference on Agents and Artificial Intelligence., 2: 5th International Conference on Agents and Artificial Intelligence, Barcelona, Spain, 15-18 February 2013. Ed. Joaquim Filipe, Ana Fred. Barcelona: SciTePress, 210−216.
Õim, Haldur; Koit, Mare (2013). Event Representation in Text Understanding. Transfer of Meaning Structures. Proceedings of the International Conference on Knowledge Engineering and Ontology Development: International Conference on Knowledge Engineering and Ontology Development (KEOD-2013), Vilamoura, Algarve, Portugal. Ed. Joaquim Filipe, Jan Dietz. INSTICC, Portugal: SciTEC Publications Ltd, 367−372.
Koit, Mare (2012). Developing Software for Training Argumentation Skills. Proc. of CMNA-2012: The 12th Workshop on Computational Models of Natural Argument at ECAI-2012; Montpellier, France; 27 August 2012. Ed. Floriana Grasso, Nancy Green, Chris Reed. Montpellier, 11−15.
Sirel, R. (2012). Knowledge Acquisition Tool for Dialogue Systems. Frontiers in Artificial Intelligence and Applications, 247: Human Language Technologies – The Baltic Perspective, 4.-5. Oct Tartu. Ed. Arvi Tavast, Kadri Muischnek, Mare Koit. Amsterdam: IOS Press, 201−205.
Sirel, Raul (2012). Dynamic User Interfaces for Synchronous Encoding and Linguistic Uniforming of Textual Clinical Data. Frontiers in Artificial Intelligence and Applications, 247: Human Language Technologies – The Baltic Perspective, 4.-5. Oct Tartu. Ed. Arvi Tavast, Kadri Muischnek, Mare Koit. Amsterdam: IOS Press, 206−212.
Koit, Mare (2012). Towards automatic recognition of the structure of Estonian directory inquiries. Proc. of 5th Int. Conf. on Human Language Technologies: the Baltic Perspective, 247: Baltic HLT 2012, Tartu, Oct. 2012. Ed. A. Tavast, K. Muischnek, M. Koit. IOS Press, 120−128.10.3233/978-1-61499-133-5-120.
Õim, Haldur; Koit, Mare (2012). Influencing Reasoning in Interaction: a Model. Proc. of SemDial 2012 (SeineDial): 16th Workshop on the Semantics and Pragmatics of Dialogue, Paris, 19-21 September 2012. Ed. Sarah Brown-Schmidt, Jonathan Ginzburg, Staffan Larsson. Paris, 159−160.
Koit, Mare (2015). Communicative Strategy in a Formal Model of Dispute. Proceedings of the International Conference on Agents and Artificial Intelligence, 2: 7th International Conference on Agents and Artificial Intelligence (ICAART), Lisbon, Portugal, 10-12 January, 2015. Ed. Stephane Loiseau, Joaquim Filipe, Béatrice Duval and Jaap van den Herik. SciTEC Publications Ltd, 489−496.
Õim, Haldur; Koit, Mare (2015). Keeletehnoloogiast tehisintellektikonverentsidel. Keel ja Kirjandus, 3, 188−196.
Koit, Mare (2015). Tehisintellekt – mis oli, mis on uus ja mis tuleb. Sirp (34−35).. SA Kultuurileht.
Koit, Mare (2015). Läbirääkimiste modelleerimine arvutil. Eesti Rakenduslingvistika Ühingu aastaraamat, 11, x−x.10.5128/ERYa11.08 [ilmumas].
Juhendamised
Juhendamised
Sven Aller, magistrikraad, 2012, (juh) Mare Koit, Dialoogiaktide märgendamine Eesti dialoogikorpuses: ülevaade ressurssidest ja tarkvaraarendus, Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut.
Merle Kaldjärv, doktorikraad, 2014, (juh) Haldur Õim, Riigieksamikirjandite argumentatsiooni uuring, Tallinna Ülikool, Kasvatusteaduste Instituut.