"Sihtfinantseerimine" projekt SF0182541s03
SF0182541s03 "Eesti keele arvutimudelid ja keeleressursid: teoreetilised ja rakenduslikud aspektid. (1.01.2003−31.12.2007)", Haldur Õim, Tartu Ülikool, Filosoofiateaduskond.
SF0182541s03
Eesti keele arvutimudelid ja keeleressursid: teoreetilised ja rakenduslikud aspektid.
Computational and language resources for Estonian: theoretical and applicational aspects
1.01.2003
31.12.2007
Sihtfinantseerimine
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
2. Ühiskonnateadused ja kultuur2.6. Filoloogia ja lingvistikaH350 Keeleteadus6.2. Keeleteadus ja kirjandus50,0
4. Loodusteadused ja tehnika4.6. ArvutiteadusedP170 Arvutiteadus, arvutusmeetodid, süsteemid, juhtimine (automaatjuhtimisteooria)1.1. Matemaatika ja arvutiteadus (matemaatika ja teised sellega seotud teadused: arvutiteadus ja sellega seotud teadused (ainult tarkvaraarendus, riistvara arendus kuulub tehnikavaldkonda)50,0
AsutusRollPeriood
Tartu Ülikool, Filosoofiateaduskondkoordinaator01.01.2003−31.12.2007
PerioodSumma
01.01.2003−31.12.2003793 000,00 EEK (50 681,94 EUR)
01.01.2004−31.12.2004891 000,00 EEK (56 945,28 EUR)
01.01.2005−31.12.2005998 000,00 EEK (63 783,83 EUR)
01.01.2006−31.12.20061 209 000,00 EEK (77 269,18 EUR)
01.01.2007−31.12.20071 366 200,00 EEK (87 316,09 EUR)
335 996,32 EUR

Teema on jätkuks varasemale TÜ üldkeeleteaduse õppetooli ja arvutiteaduse instituudi töötajaid ja kraadiõppureid ühendava arvutuslingvistika töörühma teemale ?Arvutuslingvistiliste vahendite väljatöötamine ja rakendamine eesti keele  arvutiressursside loomiseks? (1998-2002, reg. nr. 0180528s98). Eesmärk on katta keeletarkvara ja arvutiesitusega eesti keele põhilised tasandid ? morfoloogia, süntaks, semantika (leksika), pragmaatika (suuline suhtlus, dialoog). Selleks on vaja ühelt poolt lahendada lingvistilisi probleeme ja arendada keeleressursse (korpusi ja leksikone), teiselt poolt töötada välja formaalseid mudeleid ja vajalikku keeletarkvara.  Kõikide keeletasandite käsitlustel on teoreetiline aspekt ja ka formaliseerimisele, arendusele ja tarkvara väljatöötamisele suunatud aspekt. Viimast koordineerib TÜ keeletehnoloogia professor Mare Koit. Töö tulemused on rakendatavad  infootsi- ja tõlkesüsteemide loomises, eesti keele grammatikakorrektori väljatöötamises, aga ka näiteks sõnaraamatute koostamises, keeleõppeprogrammides,  teadusliku  morfoloogia  ja süntaksi väljatöötamises. Oluline on kontakt kõnetuvastus- ja sünteesiprogrammidega, millega tegeldakse TTÜ küberneetika instituudis ja Eesti Keele Instituudis. Ülesannete täitmiseks on töörühmal olemas vajalik kompetents. Töörühm on Eesti Keeletehnoloogia Uurimisüksuse koosseisus arvatud potentsiaalsete tippkeskuste hulka.
The applied research theme is a continuation of the former theme of the group of computatinal linguistics uniting researchers from the Department of General Linguistics and Institute of Computer Science ?Elaboration and application of computational linguistics means in creating the computer resources for the Estonian language? (1998-2002, reg. nr. 0180528s98). The overall objective is to provide language software and computer access to the main strata of Estonian: morphology, syntax, semantics (lexica), pragmatics (oral communication, dialogue). To achieve this objective, it is necessary to solve linguistic problems and develop language resources (corpora) on the one hand, and to elaborate formal models and necessary language software, on the other hand.  All the strata include both the theoretical items as well as the formalisation, development and software elaboration-related items. The latter work is being co-ordinated by Mare Koit, Language Technology Professor at UT. The outcome of the work can be applied in developing information retrieval and translation systems, grammar checker of Estonian, but also in compiling dictionaries, language learning programmes, preparing the academic grammars of morphology and syntax. An important connection is to the programs of speech generation and recognition that are being developed in Tallinn Technical University and the Institute of Estonian language. The group possesses the required competence as it has been selected a potential centre of excellence in Estonia.

Vastutav täitja (1)

IsikKraadTöökoht ja ametCVOsalemise periood
Haldur ÕimdoktorikraadEST / ENG01.01.2003−31.12.2007

Põhitäitjad (12)

IsikKraadTöökoht ja ametCVOsalemise periood
Olga Gerassimenkomagistrikraad (teaduskraad)EST / ENG01.01.2003−31.12.2007
Heiki-Jaan KaalepdoktorikraadEST / ENG01.01.2003−31.12.2007
Neeme Kahuskmagistrikraad (teaduskraad)EST / ENG01.01.2003−31.12.2007
Mare KoitdoktorikraadEST / ENG01.01.2003−31.12.2007
Krista MihkelsdoktorikraadEST / ENG01.01.2003−31.12.2007
Kadri MuischnekdoktorikraadEST / ENG01.01.2003−31.12.2007
Kaili MüürisepdoktorikraadEST / ENG01.01.2003−31.12.2007
Heili OravdoktorikraadEST / ENG01.01.2003−31.12.2007
Tiit RoosmaadoktorikraadEST / ENG01.01.2003−31.12.2007
Andriela RääbisdoktorikraadEST / ENG01.01.2003−31.12.2007
Heli Uibomagistrikraad (teaduskraad)EST / ENG01.01.2003−31.12.2007
Kadri VidermagistrikraadEST / ENG01.01.2003−31.12.2007

Täitjad (6)

IsikKraadTöökoht ja ametCVOsalemise periood
Kaarel KaljuranddoktorikraadEST / ENG01.01.2003−01.01.2007
Riina KasterpaluEST / ENG01.01.2005−01.01.2007
Helen Nigolmagistrikraad (teaduskraad)EST / ENG01.01.2003−01.01.2007
Margus TreumuthdoktorikraadEST / ENG01.01.2003−01.01.2007
Maret ValdisooEST / ENG01.01.2003−01.01.2007
Evely Vuttmagistrikraad (teaduskraad)EST / ENG01.01.2003−01.01.2007

Projektiga seotud tööjõud (2)

IsikKraadAsutusAmetKoormusKoormus väljaspoolOsalemise periood
ProjektisKoormus väljaspool
Tarmo Vainoprogrammeerija1...−31.12.2006
Urve TalvikTÜ, teaduskorralduse spetsialist1...−31.12.2006
Publikatsioonid
Publikatsioonid
Koit, M. (2007). Arvuti suhtluses. Eesti Rakenduslingvistika Ühingu aastaraamat, 3, 193−209.
Gerassimenko, O.; Hennoste, T.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K.; Valdisoo, M.; Vutt, E. (2007). Kliendi soovide automaatne tuvastamine eestikeelsetes infodialoogides. Metslang, H.; Langemets, M.; Sepper, M.-M. (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat (135−154).. Tallinn: Eesti Keele Sihtasutus.
Gerassimenko, O.; Koit, M.; Rääbis, A.; Strandson, K. (2007). Achieving Goals in Collaboration: Analysis of Estonian Institutional Calls. Proceedings: 16th Nordic Conference of Computational Linguistics NODALIDA-2007; 25.-26.05.2007; Tartu, Estonia. Ed. Nivre, J.; Kaalep, H.-J.; Muischnek, K.; Koit, M. Tartu: University of Tartu, 59−66.
Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K. (2007). Initial Requests in Institutional Calls: Corpus Study. International Conference Recent Advances in Natural Language Processing. Proceedings: Recent Advances in Natural Language Processing, 27.-29.09.2007 Borovets, Bulgaaria. Ed. G. Angelova, K. Bontceva, R. Mitkov, N. Nicolov, N. Nikolov. Shoumen, 230−234.
Koit, M.; Roosmaa, T.; Õim, H. (2007). От синтаксиса к семантике – к выбору формализмов и лингвистических ресурсов. Computational Linguistics and Intellectual Technologies. International Conference "Dialogue 2007". Proceedings: International Conference "Dialogue 2007" , Bekasovo, 30 May - 3 June, 2007. Toim. L. Iomdin, N. Laufer, S. Narinjani, V. Selegei. Moscow: Izd-vo RGGU, 295−301.
Kasterpalu, R.; Gerassimenko, O.; Koit, M.; Rääbis, A.; Strandson, K. (2007). Customers' direct and indirect requests in Estonian institutional calls: corpus analysis. Abstracts: 10th International Pragmatics Conference; Göteborg, Sweden; 8-13 July 2007. Göteborg, 352−353.
Truu, T.; Õim, H.; Koit, M. (2007). Interpretation of Yes/No Questions as Metaphor Recognition. The 16th Nordic Conference of Computational Linguistics. NODALIDA 2007 PROCEEDINGS: NODALIDA 2007, Tartu, Estonia, May, 24-26, 2007. Ed. Joakim Nivre, Heiki-Jaan Kaalep, Kadri Muischnek and Mare Koit. Tartu, 398−401.
Gerassimenko, O.; Hennoste, T.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K.; Valdisoo, M.; Vutt, E. (2007). Razmečennõi dialogovõj korpus i modelirovanie dialoga: obzor Estonstogo Dialogovoga Korpusa EDiK. Dokladõ meždunarodnoj naučnoj konferencii: Megaling´ 2007. Gorizontõ prikladnoj lingvistiki i lingvističeskih tehnologij; 23-29.09.2007; Ukraina, Krõm, Partenit. Toim. Shirokov, V.A.; Dikareva, S.S. Simferopol: Simferopol: Publishing house DIP, 116−117.
Nivre, J.; Kaalep, H.-Ja.; Muischnek, K.; Koit, M. (2007). Proceedings of the 16th Nordic Conference of Computational Linguistics NODALIDA-2007. elektr..
Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K.; Valdisoo, M. (2006). Cue-based interpretation of customer's requests: Analysis of Estonian dialogue corpus. Advances in Natural Language Processing, Proceedings, 206−213.
Koit, M.; Valdisoo, M.; Gerassimenko, O.; Hennoste, T.; Kasterpalu, R.; Rääbis, A.; Strandson, K. (2006). Processing of Requests in Estonian Institutional Dialogues: Corpus Analysis. Text, Speech and Dialogue, Proceedings, 621−628.
Koit, M.; Roosmaa, T.; Õim, H. (2006). Keeletehnoloogia suundumusi: Eesti kuulub Euroopasse. Keel ja Kirjandus, 12, 988−992.
Koit, M.; Pajusalu, R.; Õim, H. (2006). Saateks : [artiklikogumikule Keel ja arvuti]. M. Koit, R. Pajusalu, H. Õim (Toim.). Keel ja arvuti (7−12).. Tartu: Tartu Ülikool. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised; 6).
Koit, M. (2006). Ratsionalism ja empirism keeletöötluses: vastasseis või koostöö? Tragel, I.; Haldur, Õ. (Toim.). Teoreetiline keeleteadus Eestis (41−54).. Tartu: Tartu Ülikool. (TÜ üldkeeleteaduse õppetooli toimetised; 7).
Koit, M.; Valdisoo, M.; Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Rääbis, A.; Strandson, K. (2006). Processing of customer´s requests: analysis of Estonian dialogue corpus. 11th International Conference Speech and Computer (SPECOM); St. Petersburg, Russia; 25.-29.06.2006. St. Petersburg: Anatolya Publishers, 193−198.
Gerassimenko, O.; Hennoste, T.; Koit, M.; Kasterpalu, R.; Rääbis, A.; Strandson, K.; Valdisoo, M.; Vutt, E. (2006). Razmechennyj korpus dialogov kak resurs modelirovanija dialoga: organizacija i razmetka Estonskogo korpusa dialogov. Sovremennye informacionnye tehnologii i pis'mennoe nasledie: ot drevnih rukopisej k elektronnym tekstam. Izhevsk, 13.–17.07.2006. Izhevsk: Izdatel'stvo IzhGTU, 32−37.
Koit, M. (2006). Конверзационный агент в информационно-справочном диалоге. Труды международной конференции «Диалог 2006»: International Conference “Dialogue 2006”; Bekasovo; 31 May – 4 June, 2006. Toim. Н.И. Лауфер, А. С. Нариньяни, В. П. Селегея. Moskva, 269−274.
Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Raabis, A.; Strandson, K.; Valdisoo, M. (2005). Questions in Estonian information dialogues: Form and functions. Text, Speech and Dialogue, Proceedings, 3658, 420−427.
Õim, Haldur; Koit, Mare (2005). Developing a Dialogue System that Interacts with a User in Estonian. In: Arppe, Carlson, Heinamäki, Linden, Miestamo, Piitulainen, Tupakka, Westerlund, Yli-Jyrä et al. (Ed.). A Finnish Computer Linguist: Kimmo Koskenniemi. Festschrift on the 60th birthday (278−288).. Center for the Study of Language and Information. (CSLI Publications).
Koit, M. (2005). Argumentation in Institutional Dialogues: Corpus Analysis. IJCAI-05 Workshop on Computational Models of Natural Argument. Working Notes: IJCAI-05 Workshop on Computational Models of Natural Argument; Edinburgh; 30 July 2005. Ed. Reed, C. Edinburgh, 80−83.
Hennoste, T.; Gerassimenko, O.; Kasterpalu, R.; Koit, M.; Rääbis, A.; Strandson, K.; Valdisoo, M. (2005). Information-sharing and correction in Estonian information dialogues: corpus analysis. 2nd Baltic Conference on Human Language Technologies; Tallinn, Estonia; 04.-05.04.2005. Tallinn: Institute of Cybernetics, 249−254.
Rääbis, A.; Hennoste, T.; Koit, M.; Truu, T.; Gerassimenko, O.; Valdisoo, M.; Kasterpalu, R.; Strandson, K. (2005). Miscommunication in Spoken Dialogues and its Modelling in a Dialogue System. 10th International Workshop on Speech and Computer (SPECOM 2005); St. Petersburg, Russia; 17.-19.10.2005. Patras, Greece: University of Patras, 413−416.
Koit, Mare (2005). Вопросно-ответные стратегии эстонских информационно-справочных диалогах. Proceedings of Dialog-2005 International Conference Computational linguistics and intellectual technologies: Звенигород, 1-6 июня, 2005. Toim. И.М. Кобозева; А.С. Нариньяни; В.П. Селегея. Moskva: Nauka, 267−271.
Koit, Mare; Õim, Haldur (2005). Keeletehnoloogia põnevad rakendused. (2)..
Gerassimenko, O.; Hennoste, T.; Koit, M.; Rääbis, A.; Strandson, K.; Valdisoo, M.; Vutt, E. (2004). Annotated Dialogue Corpus as a Language Resource: An Experience of Building the Estonian Dialogue Corpus. The Baltic Perspective: 1st Baltic Conference Human Language Technologies; Riga, Latvia; 21.-22.04.2004. Riga, Latvia, 150−155.
Hennoste, T.; Koit, M.; Rääbis, A.; Valdisoo, M. (2004). Developing a Dialogue Act Coding Scheme: An Experience of Annotating the Estonian Dialogue Corpus. 4th International Conference on Language Resources and Evaluation (LREC 2004); Lisboa, Portugal; 24.05.2004. Ed. Oostdijk, N.; Kristoffersen, G.; Sampson, G. Lisboa, Portugal, 40−47.
Gerassimenko, O.; Hennoste, T.; Koit, M.; Rääbis, A.; Valdisoo, M. (2004). Developing a Typology of Dialogue Acts: Question - Answer Adjacency Pairs in Estonian Information Dialogues. Catalog'04: 8th Workshop on the Semantics and Pragmatics of Dialogue; Barcelona, Spain; 19.-21.07.2004. Ed. Jonathan Ginzburg, Enric Vallduvi. Barcelona, 150−151.
Gerassimenko, O.; Hennoste, T.; Koit, M.; Rääbis, A. (2004). Other-initiated Self-Repairs in Estonian Information Dialogues: Solving Communication Problems in Cooperation. 5th SIGdial Workshop on Discourse and Dialogue; Cambridge, UK; 30.04.-01.05.2004. Ed. Strube, M.; Sidner, C. Cambridge, 39−42.
Койт, М. (2004). Коммуникативные акты и коммуникативные стратегии: анализ эстонского корпуса диалогов. Proceedings of Dialog-2004, International Conference Computational linguistics and intellectual technologies. Moskva: Nauka, 329−334.
Hennoste, T.; Koit, M.; Strandson, K.; Rääbis, A.; Valdisoo, M.; Vutt, E. (2004). Küsimuste ja direktiivide märgendamine eestikeelsetes infodialoogides. Sepper, M.-M.; Lepasaar, J. (Toim.). Toimiv keel II. Töid rakenduslingvistika alalt. Tallinna Pedagoogikaülikooli eesti filoloogia osakonna toimetised (138−154).. Tallinn: Tallinna Pedagoogikaülikooli Kirjastus.
Gerassimenko, Olga; Hennoste, Tiit; Koit, Mare; Rääbis, Andriela; Valdisoo, Maret (2004). Dialoogiaktide klassifitseerimine: eestikeelsete infodialoogide analüüsi probleeme. 3. rakenduslingvistika konverents, teesid, Tallinn (18−20).25.–26. märts 2004.
Koit, Mare (2004). Keeletehnoloogia suvekool. (2)..
Hennoste, T.; Koit, M.; Raabis, A.; Strandson, K.; Valdisoo, M.; Vutt, E. (2003). Directives in Estonian information dialogues. Text, Speech and Dialogue, Proceedings, 2807, 406−411.
Valdisoo, MN.; Vutt, EV.; Koit, ME. (2003). On a method for designing a dialogue system and the experience of its application. Journal of Computer and Systems Sciences International, 42 (3), 456−464.
Õim, Haldur; Koit, Mare (2003). Developing a Dialogue System that Interacts with a User in Estonian. A Finnish Computer Linguist: Kimmo Koskenniemi. Festschrift on the 60th birthday. CSLI Publications, 278−288.
Roosmaa, Tiit; Koit, Mare; Muischnek, Kadri; Müürisep, Kaili.; Puolakainen, Tiina; Uibo, Heli (2003). Eesti keele arvutigrammatika: mis on tehtud ja kuidas edasi? Keel ja Kirjandus, 46 (3), 192−209.
Koit, M.; Õim, H. (2003). Eestikeelse dialoogi modelleerimine. Keel ja Kirjandus, 10, 721−735.
Koit, M. (2003). The structure of information dialogues: a case study. International Journal of Information Theories and Applications, 10 (1), 80−86.
Валдисоо, М.Н.; Вутт, Э.В.; Койт, М.Э. (2003). Об одном методе разработки диалоговой системы и опыте его применения. Теория и системы управления, 3, 149−157.
Koit, M. (2003). Mis on masintõlge ja kus temast kasu on. Arvutimaailm, 4, 51−55.
Koit, M. (2003). Märgendatud dialoogikorpus kui keeleressurss. Toimiv keel. I : töid rakenduslingvistika alalt (119−136).. Tallinn: Eesti Keele Sihtasutus. (Eesti Keele Instituudi toimetised, 12).
Müürisep, Kaili; Puolakainen, Tiina; Muischnek, Kadri; Koit, Mare; Roosmaa, Tiit; Uibo, Heli (2003). A new language for constraint grammar : Estonian. International Conference Recent Advances in Natural Language Processing RANLP 2003, Borovets: International Conference Recent Advances in Natural Language Processing, Porovets, 2003. 304−310.
Hennoste, T.; Koit, M.; Rääbis, A.; Strandson, K.; Valdisoo, M.; Vutt, E. (2003). Developing a Typology of Dialogue Acts: Some Boundary Problems. 4th SIGdial Workshop on Discourse and Dialogue; Sapporo, Japan; 05.-06.07.2003. Sapporo, 226−235.
Hennoste, T.; Koit, M.; Rääbis, A.; Strandson, K.; Valdisoo, M.; Vutt, E. (2003). Developing a Typology of Dialogue Acts: Tagging Estonian Dialogue Corpus. DiaBruck 2003: 7th Workshop on the Semantics and Pragmatics of Dialogue; Saarbrücken; 04.-06.09.2003. Ed. Kruijff-Korbayova, I.; Konsy, C. Saarbrücken, 181−182.
Koit, M. (2003). The structure of information dialogues: a case study. 10th International Conference Knowledge-Dialogue-Solution. Proceedings: 10th International Conference Knowledge-Dialogue-Solution, Varna, Bulgaria, 16-26 June, 2003. Sofia: FOI-COMMERCE, 307−314.
Hennoste, Tiit; Koit, Mare; Strandson, Krista; Rääbis, Andriela; Valdisoo, Maret; Vutt, Evely (2003). Küsimuste ja direktiivide märgendamine eestikeelsetes infodialoogides. Rakenduslingvistika Eestis : Tallinn, 11.-12. aprill 2002. Tallinn: Eesti Keele Sihtasutus, 30−33.
Koit, M.; Õim, H. (2003). Keeletehnoloogia Tartu Ülikoolis läbi aegade. Toimiv keel I. Töid rakenduslingvistika alalt. Tallinna Pedagoogikaülikool, Eesti Keele Instituut. Eesti Keele Instituudi toimetised (137−150).. Tallinn: Eesti Keele Sihtasutus.
Kaalep, H.-J.; Veskis, K. (2007). Comparing Parallel Corpora and Evaluating their Quality. MT Summit XI Proceedings: Machine Translation Summit XI. Copenhagen, Denmark, 10-14 september 2007. Ed. Bente Maegaard. Kopenhaagen, 275−280.
Fishel, M.; Kaalep, H.-J.; Muischnek, K. (2007). Estonian-English machine translation: the first results. Proceedings of the 16th Nordic Conference of Computational Linguistics NODALIDA-2007; University of Tartu: Tartu, Estonia; 24-25.05.2007. Ed. Nivre, Jo.; Kaalep, H.-Ja.; Muischnek, K.; Koit, M. Tartu, Eesti, 278−283.
Kaalep, H.-J.; Muischnek, K. (2008). Multi-Word Verbs of Estonian: a Database and a Corpus. Proceedings of the LREC Workshop Towards a Shared Task for Multiword Expressions: Marrakech; Morocco; 1. juuni 2008. 23−26.
Kaalep, Heiki-Jaan; Muischnek, Kadri (2005). The corpora of Estonian at the University of Tartu: the current situation. Proceedings of the Second Baltic Conference on Human Language Technologies: Second Baltic Conference on Human Language Technologies, Tallinn, April 4-5, 2005. Tallinn: Tallinn University of Technology, 267−272.
Kaalep, Heiki-Jaan; Muischnek, Kadri (2004). Frequency Dictionary of Written Estonian of the 1990ies. The First Baltic Conference Human Language Technologies: The Baltic Perspective. Commission of the Official Language at the Chancellery of the President of Latvia.: Riga, April 21-22, 2004. Riga, 57−60.
Dias, G.; Kaalep, H.-J. (2003). Automatic Extraction of Multiword Units for Estonian: Phrasal Verbs. In: Metslang, H.; Rannut, M. (Ed.). Languages in Development (81−89).. Lincom-Europa.
Ehala, Martin; Kaalep, Heiki-Jaan; Kilgi, Annika; Viks, Ülle (2003). Tänapäeva eesti kirjakeele uurimine : morfoloogia. Mati Erelt (Toim.). Eesti keele uurimise analüüs (36−48).. Tallinn: Eesti Teaduste Akadeemia. (Emakeele Seltsi aastaraamat; 48).
Kaalep, Heiki-Jaan; Muischnek, Kadri (2003). Inconsistent Slectional Criteria in Semi-automatic Multiword Unit Extraction. COMPLEX 2003, 7th Conference on Computational Lexicography and Corpus Research. Ed by F. Kiefer, J. Pajzs. Research Institute for Linguistics, HUngarian Academy of Sciences.: 7th Conference on Computational Lexicography and Text Research, April 11, 2003, Budapest. Ed. Ferenc Kiefer, Julia Pajzs. Budapest, 27−36.
Muischnek, Kadri; Orav, Heili; Kaalep, Heiki; Õim, Haldur (2003). Eesti keele tehnoloogilised ressursid ja vahendid. Arvutikorpused, arvutisõnastikud, keeletehnoloogiline tarkvara. Eesti Keele Sihtasutus.
Kaalep, Heiki-Jaan; Muischnek, Kadri (2003). Püsiühendite leidmine suurtest tekstikorpustest. Toimiv keel I. Töid rakenduslingvistika alalt. Tallinna Pedagoogikaülikool, Eesti Keele Instituut. Eesti Keele Instituudi toimetised (101−118).. Tallinn: Eesti Keele Sihtasutus.
Muischnek, K. (2006). Eesti keele verbikesksed püsiühendid tekstikorpuses. Emakeele Seltsi aastaraamat (80−105).. Tallinn: Emakeele Selts.
Muischnek, Kadri (2006). Tugiverbist üldiselt ja intransitiivsest tugiverbikonstruktsioonist lähemalt. Lause argumentstruktuur (48−61).. Tartu: TÜ Kirjastus. (Tartu Ülikooli eesti keele õppetooli preprindid; 2).
Muischnek, K. (2006). Intransitiivne tugiverbikonstruktsioon eesti keeles. Finest linguistics: proceedings of the annual Finnish and Estonian Conference of Linguistics: Finnish and Estonian Conference of Linguistics; Tallinn; 6-7 mai, 2004. Toim. Kerge, K.; Sepper, M.-M. Tallinn: Tallinna Ülikooli Kirjastus, 400−409. (Tallinna Ülikooli eesti filoloogia osakonna toimetised; 8).
Muischnek, K. (2006). Freezes in a flectional language: Verbal idioms in Estonian. Collocations and Idioms 1: The First Nordic Conference on Syntactic Freezes: Joensuu ülikool, Soome, 19-20 mai 2006. Ed. Marja Nenonen. Joensuu, 61−62.
Muischnek, Kadri (2006). Verbi ja noomeni püsiühendid eesti keeles. (Doktoritöö, Tartu Ülikool). Tartu Ülikooli Kirjastus.
Muischnek, Kadri (2005). Eesti keele tugiverbid ja nende mõju lause ehitusele. Emakeele Seltsi aastaraamat (11−38).. Tallinn: Emakeele Seltsi aastaraamat.
Muischnek, K.; Vider, K. (2005). Sõnaliigituse kitsaskohad eesti keele arvutianalüüsis. Eesti Rakenduslingvistika Ühingu aastaraamat (99−112).. Tallinn: Eesti Keele Sihtasutus.
Müürisep, K.; Muischnek, K.; Puolakainen, T. (2005). Adpositions in Estonian Computational Syntax. 2nd ACL-SIGSEM Workshop on the Linguistic Dimensions of Prepositions and their Use in Computational Linguistics Formalisms and Applications; Colchester, UK; 19.-21.04.2005. Colchester: University of Essex, 2−9.
Muischnek, Kadri (2004). Verbi ja noomeni püsiühenditest eesti keeles. Keel ja Kirjandus, 8, 574−589.
Muischnek, Kadri (2004). Noomeni ja verbi püsiühendid eesti keeles. Liina Lindström (Toim.). Lauseliikmeist eesti keeles. Tartu ülikooli eesti keele õppetooli preprindid (50−56).. Tartu: Tartu Ülikool.
Orav, Heili; Vider, Kadri (2006). Millist leksikoni vajab arvuti tähenduse mõistmiseks? Koit, M.; Pajusalu, R.; Õim, H. (Toim.). Keel ja arvuti (85−96).. Tartu: Tartu Ülikooli Kirjastus. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised).
Kerner, K; Vider, K; Kahusk, N. (2006). Sõnatähendused ja nende ühestamine tekstides. Koit, M.; Pajusalu, R.; Õim, H. (Toim.). Keel ja arvuti (97−104).. Tartu: Tartu Ülikooli Kirjastus. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised).
Kahusk, N.; Vider, K. (2006). Semantic Relations in Glosses and Explanations: Do They Help? Third International Wordnet Conference, GWC 2006: Third International Wordnet Conference; Jeju Island, Korea; 22-26 January 2006. Ed. Sojka, P.; Choi, K.-S.; Fellbaum, Ch.; Vossen, P. 191−198.
Orav, Heili; Vider, Kadri (2005). Estonian wordnet and Lexicography. In: H. Gottlieb, J. E. Mogensen, A. Zettersten (Ed.). Symposium on Lexicography XI. Proceedings of the Eleventh International Symposium on Lexicography. May 2-4, 2002 at the University of Copenhagen. Ed. by H. Gottlieb, J.E. Mogensen and A. Zettersten. (549−555).. Tübingen: Max Niemeyer. (Lexicographica. Series Maior; 115).
Orav, Heili (2006). Isiksuseomaduste semantika. Helle Metslang, Margit Langemets (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat (171−184).. Tallinn: Eesti Keele Instituut. (Eesti Rakenduslingvistika Ühingu aastaraamat; 2).
Orav, H. (2005). Lexical Knowledge of Personality Traits. Proceedings of the Third International WordNet Conference: Third International WordNet Conference; Jeju Island, Korea; January 22 – 26, 2006. Ed. Sojka, P.; Key-Sun Choi; Fellbaum, Ch.; Vossen, P. Masaryk University in Brno, 239−244.
Orav, Heili (2006). Isiksuseomaduste sõnavara semantika eesti keeles. (Doktoritöö, Tartu Ülikool). Tartu: Tartu Ülikooli Kirjastus.
Vainik, Ene; Orav, Heili (2005). Tee tööd ja näe vaeva, ... aga ikka oled vihane. Keel ja Kirjandus, 4, 257−277.
Müürisep, K.; Nigol, H. (2007). Disfluency Detection and Parsing of Transcribed Speech of Estonian. Proceedings of 3rd Language & Technology Conference Human Language Technologies as a Challenge for Computer Science and Linguistics: 3rd Language & Technology Conference Human Language Technologies as a Challenge for Computer Science and Linguistics. Ed. Zygmunt Vetulani. Poznan, Poland: Wydawnictwo Poznanskie Sp. z o. o. with co-operation of Fundacja Uniwersitetu im. A. Mickiewicza, 483−487.
Müürisep, K.; Nigol, H.; Uibo, H. (2006). Eesti suulise keele korpuse automaatne pindsüntaktiline analüüs. Koit, M.; Pajusalu, R.; Õim, H. (Toim.). Keel ja arvuti (72−84).. Tartu: Tartu Ülikooli Kirjastus. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised; 6).
Müürisep, K. (2006). Eestikeelsete tekstide sisukokkuvõtjast EstSum. Koit, M.; Pajusalu, R.; Õim, H. (Toim.). Keel ja arvuti (115−125).. Tartu: Tartu Ülikooli Kirjastus. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised; 6).
Müürisep, Kaili; Uibo, Heli (2006). Shallow Parsing of Spoken Estonian Using Constraint Grammar. Treebanking for Discourse and Speech. Proceedings of NODALIDA-2005 special session on treebanking: NODALIDA-2005 special session on treebanking, Joensuu, 2005. Ed. Peter Juel Henrichsen, Peter Rossen Skadhauge. Frederiksberg, Denmark: Samfundslitteratur, 105−118. (Copenhagen Studies in Language; 32).
Müürisep, K.; Bick, E.; Uibo, H. (2005). Arborest - a Growing Treebank of Estonian. In: Holmboe, H. (Ed.). Nordisk Sprogteknologi 2004. Nordic Language Technology. Årbog for Nordisk Sprogteknologisk Forskningsprogram 2000-2004 (125−142).. Kopenhagen: Museum Tusculanums forlag. (Nordisk Sprogteknologi; 4).
Mutso, P.; Müürisep, K. (2005). ESTSUM - Estonian newspaper texts summarizer. Second Baltic Conference on Human Language Technologies; Tallinn, Estonia; Aptil 4-5, 2005. Ed. Langemets, M.; Penjam, P. Tallinn: Institute of Cybernetics at Tallinn University of Technology, 311−316.
Bick, E.; Uibo, H.; Müürisep, K. (2004). Arborest - a VISL-Style Treebank Derived from Estonian Constraint Grammar Corpus. Third Workshop on Treebanks and Linguistic Theories (TLT 2004); Tübingen, Germany; 10-11 December, 2004. Ed. Kübler, S.; Nivre, J.; Hinrichs, E.; Wunsch, H. Tübingen, 1−14.
Rääbis, A. (2007). Võimalusi helistaja identifitseerimiseks institutsionaalses telefonisuhtluses. Metslang, H.; Langemets, Ma.; Sepper, M.-M. (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat (269−284).. Tallinn: Eesti Keele Sihtasutus.
Rääbis, A. (2007). Kuidas helistaja ja vastaja teineteise ära tunnevad. Emakeele Seltsi aastaraamat (125−151).. Eesti Raamat.
Rääbis, A. (2007). Tervitused telefonivestluses. Teesid: VI rakenduslingvistika kevadkonverents ”Keel ja leksikon”, 26.–27. aprill 2007, Tallinn. 29.
Rääbis, A. (2006). Infodialoogi algusrituaalid. Koit, M.; Pajusalu, R.; Õim, H. (Toim.). Keel ja arvuti (143−155).. Tartu: Tartu Ülikooli Kirjastus. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised; 6).
Rääbis, A. (2004). Küsimus Mis sa teed? telefonivestluses. Keel ja Kirjandus, 5, 358−368.
Hennoste, T.; Rääbis, A. (2004). Dialoogiaktid eesti infodialoogides: tüpoloogia ja analüüs. Tartu: Tartu Ülikooli Kirjastus.
Rääbis, A. (2003). Olukorda kontrollivad küsimused telefonivestluse alguses. VIRSU. Viro ja suomi: kohdekielet kontrastissa. Lähivertailuja, 13. Toim. Muikku-Werner, Pirkko , Remes, Hannu. Joensuu: Joensuun yliopistopaino, 236−246.
Kahusk, N.; Vider, K. (2005). TEKsaurus - the Estonian WordNet online. The Second Baltic Conference on Human Language Technologies : April 4-5, 2005, Tallinn, Estonia. 273−278.
Vider, K.; Kahusk, N. (2004). HLT makes sense in Word Sense Disambiguation of Estonian. In: The First Baltic Conference Human Language Technologies: The Baltic Perspective. Commission of the Official Language at the Chancellery of the President of Latvia (174−178).. Riga: puudub.
Asser, H.; Kaalep, H.; Linnas, S.; Mikk, J.; Muischnek, K.; Songe, M.; Uibo, H. (2004). Õpikute keerukuse analüüs arvutitel. Toimiv keel II. Töid rakenduslingvistika alalt. Tallinna Pedagoogikaülikooli eesti filoloogia osakonna toimetised (72−84).. Tallinn: Tallinna Pedagoogikaülikooli Kirjastus.
Koit, M. (2007). Collaboration and Antagonism in Estonian Spoken Dialogues: Corpus Analysis. CMNA VII - Computational Models of Natural Argument: IJCAI-07 (International Joint Conference on Artificial Intelligence), workshop; Hyderabad; January 6-12, 2007. Ed. Reed, C.; Grasso, F.; Kibble, R. Hyderabad, 31−34.
Gerassimenko, Olga; Kruglov, Dmitri; Oja, Anni (2007). Socialnye faktory v postroenii populjarnoj virtual'noj identichnosti (issledovanie na materiale internet-portala). Prikladna lingvistika ta lingvistichni tehnologii: Megaling 2006, Ukraina, september 2006. Toim. V.A.Shirokov, J.D.Apresjan, L.P. Krysin, O.D.Shmeljov, N.M.Leontjeva, S.J.Jermolenko, O.V.Palagin, V. Kiiev, Ukraina: Dovira, 90−96.
Gerassimenko, O. (2007). Me'jazykovye razlitšija i otraženie institucional'nyh rolej v dialogitšeskih ehopovtorah. Gorizonti prikladnoj lingvistiki ta lingvistitšnih tehnologij: Megaling 2007, Ukraina, september 2007. Toim. V.A.Shirokov, S.S.Dikareva. Simferopol, Ukraina: DiAiPi, 116−117.
Gerassimenko, O. (2007). Do you agree or acknowledge? On the use of feedback items in Estonian and Russian. In: Abstracts: 10th International Pragmatics Conference; Göteborg, Sweden; 8-13 July 2007 (456−457).10th International Pragmatics Conference; Göteborg, Sweden; 8-13 July 2007. Göteborg.
Gerassimenko, O.; Valdisoo, M. (2006). Loomulik infodialoog ja infodialoogi simulatsioon: infoandja strateegiad. Koit, M., Pajusalu, R., Õim, H. (Toim.). Keel ja arvuti (196−209).. Tartu: Tartu Ülikooli Kirjastus. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised; 6).
Gerassimenko, O.; Kasterpalu, R. (2006). Vastus jah - kas seda on vaja eraldi õpetada? Eesti jah ja vene da - funktsionaalsed erinevused telefonivestluste näitel. Eesti Rakenduslingvistika Ühingu aastaraamat (25−42).. Tallinn: Eesti Keele Sihtasutus.
Kasterpalu, R.; Gerassimenko, O. (2006). Vestlusanalüüs. Tragel, I; Õim, H. (Toim.). Teoreetiline keeleteadus Eestis II (112−126).. Tartu: Tartu Ülikool. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised; 7).
Nigol, H. (2007). Parsing Manually Detected and Normalized Disfluencies in Spoken Estonian. 16th Nordic Conference of Computational Linguistics NODALIDA-2007: NODALIDA, Tartu, 25.-26.05.2007. Ed. Nivre, J.; Kaalep, H.-J.; Muischnek, K.; Koit, M. Tartu: University of Tartu, 363−366.
Vider, K.; Orav, H. (2003). Concerning the difference between a conception and its application in the case of the Estonian wordnet. Proceedings of the second international wordnet conference: Second international wordnet conference; Brno; 2004. Ed. Sojka, P.; Pala, K.; Smrz, P.; Fellbaum, Ch.; Vossen, P. Brno, 285−290.
Vider, Kadri; Orav, Heili (2003). Idee ja rakenduse vahe tesauruse näitel. Toimiv keel I. Töid rakenduslingvistika alalt. Tallinna Pedagoogikaülikool, Eesti Keele Instituut. Eesti Keele Instituudi toimetised (313−322).. Tallinn: Eesti Keele Sihtasutus.
Vainik, Ene; Orav, Heili (2005). WELCOME TO ESTONIA! FROM THE FOLK THEORY OF EMOTIONS AND CHARACTER TRAITS TO BRAND ESTONIA. Folklore, 6-41.
Kaljurand, K. (2006). Piiratud inglise keel ACE ja sellega seotud tarkvara. Koit, M.; Pajusalu, R.; Õim, H. (Toim.). Keel ja arvuti (115−125).. Tartu: Tartu Ülikooli Kirjastus. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised; 6).
Kaljurand, K. (2004). Word Sense Disambiguation of Estonian with syntactic dependency relations and WordNet. ESSLLI 2004: 16th European Summer School in Logic, Language and Information; Nancy, France; 9-20 August, 2004. 128−137.
Rinaldi, F.; Dowdall, J.; Hess, M.; Molla, D.; Schwitter, R.; Kaljurand, K. (2003). Knowledge-based question answering. Knowledge-Based Intelligent Information and Engineering Systems, Pt 1, Proceedings, 2773, 785−792.
Uibo, Heli (2006). Eesti keele morfoloogia modelleerimisest lõplike muundurite abil. Koit, M.; Pajusalu, R.; Õim, H. (Toim.). Keel ja arvuti (13−35).. Tartu: Tartu Ülikooli Kirjastus. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised; 6).
Uibo, Heli; Nigol, Helen (2006). Puude pangad meil ja mujal. Koit, M.; Pajusalu, R.; Õim, H. (Toim.). Keel ja arvuti (36−50).. Tartu: Tartu Ülikooli Kirjastus. (Tartu Ülikooli üldkeeleteaduse õppetooli toimetised; 6).
Trosterud, T.; Uibo, H. (2005). Consonant gradation in Estonian and Sámi: two-level solution. In: Antti Arppe, Lauri Carlson, Krister Lindén, Jussi Piitulainen, Mickael Suominen, Martti Vainio, Hann (Ed.). Inquiries into Words, Constraints and Contexts: Festschrift for Kimmo Koskenniemi on his 60th Birthday. CSLI Publications (136−150).. Stanford: Stanford University Press. (CSLI Studies in Computational Linguistics ONLINE).
Volk, M.; Hagstrand, D.; Gustafson-Capkova, S.; Uibo, H. (2005). Teaching Treebanking. In: Holmboe, H. (Ed.). Nordisk Sprogteknologi 2004. Nordic Language Technology. Årbog for Nordisk Sprogteknologisk Forskningsprogram 2000-2004 (143−159).. Kopenhagen: Museum Tusculanums forlag. (Nordisk Sprogteknologi; 4).
Uibo, H. (2005). Finite-State Morphology of Estonian: Two-Levelness Extended. Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP) 2005: International Conference "Recent Advances in Natural Language Processing", Borovets, Bulgaaria, 21.-23.09.2005. Ed. Mitkov, R. Borovets, 580−584.
Uibo, H. (2005). Optimizing the finite-state description of Estonian morphology. Proceedings of the 15th NODALIDA conference, Joensuu 2005: 15th Nordic Conference of Computational Linguistics; University of Joensuu, Finland; May 20-21, 2005. Ed. Werner, S. Joensuu: Ling@JoY : University of Joensuu electronic publications in linguistics and language technology, 203−209.
Uibo, H.; Bick, E. (2005). Treebank-based research and e-learning of Estonian syntax. Proceedings of Second Baltic Conference on Human Language Technologies: Second Baltic Conference on Human Language Technologies; Tallinn, Estonia; April 4-5, 2005. Ed. Langemets, M.; Penjam, P. Tallinn: Institute of Cybernetics, 195−200.
Uibo, H. (2004). Syntactically annotated corpora of Estonian. Proceedings of The First Baltic Conference "Human Language Technology - the Baltic Perspective": The First Baltic Conference "Human Language Technology - the Baltic Perspective"; Riga; 21.-22.04.2004. Riga, 45−48.
Kasterpalu, R. (2007). Seisundimuutuse partiklid ahah ja ahhaa eestikeelses müügisuhtluses. Kielioppi ja konteksti II (Grammar and Context II): Kielioppi ja konteksti II (Grammar and Context II), Helsinki, 27.-29.08.2007. Toim. Laura Ruuskanen. Helsinki: University of Helsinki Press, 39.
Kasterpalu, R. (2006). Algusrituaalid müügikõnedes. M. Koit, R. Pajusalu, H. Õim (Toim.). Keel ja arvuti (156−169).. Tartu: TÜ Kirjastus. (Tartu ülikooli üldkeeleteaduse õppetooli toimetised; 6).
Kasterpalu, R. (2006). The Estonian particles jah and jaa and the Finnish particles nii and joo. ICCA06 Abstracts: International Conference on Conversation Analysis; Helsinki, Finland; May 10-14 2006. 54.
Kasterpalu, R. (2005). Partiklid jah, jaa ning jajaa naaberpaari järelliikmena müügiläbirääkimistes. Keel ja Kirjandus, 11, 12, 873-890, 996−1000.
Juhendamised
Juhendamised
Heili Orav, doktorikraad, 2006, (juh) Haldur Õim, Urmas Sutrop, Isiksuseomaduste sõnavara semantika eesti keeles, Tartu Ülikool, Filosoofiateaduskond, Eesti ja soome-ugri keeleteaduse osakond.
Kadri Muischnek, doktorikraad, 2006, (juh) Mati Erelt, Verbi ja noomeni püsiühendid eesti keeles, Tartu Ülikool, Filosoofiateaduskond.
Kadri Vare, magistrikraad (teaduskraad), 2007, (juh) Kadri Vider, Sõnatähenduste ühestamise tulemuste parandamise meetodeid eesti keele jaoks, Tartu Ülikool, Filosoofiateaduskond, Eesti ja üldkeeleteaduse instituut, Üldkeeleteaduse osakond, Üldkeeleteaduse õppetool.
Mark Fišel, magistrikraad, 2006, (juh) Mare Koit; Meelis Mihkla, Eesti kõneprosoodia süntees neurovõrkude abil, Tartu Ülikool, Matemaatika-informaatikateaduskond, Arvutiteaduse instituut, Keeletehnoloogia õppetool.
Taavet Kikas, magistrikraad (teaduskraad), 2007, (juh) Mare Koit, Dialoogiaktide tuvastamine eestikeelsetes dialoogides sufiksipuude abil, Tartu Ülikool, Matemaatika-informaatikateaduskond.
Anton Ragni, magistrikraad, 2007, (juh) Mare Koit, Word-based Estonian Speech Recognition, Tartu Ülikool, Füüsika-keemiateaduskond, Eksperimentaalfüüsika ja tehnoloogia instituut.
Liina Eskor, magistrikraad (teaduskraad), 2004, (juh) Mare Koit, Dialoogiaktid ja suhtlusstrateegiad: eesti dialoogikorpuse analüüs, Tartu Ülikool, Filosoofiateaduskond.
Margus Treumuth, magistrikraad (teaduskraad), 2004, (juh) Mare Koit, Eesti dialoogikorpus ja selle töötlemise tarkvara, Tartu Ülikool, Matemaatika-informaatikateaduskond.
Helen Nigol, magistrikraad (teaduskraad), 2006, (juh) Heli Uibo, Voorusisesed parandused, kordused ja valestardid suulises eesti keeles: nende tuvastamine ja normaliseerimine, Tartu Ülikool.
Kaarel Veskis, magistrikraad, 2007, (juh) Heiki-Jaan Kaalep, Paralleelkorpused keeleteaduse abivahendina, Tartu Ülikool, Filosoofiateaduskond, Eesti ja soome-ugri keeleteaduse osakond.