"Eesti Teadusfondi uurimistoetus" projekt ETF6848
ETF6848 "Privaatsust säilitav andmekaevandus: krüptograafilised meetodid (1.01.2006−31.12.2008)", Helger Lipmaa, Cybernetica AS.
ETF6848
Privaatsust säilitav andmekaevandus: krüptograafilised meetodid
Privacy-Preserving Data-Mining: Cryptographic Methods
1.01.2006
31.12.2008
Teadus- ja arendusprojekt
Eesti Teadusfondi uurimistoetus
ValdkondAlamvaldkondCERCS erialaFrascati Manual’i erialaProtsent
4. Loodusteadused ja tehnika4.7. Info- ja kommunikatsioonitehnoloogia 2.2. Elektroenergeetika, elektroonika (elektroenergeetika, elektroonika, sidetehnika, arvutitehnika ja teised seotud teadused)100,0
AsutusRollPeriood
Cybernetica ASkoordinaator01.01.2006−31.12.2008
PerioodSumma
01.01.2006−31.12.2006205 200,00 EEK (13 114,67 EUR)
01.01.2007−31.12.2007205 200,00 EEK (13 114,67 EUR)
01.01.2008−31.12.2008205 200,00 EEK (13 114,67 EUR)
39 344,01 EUR

Andmekaevanduse esmane ülesanne on kogutud andmete (näiteks Internetikasutajate harjumused, püsiklientide andmed jne) kohta mudelite loomine. Privaatsust säilitava andmekaevanduse (PPDM) põhiküsimuseks on täpsete mudelite loomine võimalikkus juhul kui puudub täpne ligipääs individuaalsetele andmeväljadele. On teada, et seda küsimust on raske lahendada. PPDM-i jaoks on välja töötatud mitmeid erinevaid lähenemisi, millest kaks kõige olulisemat on randomiseerimine (mis põhineb hästi tuntud statistilisel juhusliku vastamise tehnikal) ja krüptograafiline. Välja on pakutud erinevaid randomiseerimise meetodeid, ning on uuritud mitmete andmekaevandusalgoritmide turvamist. Selles projektis plaanime me uurida krüptograafilist lähenemist, ja selle ühendusi randomiseerimisel põhineva lähenemisega. Mõned uuritavad teemad on: (1) kiirete krüptograafiliste juhusliku vastamise tehnika protokollide väljatöötamine, (2) efektiivsete peitedastusprotokollide konstrueerimine, (3) erinevate andmekaevandusalgoritmide krüptograafiliselt turvaliste versioonide väljatöötamine. Antud mitmeaastase projekti eesmärgiks on muuta privaatsust säilitav andmekaevandus püsivaks uurissuunaks Eestis, mis oleks tihedalt ühendatud eksisteeriva krüptograafiarühmaga (Buldas, Laud, Lipmaa, Willemson) ning andmekaevandusrühmadega Eestist (Vilo) ja mujalt (eelkõige Soomest). Täpsemalt, projekti viib läbi Cybernetica AS, tehes välist koostööd Tartu Ülikooli Arvutiteaduse Instituudi, tõenäoliselt aga ka teiste asutustega, sh Helsinki Tehnoloogiaülikool ja Helsinki Ülikool, kus asutavate maailmatasemel andmekaevandusrühmadega on grandihoidjal pika-ajalised lähedased suhted.
The primary task of data-mining is to develop models about aggregated data, for example about the habits of the Internet users, about the loyal customers, etc. The main question of privacy-preserving data-mining (PPDM) is, can we develop accurate models without access to precise information in individual data records? The latter question has proven to be difficult to solve. Several different approaches for the PPDM have been developped, the main two of them are the randomization approach (based on the well-known statistical Randomized Response Technique) and the cryptographic approach. Different randomization methods have been proposed, and securing of several data-mining algorithms has been undertaken. In the project, we plan to study the cryptographic approach, and its connections with the randomization approach. Some of the topics are: (1) developing fast cryptographic RRT protocols, (2) designing efficient oblivious transfer and private information retrieval protocols, (3) designing cryptographically protected versions of well-known data-mining algorithms. The goal of this multi-year project is to establish a new research direction in Estonia, PPDM, that would stay tightly connected with the existing cryptography research group (Buldas, Laud, Lipmaa, Willemson) and with the data mining groups from Estonia (Vilo) and elsewhere (especially but not only from Finland). More precisely, this project is performed by Cybernetica AS with external collaboration with the Institute of Computer Science, University of Tartu, and possibly other institutions including Helsinki University of Technology and University of Helsinki that have world-leading data mining groups that the grant holder has very well established relationships with.