See veebileht kasutab küpsiseid kasutaja sessiooni andmete hoidmiseks. Veebilehe kasutamisega nõustute ETISe kasutustingimustega. Loe rohkem
Olen nõus

Masinõpe loob kujuteldavatele inimestele realistlikud genoomid


05.02.2021       Marika Meltsas
  • Joonis 1. Suvalisest digitaalsest mürast tekib kromosoom. Autor- Burak Yelmen.png
  • Joonis 2. Generaator annab juhuslikule mürale kuju. Allikas- Yelmen et al. 2021.png

Tänu uudsetele algoritmidele ja arvutitehnoloogia edusammudele suudavad masinad nüüdseks õppida keerukaid mudeleid ja luua kvaliteetseid sünteetilisi andmeid, näiteks fotorealistlikke kujutisi või isegi kujuteldavate inimeste elulugusid. Hiljuti rahvusvahelises teadusajakirjas PLOS Genetics avaldatud uuringus rakendati masinõpet andmekaeveks olemasolevates biopankades ja genereeriti inimgenoomi osi, mis ei kuulu küll pärisinimestele, kuid sarnanevad tõeliste genoomidega.  Tänu uudsetele algoritmidele ja arvutitehnoloogia edusammudele suudavad masinad nüüdseks õppida keerukaid mudeleid ja luua kvaliteetseid sünteetilisi andmeid, näiteks fotorealistlikke kujutisi või isegi kujuteldavate inimeste elulugusid. Hiljuti rahvusvahelises teadusajakirjas PLOS Genetics avaldatud uuringus rakendati masinõpet andmekaeveks olemasolevates biopankades ja genereeriti inimgenoomi osi, mis ei kuulu küll pärisinimestele, kuid sarnanevad tõeliste genoomidega.  

Olemasolevad geeniandmebaasid on biomeditsiiniliste uuringute jaoks hindamatu ressurss, kuid need pole avalikult kättesaadavad või nende kasutamine jääb eetikaküsimustest tingitud pika ja kurnava taotlusprotsessi taha. Teadlastel takistab see suuresti teadustöö tegemist. Masinloodud genoomid ehk tehisgenoomid, nagu me neid nimetame, aitavad seda probleemi turvalises eetilises raamistikus vältida,“ ütles uuringu juhtautor, Tartu Ülikooli moodsa populatsioonigeneetika nooremteadur Burak Yelmen. 

Mitme eriala spetsialistidest koosnev uurimisrühm analüüsis, milline on loodud genoomide kvaliteet võrreldes pärisgenoomidega. „Üllataval kombel jäljendavad need suvalisest mürast tekitatud genoomid reaalsele inimpopulatsioonile omast komplekssust ega eristu kuigi palju biopangas olevatest genoomidest, mille abil me oma algoritmi treenisime. Ainus erinevus on see, et need ei kuulu ühelegi geenidoonorile,“ sõnas Luca Pagani, üks uuringu peamisi autoreid ja Mobilitas Plussi stipendiaat. 

Uuringus hinnati ka tehisgenoomide sarnasust tegelike genoomidega, et kontrollida, kas algsete proovide privaatsus on säilinud. „Ehkki tuhandete genoomide hulgast privaatsuslekete tuvastamine võib tunduda heinakuhjast nõela otsimisena, võimaldas esinevate statistiliste võtete kombineerimine meil kõiki mudeleid hoolikalt kontrollida. Põnev on see, et keerukate lekkemustrite üksikasjalik uurimine võib aidata parandada mudelite hindamist ja disainimist, edendades omakorda masinõppe valdkonda,“ ütles Flora Jay, uuringu koordinaator ja Prantsuse Riikliku Teadusuuringute Keskuse interdistsiplinaarse infotehnoloogia labori teadlane.  

Seni on masinõppe abil antud käputäiele kujuteldavatele inimestele näod, elulood ja hulk muid tunnuseid, nüüd aga teame rohkem nende bioloogiast. Need realistliku genoomiga kujuteldavad inimesed võiksid uuringutes asendada kõiki tegelikke genoome, mis pole avalikult kättesaadavad või mille kasutus nõuab pikka taotlusprotsessi või keerukat koostööd. Nii saaks kõrvaldada genoomiuuringute suure takistuse, eriti alaesindatud populatsioonide puhul. 

Joonis 1. Suvalisest digitaalsest mürast tekib kromosoom. Autor: Burak Yelmen 

Joonis 2. Generaator annab juhuslikule mürale kuju, samal ajal kui diskriminaator võrdleb loodud andmeid andmebaasis olevate tegelike andmetega. Kui protsess on lõppenud, genereerib algoritm tehisandmed, mis näevad välja ehtsad, kuid on tegelikult täiesti uued. Allikas: Yelmen et al. 2021
 

Lisateave:
Burak Yelmen, uuringu juhtautor, Tartu Ülikooli moodsa populatsioonigeneetika nooremteadur, +372 5678 1830, burak.yelmen@ut.ee 
Luca Pagani, üks uuringu peamisi autoreid, Tartu Ülikooli populatsioonigeneetika kaasprofessor ja Mobilitas Plussi stipendiaat, +39 340 786 2518, luca.pagani@ut.ee
Flora Jay, uuringu koordinaator, Prantsuse Riikliku Teadusuuringute Keskuse interdistsiplinaarse infotehnoloogia labori (LRI/LISN, Université Paris-Saclay, Centre national de la recherche scientifique) teadlane, +33 650 097 241, flora.jay@lri.fr