Mašine za učenje veštačke inteligencije (AI) mogu se obučiti da samostalno rešavaju probleme i zagonetke umesto da koriste pravila koja smo za njih napravili. Ali često istraživači ne znaju koja pravila mašine sebi postavljaju. Docent Peter Coo iz laboratorije Cold Spring Harbor Laboratory (CSHL) u Njujorku, razvio je novu metodu koja ispituje program mašinskog učenja da bi utvrdio koja pravila je program sam naučio i da li su ta pravila tačna.
Kompjuterski naučnici „obučavaju“ AI mašinu za predviđanje predstavljanjem skupa podataka. Mašina izdvaja niz pravila i operacija – model – zasnovan na informacijama sa kojima se susreo tokom obuke. Koo kaže:
„Ako naučite opšta pravila o matematici umesto da pamtite jednačine, znaćete kako da rešite te jednačine. Dakle, umesto da samo pamtimo te jednačine, nadamo se da ovi modeli uče da je reše, a sada joj možemo dati bilo koju jednačinu i ona će je rešiti. “
Koo je razvio tip AI pod nazivom duboka neuronska mreža (Deep Neural Network ili DNN) kako bi tražio obrasce u RNK lancima koji povećavaju sposobnost proteina da se veže za njih. Koo je trenirao svoj DNN, nazvan Rezidualna veza (Residual Bind – RB), sa hiljadama RNK sekvenci usklađenih sa rezultatima vezivanja za proteine, a RB je postao dobar u predviđanju rezultata za nove RNK sekvence. Ali Koo nije znao da li se mašina fokusirala na kratku sekvencu RNK slova – motiv – koji bi ljudi mogli očekivati ili neke druge sekundarne karakteristike RNK-nizova koje možda ne bi.
Koo i njegov tim razvili su novu metodu, nazvanu Analiza globalne važnosti, kako bi testirali koja pravila je RB stvorio za predviđanje. Predstavio je obučenu mrežu pažljivo dizajniranim nizom sintetičkih RNK sekvenci koje sadrže različite kombinacije motiva i karakteristika za koje su naučnici mislili da mogu uticati na procene Residual Bind-a.
Otkrili su da je DNN mreža posmatrala više od pukih slova kratkog motiva RNK. U obzir je uzela to kako se RNK lanac može preklopiti i vezati za sebe, koliko je jedan motiv blizak drugom i druge karakteristike.
Koo se nada da će neke ključne rezultate testirati u laboratoriji. Ali umesto da testira svako predviđanje u toj laboratoriji, Koova nova metoda deluje kao virtuelna laboratorija. Istraživači mogu računski da dizajniraju i testiraju milione različitih promenljivih, mnogo više nego što bi to ljudi mogli da testiraju u laboratoriji iz stvarnog sveta.
„Biologija je super anegdotska. Možete pronaći sekvencu, možete pronaći obrazac, ali ne znate da li je taj obrazac zaista važan. Morate da uradite ove intervencione eksperimente. U ovom slučaju, svi moji eksperimenti se izvode tako što pitam DNN neuronsku mrežu.“
Tim je objavio svoje nove metode i alate u PLOS Computational Biology. Njihovi Residual Bind alati su sada dostupni svima na mreži.