Kinezi ubrzali sekvencioniranje genoma uz primjenu grafičkih procesora

Autor: I.J.

Nedavno je BGI laboratorij prešao na opremu koja radi upravo na Nvidijinim čipovima i višestruko smanjio vrijeme potrebno za analizu podataka. Njihova brža obrada u području biomedicinskih znanosti znači napredak u biološkim istraživanjima, proučavanjima bolesti, te još jedan korak u smjeru personaliziranih lijekova koji se izrađuju prema individualnim genetskim odrednicama.

Najvećem svjetskom centru za sekvenciranje genoma donedavno je trebalo oko četiri dana za analizu podataka koji opisuju ljudski genom. Zahvaljujući novoj tehnologiji za koju su se odlučili, sada je potrebno samo šest sati, a za drastičnu uštedu vremena odgovorna su serverska računala s grafičkim procesorima.

Posljednjih godina troškovi sekvenciranja genoma, odnosno određivanja redoslijeda u genetičkom kodu organizma, padala je gotovo peterostruko na godišnjoj bazi. Međutim, troškovi analize podataka dobivenih u postupku sekvenciranja koda nisu slijedila taj trend, pa su padali znatno sporije. No, primjenom tehnologije s grafičkim čipovima, kineski mega laboratorij BGI se nada da bi mogao smanjiti raskorak, piše Wired.

Ekonomičniji GPU procesori

Grafički čipovi su vrsta procesora čiji je glavni zadatak omogućavanje prikaza slike na zaslonu računala. Njihov puni naziv je graphic processing units (GPU), odnosno jedinica za ogradu grafike, a autor tog imena je jedan od vodećih proizvođača Nvidia. Nedavno je BGI laboratorij prešao na opremu koja radi upravo na Nvidijinim čipovima i višestruko smanjio vrijeme potrebno za analizu podataka. Njihova brža obrada u području biomedicinskih znanosti znači napredak u biološkim istraživanjima, proučavanjima bolesti, te još jedan korak u smjeru personaliziranih lijekova koji se izrađuju prema individualnim genetskim odrednicama.

Grafički procesori su svoj život započeli na stolnim računalima, ali danas ih se koristi i u sofisticiranim računalnim sustavima. Pokreću računala za obradu velike količine podataka koje generiraju znanstvena istraživanja, financijske institucije i razne vladine agencije. Veliki dio tih podataka se može podijeliti na male dijelove, te se obrađivati uz pomoć stotina ili tisuća procesora. Jedna od važnijih karakteristika grafičkih procesora je da su jeftiniji i troše manje energije od standardnih (CPU).

Za istu brzinu obrade podataka pomoću tradicionalnih procesora, centar BGI bi trebao 15 puta više računalnih čvorišta. Proporcionalno tome trebalo bi povećati kapacitete rashladnih sustava, a porasli bi i energetski zahtjevi. Primjenom grafičkih procesora BGI dobiva brže rezultate s već postojećim algoritmima, a može pokrenuti i osjetljivije algoritme za još bolje rezultate. Ostvaruju se uštede i na prostoru za pohranu podataka, budući da uređaji koji se koriste u postupcima kao što je sekvencioniranje genoma generiraju stotine gigabajta podataka odjednom, a oni moraju ostati na računalima skroz dok analiza traje. Brži ‘odljev’ podataka, koji se sada mjeri u satima umjesto u danima, ostavlja i više prostora za daljnje operacije.

Centar BGI koristi cijelu farmu servera s grafičkim procesorima, ali softverski dio pomoću kojega cijeli sustav radi, utječe i na druge platforme. Tako će se pogoni sa sličnim GPU sustavima moći u radu s pojedinim instrumentima osloniti na dodatne kapacitete i tradicionalnih CPU računalnih klastera. Tu je i podrška za rad s ‘cloud computing’ rješenjima, a sve više pružatelja ‘cloud’ usluga prilagođava njihove funkcionalnosti za rad s GPU sustavima. Analitičari tvrde da će znanstvene institucije tako proći jeftinije jer će brži GPU sustavi smanjiti troškove za najam računalnih kapaciteta.




Interpretacija podataka je poseban izazov

Međutim, ipak nisu sve institucije zainteresirane za ubrzavanje računalnih procesa, bilo lokalno ili preko ‘clouda’, uz pomoć GPU infrastrukture ili neke druge. Za neke velike centre za proučavanje genoma, baratanje velikom količinom podataka i njihov prikaz su veći izazovi od same brzine obrade. GPU rješenja ipak ponegdje ne moraju biti pravi odgovor, jer se neće sve ubrzati na odgovarajući način, tumače analitičari i dodaju da je unatoč tome ipak nešto što se ne može ignorirati. Zato tvrde da budući sustavi neće biti izvedeni po principu ‘jedan za sve’, nego će izgledati kao heterogena mješavina CPU, GPU i drugih sustava, ovisno o potrebama istraživanja.

Ipak, kada se i obradi bujica podataka dobivenih sekvencioniranjem genoma, znanstvenicima još preostaje ogroman posao u kojem moraju protumačiti njihov značaj. Ubrzavanje procesa obrade svakako donosi prednosti, ali ne donosi revoluciju u razumijevanju biologije. Jednom kada znanstvenici dobiju popis tisuća ili desetak tisuća genomskih odstupanja, moraju odlučiti koji su relevantni. Cilj je doći do pouzdane baze podataka iz koje je moguće saznati kakvo značenje imaju pojedini geni na pojedinim kromosomima. Znanstvenici tvrde da nterpretacija dobivenih podataka predstavlja drugačiji izazov, te da će još nekoliko godina biti potrebno da se dođe do alata koji bi olakšali i to.




Autor:I.J.
Komentari odražavaju stavove njihovih autora, ali ne nužno i stavove portala Dnevno.hr. Molimo čitatelje za razumijevanje te suzdržavanje od vrijeđanja, psovanja i vulgarnog izražavanja. Portal Dnevno.hr zadržava pravo obrisati komentar bez najave i/li prethodnog objašnjenja.