Algoritmos Many-core para la Bioinformática

Como resultado de la colaboración con el grupo AGR-248 de la Universidad de Córdoba, nuestra grupo de investigación ha tenido acceso a tres tarjetas TilExpress-20G de la Compañía Tilera Corp. y se encuentra en conversaciones con Intel Corp. para poder realizar desarrollos con el nuevo chip many-core denominado Intel SCC (Single-Chip Cloud Computer).

Aunque el procesador Tile64 carece de capacidades operativas en coma flotante, los algoritmos bioinformáticos pueden adaptarse especialmente bien para trabajar esclusivamente con valores puramente enteros. Debido a la arquitectura RISC de 32 bits y a la posibilidad de ejecutar varias instrucciones en un mismo ciclo de reloj, el procesador completo puede llegar a ejecutar 0,144 TIPS (Tera Instrucciones por segundo), lo que permite aumentar sustancialmente la velocidad de ejecución de los algoritmos especialmente paralelizados para esta arquitectura.

Los algoritmos que hemos desarrollado se orientan principalmente al alineamiento de largas cadenas de nucleótidos o aminoácidos, lo que permite encontrar regiones de similitud entre secuencias afines de ADN procedentes de distintas especies con el objetivo de relacionar sus orígenes (árbol filogenético) o encontrar mutaciones SNP (Single Nucleotide Polimorfism).

Con el apoyo de ordenadores PC Dell Precision T5400 y bases dedatos alojadas en dicho host hemos podido superar la barrera de los 10Mbp en cada una de las secuencias a alinear, lo que nos acerca a un solo orden de magnitud para poder realizar alineamientos de cromosomas completos.

Contenido relacionado: