Destaque
Tempos de análise de amostras de DNA são drasticamente reduzidos graças a novo formato de arquivo
Um novo formato de arquivo de computador que ajuda a processar amostras de DNA 30 vezes mais rápido do que os sistemas existentes foi desenvolvido por equipes da Universidade de Nova Gales do Sul (UNSW) e do Instituto Garvan de Pesquisas Médicas, na Austrália. O formato SLOW5 foi projetado especificamente para analisar de forma mais eficiente o sequenciamento por nanoporos, que fornecem uma visão mais completa das variações genéticas.
A eficiência aprimorada não apenas ajuda os especialistas médicos a analisar amostras de DNA individuais com muito mais rapidez e fornecer assistência médica mais rápida e melhor aos pacientes, mas também permite analisar mais amostras em um dado período. Os resultados da pesquisa foram publicados na revista científica Nature Biotechnology, mas o software já foi disponibilizado através de código aberto e foi baixado mais de 1000 vezes em apenas algumas semanas.
A natureza complexa do sequenciamento por nanoporos de DNA significa que grandes quantidades de dados são criadas, e precisam ser armazenadas e analisadas adequadamente. Esses dados foram gravados rotineiramente em um formato de arquivo chamado FAST5, com informações tão complexas que geralmente produzem arquivos com tamanho de cerca de 1,3 terabyte – aproximadamente o equivalente a 650 horas de vídeo HD.
Historicamente, leva cerca de duas semanas para os computadores processarem arquivos FAST5 tão grandes e analisarem as informações do genoma humano contidas neles.
Mas o Dr. Hasindu Gamaarachchi, trabalhando com o professor Dr. Sri Parameswaran na Escola de Ciência e Engenharia da Computação da UNSW, criou um formato de arquivo projetado para análise eficiente e escalável de dados de sinais de nanoporos. O novo formato de arquivo SLOW5 não apenas reduz significativamente o tamanho dos arquivos, mas também pode processar exatamente as mesmas informações em cerca de 10,5 horas – mais de 30 vezes mais rápido que o formato FAST5.
Computação paralela
A chave para isso é que o formato SLOW5, diferentemente do FAST5, permite uma computação paralela eficiente, em que vários processadores podem executar simultaneamente várias análises menores divididas em um conjunto de dados muito maior, mais complexo e completo.
“O formato FAST5 é lento porque os dados não podem ser acessados em paralelo. Ele é baseado no Hierarchical Data Format, projetado na década de 1990 para funcionar em máquinas que na época tinham apenas um processador, em vez das modernas, que incluem vários processadores. O formato de dados hierárquicos também é genérico, enquanto o SLOW5 é construído especificamente. E como o novo SLOW5 pode ser acessado em paralelo por vários processadores ao mesmo tempo, o tempo de processamento foi reduzido em 30 vezes”, disse o Dr. Hasindu Gamaarachchi.
“Então, em vez de levar cerca de duas semanas para processar os dados de um genoma humano, o tempo agora caiu para menos de meio dia”, concluiu o pesquisador.
Acesse o artigo científico completo (em inglês).
Acesse a notícia completa na página da Universidade de Nova Gales do Sul (em inglês).
Fonte: Neil Martin, UNSW. Imagem: geralt via Pixabay.
Em suas publicações, o Canal Farma da Rede T4H tem o único objetivo de divulgação científica, tecnológica ou de informações comerciais para disseminar conhecimento. Nenhuma publicação do Canal Farma tem o objetivo de aconselhamento, diagnóstico, tratamento médico ou de substituição de qualquer profissional da área da saúde. Consulte sempre um profissional de saúde qualificado para a devida orientação, medicação ou tratamento, que seja compatível com suas necessidades específicas.
Os comentários constituem um espaço importante para a livre manifestação dos usuários, desde que cadastrados no Canal Farma e que respeitem os Termos e Condições de Uso. Portanto, cada comentário é de responsabilidade exclusiva do usuário que o assina, não representando a opinião do Canal Farma, que pode retirar, sem prévio aviso, comentários postados que não estejam de acordo com estas regras.
Por favor, faça Login para comentar