O blogue da AWS

Armazenamento de dados: Com a AWS, cientistas brasileiros estão construindo a primeira floresta digital na nuvem

A biodiversidade brasileira é uma das nossas maiores riquezas e nas matas do país podem estar escondidas moléculas com potencial para se tornar produtos de alto valor comercial. O grande desafio para os cientistas sempre foi o mapeamento dessas moléculas, bem como a possibilidade de armazenamento de dados, um trabalho extremamente difícil e caro. Porém, a Bio Bureau, startup encubada na BioRio, polo de biotecnologia do Rio de Janeiro, encontrou na nuvem da AWS a solução para “uma empresa pequenininha fazer um trabalho de gente grande”, como diz o coordenador do projeto, o biólogo Mauro Rebelo. Com apenas cinco funcionários, a Bio Bureau já atende a dois clientes gigantes: a Petrobras e a Votorantim. Saiba um pouco mais sobre esse estudo de caso.

“Somos uma startup pequena que precisa de uma infraestrutura de TI que a gente não tem como fazer, e poder usar a nuvem e os serviços da AWS viabilizou nosso modelo de negócio, que a gente acredita que é escalonável. Ainda não temos clientes o suficiente para escalonar isso, mas continuamos investindo no desenvolvimento da nossa plataforma na nuvem porque a gente acredita que vai escalonar muito, e na hora que escalonar, não vou precisar me preocupar com a infraestrutura.”

Como a tecnologia da AWS de armazenamento de dados viabiliza as pesquisas da Bio Bureau?

Foi em 2013 que o biólogo conheceu a AWS e, apesar de toda a resistência de pesquisadores das universidades, apostou no potencial da nuvem para a biotecnologia, sem precisar de um alto investimento inicial em infraestrutura, que a empresa simplesmente não tinha como fazer.

“Em algum momento, nós vimos que dava para sequenciar não só alguns genes, mas genomas inteiros e isso são bilhões de pares de base, é um volume muito, muito grande de informação na forma de texto, mas que tem que ser processado também”, explica Mauro. “E a gente viu alguns trabalhos que estavam sendo feitos pela indústria farmacêutica, que ao invés de comprar servidores gigantescos, foram os primeiros a tentar paralelizar alguns desses processamentos de bioinformática na Amazon. E a gente era uma empresa pequena, não tínhamos cem mil dólares para comprar um servidor, e aí eu resolvi fazer na Amazon, em 2013. Para ter uma ideia de custo, eu consegui com dez mil dólares fazer análises que, com um computador próprio, eu precisaria de cem mil dólares. Eu acho que a gente tem que abraçar a tecnologia.”

Quais serviços da AWS a Bio Bureau utiliza em suas pesquisas?

O sequenciamento de genomas inteiros exige uma capacidade de processamento de bilhões de pares de base, um volume de armazenamento de dados gigantesco. Com cerca de 500 instâncias no armazenamento de dados da AWS, a startup venceu esse desafio.

“A gente armazena as nossas informações no Amazon S3 e contrata instâncias que são de acordo com a nossa demanda. Às vezes eu preciso de mais processamento, para determinadas análises, e em outras vezes eu preciso de mais memória. Então nós temos lá algumas instâncias que estão dimensionadas para as nossas demandas, e elas ficam desligadas, e na hora que a gente precisa, a gente liga”, explica o biólogo.

Decifrando a Mata Atlântica: uma jornada que está apenas no começo

Os cientistas da Bio Bureau adotaram um método de sequenciamento de genoma simplificado para agilizar a investigação da biodiversidade, começando com 50 espécies de plantas da Mata Atlântica encontradas na reserva Legado das Águas, no Vale do Ribeira, em São Paulo – a maior reserva privada de Mata Atlântica do Brasil –, adquirida pela Votorantim nos anos 1950 para a proteção dos corpos d’água que alimentam sete hidrelétricas da empresa. Em apenas seis meses, com a ajuda da nuvem, 50 espécies já foram decifradas. Mas Rebelo sonha alto: quer decifrar as mais de 20 mil espécies que se estima existir.

“Hoje já temos o maior banco de dados genéticos da Mata Atlântica rodando na nuvem. Nossa ideia é sequenciar toda a biodiversidade das florestas e montar ‘florestas digitais’, e seria legal se a versão digital da Amazônia estivesse armazenada nos servidores da Amazon.”