História de sucesso - Prognosys Biosciences

banner prognosys

Zmanda protege dados de biotecnologia

Quantidades colossais de dados moleculares são um inventário crítico para a Prognosys Biosciences, uma empresa de biotecnologia com sede em La Jolla, CA. Os dados, que são coletados de sequenciadores de DNA, residem em um servidor de armazenamento RAID que possui aproximadamente 20 TB de espaço de armazenamento utilizável.

Logotipo da Prognosys Biosciences | Zmanda

“Os dados são extremamente importantes para a empresa e precisam ser protegidos contra falha do equipamento e outros riscos”, afirma o Dr. Mike Thompson, Ph.D., Prognosys.

O genoma humano tem três bilhões de pares de bases. A sequência de bases determina as diferenças entre as pessoas, e as informações sobre essas diferenças são usadas para aprimorar a medicina e entender o efeito de medicamentos específicos. A Prognosys usa um sequenciador chamado Illumina Genome Analyzer II, que gera resultados para descobertas em genômica, epigenômica, análise de expressão gênica e interações proteína-ácido nucléico. Cada execução do instrumento de sequenciamento resulta em quase um terabyte de dados. Depois de coletados, os dados brutos não mudam. Os dados dinâmicos resultam de cálculos realizados nos dados brutos.

O backup de código aberto se move

Recentemente, à medida que a Prognosys expandia seus projetos internos e sua operação de serviços de sequenciamento, ficou claro que um sistema sólido de backup e recuperação era necessário. Produtos de software de backup e recuperação proprietários e também o software de código-fonte aberto da Zmanda foram pesquisados ​​para backup de dados de sequenciamento bruto imutáveis ​​e dados dinâmicos derivados de análise computacional.

Os fatores decisivos na escolha do Zmanda's Empresa Amanda Software de servidor de backup e cliente Solaris incluídos: preço (o Amanda Enterprise Backup Server é 80 por cento menor que o software proprietário); a capacidade de criptografar dados no cliente ou servidor; acessibilidade de código-fonte aberto; e a promessa de suporte ao cliente.

“Compactamos os dados em cerca de 70 por cento antes de serem gravados em fita. Se algo acontecer com o software Zmanda no futuro e não pudermos usá-lo, podemos usar o gzip regular para descompactar os dados ”, diz Thompson. “Zmanda instalou remotamente o software no servidor de backup e no servidor de armazenamento, testou-o e certificou-se de que estávamos confortáveis ​​com o produto. A interação que tivemos com eles pelo preço foi imbatível. ”

Durante a instalação, os técnicos da Zmanda ajudaram a Prognosys a superar alguns desafios de rede, além de permitir que a empresa fizesse backup de conjuntos de dados brutos com mais eficiência. O técnico da Zmanda ajudou a Prognosys a aumentar a largura de banda entre o servidor de backup e o servidor de armazenamento para que a Prognosys pudesse aproveitar mais eficazmente o poder de seus recursos de agendamento inteligente, que mantém baixo o tráfego de rede enquanto as máquinas coletam dados.

“O backup estático de conjuntos de dados brutos era novo para Zmanda”, diz Thompson. “Eles escreveram um script para automatizar o backup e não apenas conheciam o que estavam acostumados a fazer. Os engenheiros da Zmanda se esforçaram para desenvolver uma solução que funcionasse para nós. ”

Zmanda doma dados estáticos e dinâmicos

A rede da Prognosys Biosciences consiste em servidores e clientes Linux, Solaris e Mac OS X. Instrumentos científicos se conectam a clientes Windows.

A computação ocorre em um servidor Linux, que analisa os dados do Illumina Genome Analyzer II e alinha os dados da sequência com os genomas humanos e outros. O Genome Analyzer II gera 50 milhões de leituras de 36 bases por execução.

Um Dell PowerEdge 2950 serve como servidor de backup. O 2950 tem processadores quad-core Xeon, 1.5 TB de capacidade e Red Hat Enterprise Linux 5. Ele se conecta a um servidor de armazenamento RAID Sun Fire X4500 executando Solaris, que faz backup dos dados diariamente e os despeja quando cheio em uma fita Dell PowerVault ML600 biblioteca.

A biblioteca Dell possui 36 slots para fitas LTO de 800 GB. Os dados dinâmicos preenchem quatro fitas que são recicladas em uma rotação de quatro semanas. Outras fitas são dedicadas ao backup de dados brutos. Depois que o Prognosys termina uma execução com o Illumina Genome Analyzer II, ele grava os dados em fitas. As fitas de backup são enviadas para armazenamento seguro externo.

O tamanho médio do backup semanal para conjuntos de dados brutos é de um terabyte e o tamanho médio do backup diário para dados dinâmicos é de cerca de 500 GB. O tempo médio para backups completos semanais em fita é de sete horas. Os backups incrementais de dados dinâmicos para o disco duram em média 2.5 horas.

A Prognosys Biosciences usa a Zmanda para ter paz de espírito

Desde a implementação do software Zmanda, a Prognosys foi capaz de expandir as operações sem correr o risco de perda de dados. A solução Amanda Enterprise permite que a Prognosys amplie seu ambiente e continue adicionando clientes conforme necessário. Em um futuro próximo, a Prognosys planeja adicionar mais capacidade de computação e possivelmente mais servidores de armazenamento.

A Prognosys fez backup de aproximadamente 20 TB desde a implementação. Thompson também testou a restauração. Depois que os dados são despejados na fita, uma guia de restauração é selecionada no Amanda Enterprise. Amanda Enterprise mantém um banco de dados que contém informações sobre todos os diretórios e arquivos dos quais foi feito backup. O usuário solicita a restauração de um período de tempo específico e o Amanda Enterprise informa ao usuário qual fita carregar. A carga do servidor melhorou, assim como a largura de banda entre o servidor e o cliente.

“Outra coisa de que gostamos muito no software de backup Zmanda é que ele é um aplicativo da Web”, diz Thompson. “Podemos monitorar o andamento do backup de qualquer máquina da rede.”

Além disso, a interface do aplicativo da Web permite que os backups sejam administrados por uma equipe não técnica. Isso é uma vantagem para empresas sem administradores de armazenamento dedicados.

Para empresas que processam grandes quantidades de dados, backup e recuperação robustos e confiáveis são necessários para o sucesso. Empresas de uma ampla variedade de mercados verticais estão protegendo com sucesso seus ativos de dados com uma solução de código aberto ágil, em vez de software proprietário caro e com engenharia excessiva.

Mais histórias de sucesso