Historia de éxito - Prognosys Biosciences

banner de prognosys

Zmanda protege los datos biotecnológicos

Cantidades colosales de datos moleculares son un inventario crítico para Prognosys Biosciences, una empresa de biotecnología con sede en La Jolla, CA. Los datos, que se recopilan de secuenciadores de ADN, residen en un servidor de almacenamiento RAID que tiene aproximadamente 20 TB de espacio de almacenamiento utilizable.

Logotipo de Prognosys Biosciences | Zmanda

“Los datos son de vital importancia para la empresa y deben protegerse de fallas en el equipo y otros riesgos”, dice el Dr. Mike Thompson, Ph.D., Prognosys.

El genoma humano tiene tres mil millones de pares de bases. La secuencia de bases determina las diferencias entre las personas, y la información sobre estas diferencias se utiliza para mejorar la medicina y comprender el efecto de medicamentos específicos. Prognosys utiliza un secuenciador llamado Illumina Genome Analyzer II, que genera resultados para descubrimientos en genómica, epigenómica, análisis de expresión génica e interacciones proteína-ácido nucleico. Cada ejecución del instrumento de secuenciación da como resultado casi un terabyte de datos. Una vez recopilados, los datos sin procesar no cambian. Los datos dinámicos son el resultado de cálculos realizados sobre los datos brutos.

La copia de seguridad de código abierto se mueve

Recientemente, a medida que Prognosys intensificó los proyectos internos y la operación de sus servicios de secuenciación, quedó claro que se necesitaba un sistema sólido de respaldo y recuperación. Se investigaron los productos de software de respaldo y recuperación patentados y también el software de código abierto de Zmanda para respaldar tanto los datos de secuenciación en bruto inmutables como los datos dinámicos derivados del análisis computacional.

Los factores decisivos para elegir Zmanda's empresa amanda El software Backup Server y el cliente Solaris incluyen: precio (Amanda Enterprise Backup Server es un 80 por ciento menos que el software propietario); la capacidad de cifrar datos en el cliente o servidor; accesibilidad del código fuente abierto; y la promesa de soporte al cliente.

“Comprimimos los datos alrededor del 70 por ciento antes de que se escriban en cinta. Si algo le sucede al software Zmanda en el futuro y no podemos usarlo, podemos usar gzip normal para descomprimir los datos ”, dice Thompson. “Zmanda instaló de forma remota el software en el servidor de respaldo y el servidor de almacenamiento, lo probó y se aseguró de que estuviéramos cómodos con el producto. La interacción que tuvimos con ellos por el precio fue inmejorable ".

Durante la instalación, los técnicos de Zmanda ayudaron a Prognosys a superar algunos desafíos de la red, además de permitirle a la empresa respaldar conjuntos de datos sin procesar de manera más eficiente. El técnico de Zmanda ayudó a Prognosys a aumentar el ancho de banda entre el servidor de respaldo y el servidor de almacenamiento para que Prognosys pudiera aprovechar de manera más efectiva el poder de sus capacidades de programación inteligente, que mantiene el tráfico de red bajo mientras las máquinas recolectan datos.

“La copia de seguridad estática de conjuntos de datos sin procesar era nueva para Zmanda”, dice Thompson. “Escribieron un guión para automatizar su copia de seguridad y no solo sabían lo que estaban acostumbrados a hacer. Los ingenieros de Zmanda hicieron todo lo posible para desarrollar una solución que funcionó para nosotros ".

Zmanda domestica datos estáticos y dinámicos

La red de Prognosys Biosciences consta de servidores y clientes Linux, Solaris y Mac OS X. Los instrumentos científicos se conectan a los clientes de Windows.

La computación se realiza en un servidor Linux, que analiza los datos del Illumina Genome Analyzer II y alinea los datos de la secuencia con los genomas humanos y de otro tipo. Genome Analyzer II genera 50 millones de lecturas de 36 bases por ejecución.

Un Dell PowerEdge 2950 sirve como servidor de respaldo. El 2950 tiene procesadores Xeon de cuatro núcleos, 1.5 TB de capacidad y Red Hat Enterprise Linux 5. Se conecta a un servidor de almacenamiento RAID Sun Fire X4500 que ejecuta Solaris, que realiza una copia de seguridad de los datos a diario y los descarga cuando está lleno en una cinta Dell PowerVault ML600. Biblioteca.

La biblioteca de Dell tiene 36 ranuras para cintas LTO de 800 GB. Los datos dinámicos llenan cuatro cintas que se reciclan en una rotación de cuatro semanas. Otras cintas están dedicadas a la copia de seguridad de datos sin procesar. Una vez que Prognosys termina una ejecución con Illumina Genome Analyzer II, escribe los datos en cintas. Las cintas de respaldo se envían a un almacenamiento seguro externo.

El tamaño medio de la copia de seguridad semanal para los conjuntos de datos sin procesar es de un terabyte y el tamaño medio de la copia de seguridad diaria para los datos dinámicos es de alrededor de 500 GB. El tiempo medio de las copias de seguridad completas semanales en cinta es de siete horas. Las copias de seguridad incrementales de datos dinámicos en disco tienen un promedio de 2.5 horas.

Prognosys Biosciences aprovecha Zmanda para su tranquilidad

Desde que implementó el software de Zmanda, Prognosys ha podido escalar las operaciones sin riesgo de pérdida de datos. La solución Amanda Enterprise permite a Prognosys hacer crecer su entorno y continuar agregando clientes según sea necesario. En un futuro cercano, Prognosys planea agregar más capacidad informática y posiblemente más servidores de almacenamiento.

Prognosys ha respaldado aproximadamente 20 TB desde la implementación. Thompson también ha probado la restauración. Una vez que los datos se descargan en cinta, se selecciona una pestaña de restauración en Amanda Enterprise. Amanda Enterprise tiene una base de datos que contiene información sobre todos los directorios y archivos de los que se ha realizado una copia de seguridad. El usuario solicita la restauración de un período de tiempo específico y Amanda Enterprise le dice qué cinta debe cargar. La carga del servidor ha mejorado al igual que el ancho de banda entre el servidor y el cliente.

“Otra cosa que realmente nos gusta del software de respaldo Zmanda es que es una aplicación web”, dice Thompson. "Podemos monitorear el progreso de la copia de seguridad desde cualquier máquina en la red".

Además, la interfaz de la aplicación web permite que las copias de seguridad sean administradas por personal no técnico. Esta es una ventaja para las empresas sin administradores de almacenamiento dedicados.

Para las empresas que procesan grandes cantidades de datos, respaldo y recuperación robustos y confiables son necesarios para el éxito. Las empresas de una amplia variedad de mercados verticales están protegiendo con éxito sus activos de datos con una ágil solución de código abierto en lugar de un costoso software patentado de ingeniería excesiva.

Más historias de éxito