banner di prognosi

Zmanda protegge i dati biotecnologici

Quantità colossali di dati molecolari sono un inventario critico per Prognosys Biosciences, una società di biotecnologie con sede a La Jolla, CA. I dati, raccolti dai sequenziatori di DNA, risiedono su un server di archiviazione RAID che dispone di circa 20 TB di spazio di archiviazione utilizzabile.

Logo Prognosys Biosciences | Zmanda

"I dati sono di fondamentale importanza per l'azienda e devono essere protetti da guasti alle apparecchiature e altri rischi", afferma il dott. Mike Thompson, Ph.D., Prognosys.

Il genoma umano ha tre miliardi di paia di basi. La sequenza delle basi determina le differenze tra le persone e le informazioni su queste differenze vengono utilizzate per migliorare la medicina e per comprendere l'effetto di farmaci specifici. Prognosys utilizza un sequencer chiamato Illumina Genome Analyzer II, che genera risultati per scoperte in genomica, epigenomica, analisi dell'espressione genica e interazioni tra proteine e acidi nucleici. Ogni esecuzione dello strumento di sequenziamento produce quasi un terabyte di dati. Una volta raccolti, i dati grezzi non cambiano. Risultati di dati dinamici da calcoli eseguiti sui dati grezzi.

Il backup open source si sposta

Recentemente, quando Prognosys ha intensificato sia i progetti interni che le operazioni di sequencing services, è diventato chiaro che era necessario un solido sistema di backup e ripristino. Sono stati studiati prodotti software di backup e ripristino proprietari e anche il software open source di Zmanda per il backup di dati di sequenziamento non modificati e dati dinamici derivati dall'analisi computazionale.

I fattori decisivi nella scelta di Zmanda Amanda Enterprise Software Backup Server e Solaris Client inclusi: prezzo (Amanda Enterprise Backup Server è inferiore dell'80% rispetto al software proprietario); la capacità di crittografare i dati sul client o sul server; accessibilità del codice open source; e la promessa di assistenza clienti.

“Comprimiamo i dati a circa il 70% prima che vengano scritti su nastro. Se succede qualcosa al software Zmanda lungo la strada e non siamo in grado di usarlo, possiamo usare gzip regolare per decomprimere i dati ", afferma Thompson. “Zmanda ha installato in remoto il software sul server di backup e sul server di archiviazione, lo ha testato e si è assicurato che fossimo a nostro agio con il prodotto. L'interazione che abbiamo avuto con loro per il prezzo è stata imbattibile. "

Durante l'installazione, i tecnici di Zmanda hanno aiutato Prognosys a superare alcune sfide di rete oltre a consentire all'azienda di eseguire il backup dei set di dati grezzi in modo più efficiente. Il tecnico Zmanda ha aiutato Prognosys ad aumentare la larghezza di banda tra il server di backup e il server di archiviazione in modo che Prognosys potesse sfruttare in modo più efficace la potenza delle sue capacità di pianificazione intelligente, che mantiene basso il traffico di rete mentre le macchine raccolgono i dati.

"Il backup statico dei set di dati grezzi era una novità per Zmanda", afferma Thompson. “Hanno scritto uno script per automatizzare il backup e non solo erano ben informati in ciò a cui erano abituati. Gli ingegneri di Zmanda hanno fatto di tutto per sviluppare una soluzione che funzionasse per noi. "

Zmanda doma i dati statici e dinamici

La rete Prognosys Biosciences è composta da server e client Linux, Solaris e Mac OS X. Gli strumenti scientifici si connettono ai client Windows.

Il calcolo avviene su un server Linux, che analizza i dati dall'Illumina Genome Analyzer II e allinea i dati di sequenza rispetto a genomi umani e altri. Genome Analyzer II genera 50 milioni di letture di 36 basi per corsa.

Un Dell PowerEdge 2950 funge da server di backup. Il 2950 ha processori Xeon quad-core, capacità di 1,5 TB e Red Hat Enterprise Linux 5. Si collega a un server di archiviazione RAID Sun Fire X4500 con Solaris, che esegue il backup dei dati ogni giorno e li scarica quando è pieno su un nastro Dell PowerVault ML600 biblioteca.

La libreria Dell dispone di 36 slot per nastri LTO da 800 GB. I dati dinamici popolano quattro nastri che vengono riciclati in una rotazione di quattro settimane. Altri nastri sono dedicati al backup dei dati grezzi. Dopo che Prognosys termina una corsa con Illumina Genome Analyzer II, scrive i dati su nastri. I nastri di backup vengono inviati all'archiviazione sicura offsite.

La dimensione media del backup settimanale per i set di dati non elaborati è di un terabyte e la dimensione media del backup giornaliero per i dati dinamici è di circa 500 GB. Il tempo medio per i backup completi settimanali su nastro è di sette ore. I backup incrementali di dati dinamici su disco hanno una media di 2,5 ore.

Prognosys Biosciences sfrutta Zmanda per la massima tranquillità

Dall'implementazione del software Zmanda, Prognosys è stata in grado di aumentare le operazioni senza rischiare la perdita di dati. La soluzione Amanda Enterprise consente a Prognosys di espandere il proprio ambiente e di continuare ad aggiungere client secondo necessità. Nel prossimo futuro, Prognosys prevede di aggiungere più capacità di elaborazione e possibilmente più server di archiviazione.

Prognosys ha eseguito il backup di circa 20 TB dall'implementazione. Thompson ha anche testato il restauro. Una volta che i dati vengono scaricati su nastro, viene selezionata una scheda di ripristino in Amanda Enterprise. Amanda Enterprise possiede un database che contiene informazioni su tutte le directory e i file di cui è stato eseguito il backup. L'utente richiede il ripristino da un periodo di tempo specifico e Amanda Enterprise dice all'utente quale nastro caricare. Il carico del server è migliorato così come la larghezza di banda tra il server e il client.

"Un'altra cosa che ci piace molto del software di backup Zmanda è che si tratta di un'applicazione Web", afferma Thompson. "Siamo in grado di monitorare l'avanzamento del backup da qualsiasi macchina sulla rete."

Inoltre, l'interfaccia dell'applicazione Web consente l'amministrazione dei backup da parte di personale non tecnico. Questo è un vantaggio per le aziende senza amministratori di archiviazione dedicati.

For companies that process massive amounts of data, robust and dependable backup and recovery are required for success. Companies from a wide variety of vertical markets are successfully protecting their data assets with a nimble open source solution rather than over-engineered, expensive proprietary software.

Altre storie di successo