Erfolgsgeschichte - Prognosys Biosciences

Prognose Banner

Zmanda schützt Biotechnologiedaten

Kolossale Mengen molekularer Daten sind ein kritisches Inventar für Prognosys Biosciences, ein Biotechnologieunternehmen mit Sitz in La Jolla, CA. Die Daten, die von DNA-Sequenzierern gesammelt werden, befinden sich auf einem RAID-Speicherserver, der über ungefähr 20 TB nutzbaren Speicherplatz verfügt.

Prognosys Biosciences-Logo | Zmanda

„Die Daten sind für das Unternehmen von entscheidender Bedeutung und müssen vor Geräteausfällen und anderen Risiken geschützt werden“, sagt Dr. Mike Thompson, Ph.D., Prognosys.

Das menschliche Genom hat drei Milliarden Basenpaare. Die Reihenfolge der Basen bestimmt die Unterschiede zwischen Menschen, und die Informationen über diese Unterschiede werden verwendet, um die Medizin zu verbessern und die Wirkung bestimmter Medikamente zu verstehen. Prognosys verwendet einen Sequenzer namens Illumina Genome Analyzer II, der Ergebnisse für Entdeckungen in den Bereichen Genomik, Epigenomik, Genexpressionsanalyse und Protein-Nukleinsäure-Wechselwirkungen generiert. Jeder Durchlauf des Sequenzierungsinstruments führt zu fast einem Terabyte Daten. Einmal gesammelt, ändern sich die Rohdaten nicht. Dynamische Daten resultieren aus Berechnungen, die an den Rohdaten durchgeführt wurden.

Open Source Backup zieht ein

Als Prognosys kürzlich sowohl interne Projekte als auch den Betrieb von Sequenzierungsdiensten hochfuhr, wurde klar, dass ein solides Sicherungs- und Wiederherstellungssystem erforderlich ist. Proprietäre Backup- und Recovery-Softwareprodukte sowie die Open-Source-Software von Zmanda wurden untersucht, um sowohl unveränderte Rohdaten für die Sequenzierung als auch dynamische Daten aus der Computeranalyse zu sichern.

Die entscheidenden Faktoren bei der Wahl von Zmanda Amanda Unternehmen Backup Server-Software und Solaris Client enthalten: Preis (Amanda Enterprise Backup Server ist 80 Prozent niedriger als proprietäre Software); die Fähigkeit, Daten auf dem Client oder Server zu verschlüsseln; Zugänglichkeit von Open Source Code; und das Versprechen der Kundenbetreuung.

„Wir komprimieren die Daten zu rund 70 Prozent, bevor sie auf Band geschrieben werden. Wenn später etwas mit der Zmanda-Software passiert und wir sie nicht verwenden können, können wir die Daten mit normalem gzip dekomprimieren “, sagt Thompson. „Zmanda hat die Software remote auf dem Sicherungs- und Speicherserver installiert, getestet und sichergestellt, dass wir mit dem Produkt vertraut sind. Die Interaktion, die wir mit ihnen für den Preis hatten, war unschlagbar. “

Während der Installation halfen die Techniker von Zmanda Prognosys, einige Netzwerkprobleme zu bewältigen, und ermöglichten es dem Unternehmen, Rohdatensätze effizienter zu sichern. Der Zmanda-Techniker half Prognosys dabei, die Bandbreite zwischen dem Sicherungsserver und dem Speicherserver zu erhöhen, damit Prognosys die Leistung seiner intelligenten Planungsfunktionen effektiver nutzen kann, wodurch der Netzwerkverkehr gering bleibt, während Maschinen Daten erfassen.

"Die statische Sicherung von Rohdatensätzen war für Zmanda neu", sagt Thompson. „Sie haben ein Skript geschrieben, um ihre Sicherung zu automatisieren, und waren nicht nur mit den gewohnten Aufgaben vertraut. Die Ingenieure von Zmanda haben alles getan, um eine Lösung zu entwickeln, die für uns funktioniert. “

Zmanda zähmt statische und dynamische Daten

Das Prognosys Biosciences-Netzwerk besteht aus Servern und Clients von Linux, Solaris und Mac OS X. Wissenschaftliche Instrumente stellen eine Verbindung zu Windows-Clients her.

Die Berechnung erfolgt auf einem Linux-Server, der Daten aus dem Illumina Genome Analyzer II analysiert und Sequenzdaten mit menschlichen und anderen Genomen vergleicht. Der Genome Analyzer II generiert 50 Millionen Lesevorgänge mit 36 ​​Basen pro Lauf.

Ein Dell PowerEdge 2950 dient als Sicherungsserver. Der 2950 verfügt über Quad-Core-Xeon-Prozessoren, eine Kapazität von 1.5 TB und Red Hat Enterprise Linux 5. Er stellt eine Verbindung zu einem Sun Fire X4500-RAID-Speicherserver her, auf dem Solaris ausgeführt wird. Dieser sichert die Daten täglich und speichert sie, wenn sie voll sind, auf einem Dell PowerVault ML600-Band Bibliothek.

Die Dell-Bibliothek verfügt über 36 Steckplätze für 800 GB LTO-Bänder. Dynamische Daten füllen vier Bänder, die in einer vierwöchigen Rotation recycelt werden. Andere Bänder sind für die Sicherung von Rohdaten vorgesehen. Nachdem Prognosys einen Lauf mit dem Illumina Genome Analyzer II beendet hat, schreibt es die Daten auf Bänder. Sicherungsbänder werden an einen sicheren Speicher außerhalb des Standorts gesendet.

Die durchschnittliche wöchentliche Sicherungsgröße für Rohdatensätze beträgt ein Terabyte und die durchschnittliche tägliche Sicherungsgröße für dynamische Daten liegt bei etwa 500 GB. Die durchschnittliche Zeit für wöchentliche vollständige Sicherungen auf Band beträgt sieben Stunden. Inkrementelle Sicherungen dynamischer Daten auf der Festplatte dauern durchschnittlich 2.5 Stunden.

Prognosys Biosciences nutzt Zmanda für ein beruhigendes Gefühl

Seit der Implementierung der Zmanda-Software konnte Prognosys den Betrieb skalieren, ohne Datenverlust zu riskieren. Mit der Amanda Enterprise-Lösung kann Prognosys seine Umgebung erweitern und bei Bedarf weitere Kunden hinzufügen. Prognosys plant in naher Zukunft, mehr Rechenkapazität und möglicherweise mehr Speicherserver hinzuzufügen.

Prognosys hat seit der Implementierung ungefähr 20 TB gesichert. Thompson hat auch die Restauration getestet. Sobald die Daten auf Band gespeichert sind, wird in Amanda Enterprise eine Registerkarte zum Wiederherstellen ausgewählt. Amanda Enterprise verfügt über eine Datenbank, die Informationen zu allen gesicherten Verzeichnissen und Dateien enthält. Der Benutzer fordert eine Wiederherstellung ab einem bestimmten Zeitraum an, und Amanda Enterprise teilt dem Benutzer mit, welches Band geladen werden soll. Die Serverlast hat sich verbessert, ebenso wie die Bandbreite zwischen Server und Client.

"Eine andere Sache, die wir an der Zmanda-Backup-Software wirklich mögen, ist, dass es sich um eine Webanwendung handelt", sagt Thompson. "Wir können den Fortschritt der Sicherung von jedem Computer im Netzwerk aus überwachen."

Darüber hinaus ermöglicht die Webanwendungsoberfläche die Verwaltung von Backups durch nicht technisches Personal. Dies ist ein Plus für Unternehmen ohne dedizierte Speicheradministratoren.

Für Unternehmen, die große Datenmengen verarbeiten, robuste und zuverlässige Sicherung und Wiederherstellung sind für den Erfolg erforderlich. Unternehmen aus einer Vielzahl vertikaler Märkte schützen ihre Datenbestände erfolgreich mit einer flinken Open-Source-Lösung und nicht mit überentwickelter, teurer proprietärer Software.

Weitere Erfolgsgeschichten