Histoire de réussite - Prognosys Biosciences

bannière de prognosys

Zmanda protège les données biotechnologiques

Des quantités colossales de données moléculaires constituent un inventaire essentiel pour Prognosys Biosciences, une société de biotechnologie basée à La Jolla, en Californie. Les données, qui sont collectées à partir de séquenceurs ADN, résident sur un serveur de stockage RAID qui dispose d'environ 20 To d'espace de stockage utilisable.

Logo de Prognosys Biosciences | Zmanda

«Les données sont d'une importance cruciale pour l'entreprise et doivent être protégées contre les pannes d'équipement et autres risques», déclare le Dr Mike Thompson, Ph.D., Prognosys.

Le génome humain compte trois milliards de paires de bases. La séquence des bases détermine les différences entre les personnes, et les informations sur ces différences sont utilisées pour améliorer la médecine et pour comprendre l'effet de médicaments spécifiques. Prognosys utilise un séquenceur appelé Illumina Genome Analyzer II, qui génère des résultats pour des découvertes en génomique, épigénomique, analyse de l'expression génique et interactions protéine-acide nucléique. Chaque exécution de l'instrument de séquençage génère près d'un téraoctet de données. Une fois collectées, les données brutes ne changent pas. Les données dynamiques résultent de calculs effectués sur les données brutes.

La sauvegarde open source s'installe

Récemment, alors que Prognosys a intensifié ses projets internes et ses services de séquençage, il est devenu clair qu'un solide système de sauvegarde et de restauration était nécessaire. Des produits logiciels de sauvegarde et de restauration propriétaires ainsi que le logiciel open source de Zmanda ont été recherchés pour la sauvegarde à la fois des données de séquençage brutes immuables et des données dynamiques dérivées de l'analyse informatique.

Les facteurs décisifs dans le choix de Zmanda Entreprise Amanda Logiciel de serveur de sauvegarde et client Solaris inclus: prix (Amanda Enterprise Backup Server est 80 pour cent de moins que le logiciel propriétaire); la capacité de crypter les données sur le client ou le serveur; accessibilité du code open source; et la promesse du support client.

«Nous compressons les données à environ 70% avant qu'elles ne soient écrites sur bande. Si quelque chose arrive au logiciel Zmanda plus tard et que nous ne pouvons pas l'utiliser, nous pouvons utiliser gzip régulier pour décompresser les données », explique Thompson. «Zmanda a installé à distance le logiciel sur le serveur de sauvegarde et le serveur de stockage, l'a testé et s'est assuré que nous étions à l'aise avec le produit. L'interaction que nous avons eue avec eux pour le prix était imbattable. »

Au cours de l'installation, les techniciens de Zmanda ont aidé Prognosys à surmonter certains problèmes de réseau en plus de permettre à l'entreprise de sauvegarder plus efficacement les ensembles de données brutes. Le technicien de Zmanda a aidé Prognosys à augmenter la bande passante entre le serveur de sauvegarde et le serveur de stockage afin que Prognosys puisse exploiter plus efficacement la puissance de ses capacités de planification intelligente, qui maintiennent le trafic réseau à un faible niveau pendant que les machines collectent des données.

«La sauvegarde statique des ensembles de données brutes était une nouveauté pour Zmanda», déclare Thompson. «Ils ont écrit un script pour automatiser leur sauvegarde et ne savaient pas seulement ce qu'ils avaient l'habitude de faire. Les ingénieurs de Zmanda ont fait tout leur possible pour développer une solution qui a fonctionné pour nous. »

Zmanda apprivoise les données statiques et dynamiques

Le réseau Prognosys Biosciences se compose de serveurs et de clients Linux, Solaris et Mac OS X. Les instruments scientifiques se connectent aux clients Windows.

Le calcul s'effectue sur un serveur Linux, qui analyse les données d'Illumina Genome Analyzer II et aligne les données de séquence sur les génomes humains et autres. L'analyseur de génome II génère 50 millions de lectures de 36 bases par analyse.

Un Dell PowerEdge 2950 sert de serveur de sauvegarde. Le 2950 est doté de processeurs Xeon quadricœur, d'une capacité de 1.5 To et de Red Hat Enterprise Linux 5. Il se connecte à un serveur de stockage RAID Sun Fire X4500 exécutant Solaris, qui sauvegarde les données quotidiennement et les décharge une fois pleines sur une bande Dell PowerVault ML600 bibliothèque.

La bibliothèque Dell dispose de 36 emplacements pour bandes LTO de 800 Go. Les données dynamiques remplissent quatre bandes qui sont recyclées en une rotation de quatre semaines. D'autres bandes sont dédiées à la sauvegarde des données brutes. Une fois que Prognosys a terminé une analyse avec Illumina Genome Analyzer II, il écrit les données sur des bandes. Les bandes de sauvegarde sont envoyées vers un stockage sécurisé hors site.

La taille de sauvegarde hebdomadaire moyenne pour les ensembles de données brutes est d'un téraoctet et la taille de sauvegarde quotidienne moyenne pour les données dynamiques est d'environ 500 Go. La durée moyenne des sauvegardes complètes hebdomadaires sur bande est de sept heures. Les sauvegardes incrémentielles de données dynamiques sur disque durent en moyenne 2.5 heures.

Prognosys Biosciences utilise Zmanda pour la tranquillité d'esprit

Depuis la mise en œuvre du logiciel Zmanda, Prognosys a pu étendre ses opérations sans risquer de perdre des données. La solution Amanda Enterprise permet à Prognosys de développer son environnement et de continuer à ajouter des clients au besoin. Dans un proche avenir, Prognosys prévoit d'ajouter plus de capacité de calcul et éventuellement plus de serveurs de stockage.

Prognosys a sauvegardé environ 20 To depuis la mise en œuvre. Thompson a également testé la restauration. Une fois les données sauvegardées sur bande, un onglet de restauration est sélectionné dans Amanda Enterprise. Amanda Enterprise contient une base de données qui contient des informations sur tous les répertoires et fichiers qui ont été sauvegardés. L'utilisateur demande la restauration à partir d'une période de temps spécifique et Amanda Enterprise indique à l'utilisateur la bande à charger. La charge du serveur s'est améliorée, tout comme la bande passante entre le serveur et le client.

«Une autre chose que nous apprécions vraiment dans le logiciel de sauvegarde Zmanda est qu'il s'agit d'une application Web», déclare Thompson. «Nous pouvons surveiller la progression de la sauvegarde à partir de n'importe quelle machine du réseau.»

De plus, l'interface de l'application Web permet d'administrer les sauvegardes par du personnel non technique. C'est un plus pour les entreprises sans administrateurs de stockage dédiés.

Pour les entreprises qui traitent d'énormes quantités de données, sauvegarde et restauration robustes et fiables sont nécessaires pour réussir. Les entreprises d'une grande variété de marchés verticaux protègent avec succès leurs actifs de données avec une solution open source agile plutôt qu'un logiciel propriétaire sur-conçu et coûteux.

Plus d'histoires de réussite