サクセスストーリー– Prognosys Biosciences

prognosysバナー

Zmandaはバイオテクノロジーデータを保護します

膨大な量の分子データは、カリフォルニア州ラホーヤに本拠を置くバイオテクノロジー企業であるPrognosysBiosciencesにとって重要な在庫です。 DNAシーケンサーから収集されたデータは、約20TBの使用可能なストレージスペースを持つRAIDストレージサーバーに存在します。

PrognosysBiosciencesロゴ| ズマンダ

「データは会社にとって非常に重要であり、機器の故障やその他のリスクから保護する必要があります」と、PrognosysのDr. MikeThompson博士は述べています。

ヒトゲノムにはXNUMX億塩基対があります。 塩基の順序は人の違いを決定し、これらの違いに関する情報は、薬を改善し、特定の薬の効果を理解するために使用されます。 Prognosysは、イルミナゲノムアナライザーIIと呼ばれるシーケンサーを使用します。このシーケンサーは、ゲノミクス、エピゲノミクス、遺伝子発現分析、およびタンパク質と核酸の相互作用における発見の結果を生成します。 シーケンシング機器を実行するたびに、ほぼテラバイトのデータが生成されます。 一度収集されると、生データは変更されません。 動的データは、生データに対して実行された計算の結果です。

オープンソースバックアップは

最近、Prognosysが内部プロジェクトとそのシーケンスサービスの運用の両方を強化するにつれて、確実なバックアップおよびリカバリシステムが必要であることが明らかになりました。 独自のバックアップおよびリカバリソフトウェア製品とZmandaのオープンソースソフトウェアは、不変の生のシーケンスデータと計算分析から得られた動的データの両方のバックアップのために研究されました。

ズマンダを選ぶ際の決定要因 アマンダエンタープライズ バックアップサーバーソフトウェアとSolarisクライアントが含まれています:価格(Amanda Enterprise Backup Serverはプロプライエタリソフトウェアより80%安い)。 クライアントまたはサーバー上のデータを暗号化する機能。 オープンソースコードのアクセシビリティ。 そして顧客サポートの約束。

「テープに書き込む前に、データを約70%圧縮します。 将来的にZmandaソフトウェアに何かが起こり、それを使用できない場合は、通常のgzipを使用してデータを解凍できます」とThompson氏は言います。 「Zmandaはバックアップサーバーとストレージサーバーにソフトウェアをリモートでインストールし、テストして、製品に満足していることを確認しました。 価格についての彼らとのやりとりは無敵でした。」

インストール中、Zmandaの技術者は、Prognosysが生データセットをより効率的にバックアップできるようにすることに加えて、いくつかのネットワークの課題を克服するのを支援しました。 Zmandaの技術者は、Prognosysがバックアップサーバーとストレージサーバー間の帯域幅を拡大するのを支援し、Prognosysがスマートスケジューリング機能の能力をより効果的に活用できるようにしました。これにより、マシンがデータを収集する間、ネットワークトラフィックを低く抑えることができます。

「生データセットの静的バックアップはZmandaにとって新しいものでした」とThompson氏は言います。 「彼らはバックアップを自動化するためのスクリプトを作成し、慣れていることだけに精通していませんでした。 Zmandaのエンジニアは、私たちのために働くソリューションを開発するために彼らの邪魔をしませんでした。」

Zmandaは静的および動的データを飼いならす

Prognosys Biosciencesネットワークは、Linux、Solaris、およびMac OSXサーバーとクライアントで構成されています。 科学機器はWindowsクライアントに接続します。

計算はLinuxサーバーで行われ、Illumina Genome Analyzer IIからのデータを分析し、シーケンスデータをヒトおよびその他のゲノムに対して整列させます。 Genome Analyzer IIは、実行ごとに50万の36ベースの読み取りを生成します。

Dell PowerEdge2950はバックアップサーバーとして機能します。 2950には、クアッドコアXeonプロセッサ、1.5 TBの容量、およびRed Hat Enterprise Linux5が搭載されています。Solarisを実行しているSunFire X4500 RAIDストレージサーバーに接続します。このサーバーは、データを毎日バックアップし、いっぱいになるとDell PowerVaultML600テープにダンプします。図書館。

デルのライブラリには、36GBのLTOテープ用に800個のスロットがあります。 動的データは、XNUMX週間のローテーションでリサイクルされるXNUMX本のテープに入力されます。 他のテープは、生データのバックアップ専用です。 Prognosysは、Illumina Genome Analyzer IIでの実行を終了した後、データをテープに書き込みます。 バックアップテープはオフサイトの安全なストレージに送信されます。

生データセットの500週間の平均バックアップサイズは2.5テラバイトで、動的データのXNUMX日の平均バックアップサイズは約XNUMXGBです。 テープへの毎週の完全バックアップの平均時間はXNUMX時間です。 ディスクへの動的データの増分バックアップは平均XNUMX時間です。

Prognosys Biosciencesは、安心のためにZmandaを活用しています

Zmandaのソフトウェアを実装して以来、Prognosysはデータ損失のリスクを冒すことなく運用をスケールアップすることができました。 Amanda Enterpriseソリューションにより、Prognosysは環境を拡張し、必要に応じてクライアントを追加し続けることができます。 近い将来、Prognosysは、より多くのコンピューティング容量と、場合によってはより多くのストレージサーバーを追加することを計画しています。

Prognosysは、実装以来、約20TBをバックアップしています。 トンプソンは修復物もテストしました。 データがテープにダンプされると、AmandaEnterpriseで[復元]タブが選択されます。 Amanda Enterpriseは、バックアップされたすべてのディレクトリとファイルに関する情報を含むデータベースを保持しています。 ユーザーは特定の期間からの復元を要求し、AmandaEnterpriseはどのテープをロードするかをユーザーに指示します。 サーバーとクライアント間の帯域幅と同様に、サーバーの負荷が改善されました。

「Zmandaバックアップソフトウェアについて私たちが本当に気に入っているもうXNUMXつの点は、それがWebアプリケーションであるということです」とThompson氏は言います。 「ネットワーク上の任意のマシンからバックアップの進行状況を監視できます。」

さらに、Webアプリケーションインターフェイスを使用すると、技術者以外のスタッフがバックアップを管理できます。 これは、専任のストレージ管理者がいない企業にとってはプラスです。

大量のデータを処理する企業の場合、 堅牢で信頼性の高いバックアップとリカバリ 成功するには必要です。 多種多様な垂直市場の企業は、過剰に設計された高価なプロプライエタリソフトウェアではなく、機敏なオープンソースソリューションでデータ資産を保護することに成功しています。

その他のサクセスストーリー