Başarı Hikayesi - Prognosys Biosciences

prognosys afişi

Zmanda biyoteknoloji verilerini koruyor

Devasa miktarda moleküler veri, La Jolla, CA merkezli bir biyoteknoloji şirketi olan Prognosys Biosciences için kritik envanterdir. DNA sıralayıcılarından toplanan veriler, yaklaşık 20 TB kullanılabilir depolama alanına sahip bir RAID depolama sunucusunda bulunur.

Prognosys Biosciences Logosu | Zmanda

Prognosys'den Dr. Mike Thompson, "Veriler şirket için kritik öneme sahip ve ekipman arızalarından ve diğer risklerden korunması gerekiyor" diyor.

İnsan genomunun üç milyar baz çifti vardır. Bazların sırası, insanlar arasındaki farklılıkları belirler ve bu farklılıklar hakkındaki bilgiler, tıbbı iyileştirmek ve belirli ilaçların etkisini anlamak için kullanılır. Prognosys, genomik, epigenomik, gen ekspresyon analizi ve protein-nükleik asit etkileşimlerindeki keşifler için sonuçlar üreten Illumina Genome Analyzer II adlı bir sıralayıcı kullanır. Sıralama aracının her çalışması, neredeyse bir terabayt veri ile sonuçlanır. Ham veriler toplandıktan sonra değişmez. Ham veriler üzerinde gerçekleştirilen hesaplamalardan dinamik veriler elde edilir.

Açık kaynak yedekleme taşınır

Son zamanlarda, Prognosys hem dahili projeleri hem de sıralama hizmetleri operasyonunu hızlandırırken, sağlam bir yedekleme ve kurtarma sistemine ihtiyaç duyulduğu ortaya çıktı. Tescilli yedekleme ve kurtarma yazılım ürünleri ve ayrıca Zmanda'nın açık kaynak yazılımı, hem değişmeyen ham dizileme verilerinin hem de hesaplamalı analizden elde edilen dinamik verilerin yedeklenmesi için araştırıldı.

Zmanda'nın seçiminde belirleyici faktörler Amanda Kurumsal Yedekleme Sunucusu yazılımı ve Solaris İstemcisi dahildir: fiyat (Amanda Kurumsal Yedekleme Sunucusu, özel yazılımdan yüzde 80 daha azdır); istemci veya sunucudaki verileri şifreleme yeteneği; açık kaynak kodunun erişilebilirliği; ve müşteri desteği vaadi.

"Teybe yazılmadan önce verileri yaklaşık yüzde 70 oranında sıkıştırıyoruz. Yoldaki Zmanda yazılımına bir şey olursa ve onu kullanamazsak, verileri açmak için normal gzip kullanabiliriz ”diyor Thompson. “Zmanda, yazılımı yedekleme sunucusuna ve depolama sunucusuna uzaktan yükledi, test etti ve ürün konusunda rahat olduğumuzdan emin oldu. Fiyat karşılığında onlarla yaptığımız etkileşim rakipsizdi. "

Kurulum sırasında Zmanda'nın teknisyenleri, Prognosys'in bazı ağ zorluklarının üstesinden gelmesine ve şirketin ham veri setlerini daha verimli bir şekilde yedeklemesine yardımcı oldu. Zmanda teknisyeni, Prognosys'in yedekleme sunucusu ile depolama sunucusu arasındaki bant genişliğini artırmasına yardımcı oldu, böylece Prognosys, makineler veri toplarken ağ trafiğini düşük tutan akıllı programlama yeteneklerinin gücünden daha etkili bir şekilde faydalanabilirdi.

Thompson, "Ham veri setlerinin statik yedeklemesi Zmanda için yeniydi" diyor. "Yedeklemelerini otomatikleştirmek için bir komut dosyası yazdılar ve yalnızca ne yapmaya alıştıkları konusunda bilgi sahibi değillerdi. Zmanda mühendisleri, bizim için işe yarayan bir çözüm geliştirmek için ellerinden geleni yaptılar. "

Zmanda statik ve dinamik verileri evcilleştirir

Prognosys Biosciences ağı, Linux, Solaris ve Mac OS X sunucuları ve istemcilerinden oluşur. Bilimsel araçlar Windows istemcilerine bağlanır.

Hesaplama, Illumina Genome Analyzer II'den gelen verileri analiz eden ve dizi verilerini insan ve diğer genomlara göre hizalayan bir Linux sunucusunda gerçekleşir. Genom Analyzer II, çalışma başına 50 milyon 36 bazlı okuma üretir.

Dell PowerEdge 2950, ​​yedekleme sunucusu olarak hizmet verir. 2950, ​​dört çekirdekli Xeon işlemcilere, 1.5 TB kapasiteye ve Red Hat Enterprise Linux 5'e sahiptir. Solaris çalıştıran bir Sun Fire X4500 RAID depolama sunucusuna bağlanır, bu sunucu verileri günlük olarak yedekler ve dolduğunda Dell PowerVault ML600 teybe aktarır kütüphane.

Dell kitaplığında 36 GB LTO bantlar için 800 yuva bulunur. Dinamik veriler, dört haftalık bir rotasyonda geri dönüştürülen dört bandı doldurur. Diğer bantlar, ham verilerin yedeklenmesine adanmıştır. Prognosys, Illumina Genome Analyzer II ile bir çalışmayı bitirdikten sonra, verileri teyplere yazar. Yedek bantlar, iş yeri dışındaki güvenli depolamaya gönderilir.

Ham veri kümeleri için haftalık ortalama yedekleme boyutu bir terabayttır ve dinamik veriler için ortalama günlük yedekleme boyutu yaklaşık 500 GB'tır. Haftalık tam yedeklemelerin teybe ortalama süresi yedi saattir. Dinamik verilerin artımlı yedeklemeleri diske ortalama 2.5 saat.

Prognosys Biosciences, gönül rahatlığı için Zmanda'dan yararlanıyor

Zmanda'nın yazılımını uygulamaya başladığından beri Prognosys, veri kaybı riski olmadan operasyonları ölçeklendirebildi. Amanda Enterprise çözümü, Prognosys'in ortamını büyütmesine ve gerektiğinde istemciler eklemeye devam etmesine olanak tanır. Yakın gelecekte Prognosys, daha fazla bilgi işlem kapasitesi ve muhtemelen daha fazla depolama sunucusu eklemeyi planlıyor.

Prognosys, uygulamadan bu yana yaklaşık 20 TB yedekledi. Thompson ayrıca restorasyonu da test etti. Veriler banda döküldükten sonra, Amanda Enterprise'da bir geri yükleme sekmesi seçilir. Amanda Enterprise, yedeklenen tüm dizinler ve dosyalar hakkında bilgi içeren bir veritabanı tutar. Kullanıcı belirli bir zaman diliminden geri yükleme ister ve Amanda Enterprise kullanıcıya hangi bandın yükleneceğini söyler. Sunucu ile istemci arasındaki bant genişliğinde olduğu gibi sunucu yükü de gelişmiştir.

Thompson, "Zmanda yedekleme yazılımı hakkında gerçekten sevdiğimiz bir diğer şey de bir Web uygulaması" diyor. "Ağdaki herhangi bir makineden yedeklemenin ilerlemesini izleyebiliriz."

Ek olarak, Web uygulama arayüzü, yedeklemelerin teknik olmayan personel tarafından yönetilmesine izin verir. Bu, özel depolama yöneticileri olmayan şirketler için bir artıdır.

Büyük miktarda veriyi işleyen şirketler için, sağlam ve güvenilir yedekleme ve kurtarma başarı için gereklidir. Çok çeşitli dikey pazarlardan şirketler, veri varlıklarını aşırı mühendislik ürünü, pahalı özel yazılımlar yerine çevik bir açık kaynaklı çözümle başarıyla koruyorlar.

Daha fazla başarı hikayesi