Framgångshistoria - Prognosys Biosciences

prognos banner

Zmanda skyddar bioteknikdata

Kolossala mängder molekylär data är kritiska inventeringar för Prognosys Biosciences, ett bioteknikföretag baserat i La Jolla, Kalifornien. Uppgifterna, som samlas in från DNA-sekvenserare, finns på en RAID-lagringsserver som har cirka 20 TB användbart lagringsutrymme.

Prognosys Biosciences-logotyp | Zmanda

"Uppgifterna är kritiskt viktiga för företaget och de måste skyddas från utrustningsfel och andra risker", säger Dr. Mike Thompson, doktorand, Prognosys.

Det mänskliga genomet har tre miljarder baspar. Bassekvensen bestämmer skillnader mellan människor, och informationen om dessa skillnader används för att förbättra medicin och för att förstå effekten av specifika läkemedel. Prognosys använder en sequencer som heter Illumina Genome Analyzer II, som genererar resultat för upptäckter inom genomik, epigenomik, genuttrycksanalys och protein-nukleinsyrainteraktioner. Varje körning av sekvenseringsinstrumentet resulterar i nästan en terabyte data. När de samlats in ändras inte rådata. Dynamiska dateresultat från beräkningar utförda på rådata.

Säkerhetskopiering med öppen källkod flyttar in

Nyligen, när Prognosys ökade både interna projekt och dess sekvenseringstjänster, blev det klart att ett gediget system för säkerhetskopiering och återställning behövdes. Egna programvaruprodukter för säkerhetskopiering och återställning och även Zmandas programvara med öppen källkod undersöktes för säkerhetskopiering av både oföränderliga rå sekvenseringsdata och dynamiska data härledda från beräkningsanalys.

De avgörande faktorerna för att välja Zmandas Amanda Enterprise Backup Server-programvara och Solaris Client ingår: pris (Amanda Enterprise Backup Server är 80 procent lägre än egen programvara); förmågan att kryptera data på klienten eller servern; tillgänglighet av öppen källkod; och löftet om kundsupport.

”Vi komprimerar data till cirka 70 procent innan de skrivs på band. Om något händer med Zmanda-programvaran på vägen och vi inte kan använda den, kan vi använda vanlig gzip för att packa upp data, säger Thompson. ”Zmanda installerade programvaran på distans på reservservern och lagringsservern, testade den och såg till att vi var bekväma med produkten. Interaktionen vi hade med dem för priset var oslagbar. ”

Under installationen hjälpte Zmandas tekniker Prognosys att lösa några nätverksutmaningar förutom att göra det möjligt för företaget att säkerhetskopiera rådata uppsättningar mer effektivt. Zmandas tekniker hjälpte Prognosys att öka bandbredden mellan reservservern och lagringsservern så att Prognosys mer effektivt kunde utnyttja kraften i sina smarta schemaläggningsfunktioner, vilket håller nättrafiken låg medan maskiner samlar in data.

"Den statiska säkerhetskopian av rådata var ny för Zmanda", säger Thompson. ”De skrev ett manus för att automatisera säkerhetskopieringen och var inte bara kunniga i vad de var vana vid att göra. Zmandas ingenjörer gjorde allt för att utveckla en lösning som fungerade för oss. ”

Zmanda tämjer statiska och dynamiska data

Prognosys Biosciences-nätverket består av Linux-, Solaris- och Mac OS X-servrar och klienter. Vetenskapliga instrument ansluter till Windows-klienter.

Beräkning sker på en Linux-server som analyserar data från Illumina Genome Analyzer II och anpassar sekvensdata mot mänskliga och andra genom. Genome Analyzer II genererar 50 miljoner 36-basläsningar per körning.

En Dell PowerEdge 2950 fungerar som reservserver. 2950 har fyrkärniga Xeon-processorer, 1.5 TB kapacitet och Red Hat Enterprise Linux 5. Den ansluts till en Sun Fire X4500 RAID-lagringsserver som kör Solaris, som säkerhetskopierar data dagligen och dumpar den när den är full till ett Dell PowerVault ML600-tejp bibliotek.

Dell-biblioteket har 36 platser för 800 GB LTO-band. Dynamisk data fyller i fyra band som återvinns i en fyra veckors rotation. Andra band är avsedda för säkerhetskopiering av rådata. Efter att Prognosys avslutat en körning med Illumina Genome Analyzer II, skriver den informationen på band. Säkerhetskopieringsband skickas till säker lagring utanför webbplatsen.

Den genomsnittliga säkerhetskopieringsstorleken per vecka för rå datamängder är en terabyte och den genomsnittliga dagliga säkerhetskopieringsstorleken för dynamisk data är cirka 500 GB. Den genomsnittliga tiden för fullständig säkerhetskopiering varje vecka till band är sju timmar. Inkrementella säkerhetskopior av dynamisk data till disk i genomsnitt 2.5 timmar.

Prognosys Biosciences utnyttjar Zmanda för sinnesfrid

Sedan implementeringen av Zmandas programvara har Prognosys kunnat skala upp verksamheten utan att riskera dataförlust. Amanda Enterprise-lösningen gör att Prognosys kan växa sin miljö och fortsätta lägga till kunder efter behov. Inom en snar framtid planerar Prognosys att lägga till mer beräkningskapacitet och eventuellt fler lagringsservrar.

Prognosys har säkerhetskopierat cirka 20 TB sedan implementeringen. Thompson har också testat restaureringen. När data har dumpats på bandet väljs en återställningsflik i Amanda Enterprise. Amanda Enterprise har en databas som innehåller information om alla kataloger och filer som har säkerhetskopierats. Användaren begär återställning från en viss tidsperiod och Amanda Enterprise berättar för användaren vilken tejp som ska laddas. Serverbelastningen har förbättrats liksom bandbredden mellan servern och klienten.

"En annan sak som vi verkligen gillar med Zmanda backup-programvara är att det är en webbapplikation", säger Thompson. "Vi kan övervaka säkerhetskopieringsförloppet från vilken maskin som helst i nätverket."

Dessutom tillåter webbapplikationsgränssnittet att säkerhetskopior administreras av icke-teknisk personal. Detta är ett plus för företag utan dedikerade lagringsadministratörer.

För företag som behandlar stora mängder data, robust och pålitlig säkerhetskopiering och återställning krävs för att lyckas. Företag från ett stort antal vertikala marknader skyddar framgångsrikt sina datatillgångar med en smidig öppen källkodslösning snarare än överkonstruerad, dyr egenutvecklad programvara.

Fler framgångshistorier