성공 사례 – Prognosys Biosciences

prognosys 배너

Zmanda는 생명 공학 데이터를 보호합니다

엄청난 양의 분자 데이터는 캘리포니아 주 라호야에 본사를 둔 생명 공학 회사 인 Prognosys Biosciences의 중요한 인벤토리입니다. DNA 시퀀서에서 수집 된 데이터는 약 20TB의 사용 가능한 스토리지 공간이있는 RAID 스토리지 서버에 상주합니다.

Prognosys Biosciences 로고 | 즈 만다

Prognosys의 Mike Thompson 박사는“데이터는 회사에 매우 중요하며 장비 고장 및 기타 위험으로부터 보호해야합니다.

인간 게놈에는 XNUMX 억 개의 염기쌍이 있습니다. 염기의 순서는 사람 간의 차이를 결정하며 이러한 차이에 대한 정보는 약물을 개선하고 특정 약물의 효과를 이해하는 데 사용됩니다. Prognosys는 Illumina Genome Analyzer II라는 시퀀서를 사용하여 유전체학, 후성 유전체학, 유전자 발현 분석 및 단백질-핵산 상호 작용에서 발견 된 결과를 생성합니다. 시퀀싱 기기를 실행할 때마다 거의 XNUMX 테라 바이트의 데이터가 생성됩니다. 수집 된 원시 데이터는 변경되지 않습니다. 동적 데이터는 원시 데이터에 대해 수행 된 계산의 결과입니다.

오픈 소스 백업 이동

최근 Prognosys가 내부 프로젝트와 시퀀싱 서비스 운영을 모두 늘리면서 견고한 백업 및 복구 시스템이 필요하다는 것이 분명해졌습니다. 독점 백업 및 복구 소프트웨어 제품과 Zmanda의 오픈 소스 소프트웨어는 변하지 않는 원시 시퀀싱 데이터와 계산 분석에서 파생 된 동적 데이터의 백업을 위해 연구되었습니다.

Zmanda를 선택하는 결정 요인 아만다 엔터프라이즈 Backup Server 소프트웨어 및 Solaris Client 포함 : 가격 (Amanda Enterprise Backup Server는 독점 소프트웨어보다 80 % 저렴함) 클라이언트 또는 서버에서 데이터를 암호화하는 기능; 오픈 소스 코드의 접근성; 그리고 고객 지원의 약속.

“테이프에 기록되기 전에 데이터를 약 70 % 압축합니다. Zmanda 소프트웨어에 문제가 발생하여 사용할 수없는 경우 일반 gzip을 사용하여 데이터의 압축을 풀 수 있습니다.”라고 Thompson은 말합니다. “Zmanda는 백업 서버와 스토리지 서버에 원격으로 소프트웨어를 설치하고 테스트 한 후 제품에 만족하는지 확인했습니다. 가격에 대해 그들과의 상호 작용은 타의 추종을 불허했습니다.”

설치하는 동안 Zmanda의 기술자는 Prognosys가 원시 데이터 세트를보다 효율적으로 백업 할 수있을뿐만 아니라 몇 가지 네트워크 문제를 극복하도록 도왔습니다. Zmanda 기술자는 Prognosys가 백업 서버와 스토리지 서버 사이의 대역폭을 증가시켜 Prognosys가 스마트 스케줄링 기능의 힘을보다 효과적으로 활용할 수 있도록 지원하여 시스템이 데이터를 수집하는 동안 네트워크 트래픽을 낮게 유지합니다.

Thompson은“원시 데이터 세트의 정적 백업은 Zmanda에 새로운 것이 었습니다. “백업을 자동화하는 스크립트를 작성했으며 익숙한 작업에 대해 잘 알고있었습니다. Zmanda의 엔지니어들은 우리에게 적합한 솔루션을 개발하기 위해 노력했습니다. "

Zmanda는 정적 및 동적 데이터를 길들입니다.

Prognosys Biosciences 네트워크는 Linux, Solaris 및 Mac OS X 서버와 클라이언트로 구성됩니다. 과학 기기는 Windows 클라이언트에 연결됩니다.

컴퓨팅은 Illumina Genome Analyzer II의 데이터를 분석하고 인간 및 기타 게놈에 대해 서열 데이터를 정렬하는 Linux 서버에서 발생합니다. Genome Analyzer II는 실행 당 50 천만 개의 36-base 읽기를 생성합니다.

Dell PowerEdge 2950은 백업 서버 역할을합니다. 2950에는 쿼드 코어 Xeon 프로세서, 1.5TB 용량 및 Red Hat Enterprise Linux 5가 있습니다. Solaris를 실행하는 Sun Fire X4500 RAID 스토리지 서버에 연결하여 매일 데이터를 백업하고 가득 차면 Dell PowerVault ML600 테이프에 덤프합니다. 도서관.

Dell 라이브러리에는 36GB LTO 테이프 용 슬롯이 800 개 있습니다. 동적 데이터는 XNUMX 주 순환으로 재활용되는 XNUMX 개의 테이프를 채 웁니다. 다른 테이프는 원시 데이터 백업 전용입니다. Prognosys가 Illumina Genome Analyzer II로 실행을 마치면 데이터를 테이프에 씁니다. 백업 테이프는 오프 사이트 보안 스토리지로 전송됩니다.

원시 데이터 세트의 평균 주간 백업 크기는 500 테라 바이트이고 동적 데이터의 평균 일일 백업 크기는 약 2.5GB입니다. 테이프에 대한 매주 전체 백업의 평균 시간은 XNUMX 시간입니다. 동적 데이터를 디스크에 증분 백업하는 데 평균 XNUMX 시간이 걸립니다.

Prognosys Biosciences는 Zmanda를 활용하여 안심할 수 있습니다.

Zmanda의 소프트웨어를 구현 한 이후 Prognosys는 데이터 손실 위험없이 운영을 확장 할 수있었습니다. Amanda Enterprise 솔루션을 통해 Prognosys는 환경을 확장하고 필요에 따라 클라이언트를 계속 추가 할 수 있습니다. 가까운 장래에 Prognosys는 더 많은 컴퓨팅 용량과 가능한 더 많은 스토리지 서버를 추가 할 계획입니다.

Prognosys는 구현 이후 약 20TB를 백업했습니다. Thompson은 또한 복원을 테스트했습니다. 데이터가 테이프에 덤프되면 Amanda Enterprise에서 복원 탭이 선택됩니다. Amanda Enterprise는 백업 된 모든 디렉토리와 파일에 대한 정보가 포함 된 데이터베이스를 보유하고 있습니다. 사용자는 특정 기간의 복원을 요청하고 Amanda Enterprise는 사용자에게로드 할 테이프를 알려줍니다. 서버와 클라이언트 간의 대역폭이 증가함에 따라 서버로드가 향상되었습니다.

"Zmanda 백업 소프트웨어에 대해 우리가 정말 좋아하는 또 다른 점은 웹 애플리케이션이라는 점입니다."라고 Thompson은 말합니다. "네트워크에있는 모든 시스템에서 백업 진행 상황을 모니터링 할 수 있습니다."

또한 웹 애플리케이션 인터페이스를 사용하면 비 기술 직원이 백업을 관리 할 수 ​​있습니다. 이는 전담 스토리지 관리자가없는 회사에 더할 수있는 이점입니다.

방대한 양의 데이터를 처리하는 회사의 경우 강력하고 신뢰할 수있는 백업 및 복구 성공을 위해 필요합니다. 다양한 수직 시장의 기업은 과도하게 엔지니어링되고 값 비싼 독점 소프트웨어가 아닌 민첩한 오픈 소스 솔루션으로 데이터 자산을 성공적으로 보호하고 있습니다.

더 많은 성공 사례