История успеха - Prognosys Biosciences

prognosys баннер

Zmanda защищает биотехнологические данные

Колоссальные объемы молекулярных данных являются критически важным инвентарем для Prognosys Biosciences, биотехнологической компании, базирующейся в Ла-Хойя, Калифорния. Данные, которые собираются с помощью секвенсоров ДНК, находятся на сервере хранения RAID, который имеет около 20 ТБ полезного пространства для хранения.

Логотип Prognosys Biosciences | Зманда

«Данные критически важны для компании, и их необходимо защитить от сбоев оборудования и других рисков», - говорит д-р Майк Томпсон, доктор философии, Prognosys.

В геноме человека три миллиарда пар оснований. Последовательность основ определяет различия между людьми, и информация об этих различиях используется для улучшения медицины и понимания эффекта конкретных лекарств. Prognosys использует секвенсор под названием Illumina Genome Analyzer II, который генерирует результаты для открытий в области геномики, эпигеномики, анализа экспрессии генов и взаимодействия белков с нуклеиновой кислотой. Каждый запуск прибора для секвенирования приводит к получению почти терабайта данных. После сбора необработанные данные не меняются. Динамические данные являются результатом вычислений, выполненных с необработанными данными.

Резервное копирование с открытым исходным кодом перемещается

Недавно, когда Prognosys активизировал как внутренние проекты, так и работу служб секвенирования, стало ясно, что необходима надежная система резервного копирования и восстановления. Запатентованные программные продукты для резервного копирования и восстановления, а также программное обеспечение с открытым исходным кодом Zmanda были исследованы для резервного копирования как неизменных необработанных данных секвенирования, так и динамических данных, полученных в результате вычислительного анализа.

Решающие факторы при выборе Zmanda's Аманда Энтерпрайз Программное обеспечение Backup Server и Solaris Client включены: цена (Amanda Enterprise Backup Server на 80 процентов дешевле проприетарного программного обеспечения); возможность шифрования данных на клиенте или сервере; доступность открытого исходного кода; и обещание поддержки клиентов.

«Мы сжимаем данные примерно на 70 процентов, прежде чем они будут записаны на ленту. Если что-то случится с программным обеспечением Zmanda в будущем и мы не сможем его использовать, мы можем использовать обычный gzip для распаковки данных », - говорит Томпсон. «Zmanda удаленно установила программное обеспечение на сервер резервного копирования и сервер хранения, протестировала его и убедилась, что мы довольны продуктом. Взаимодействие, которое у нас было с ними по цене, было непревзойденным ».

Во время установки технические специалисты Zmanda помогли Prognosys преодолеть некоторые сетевые проблемы, а также позволили компании более эффективно выполнять резервное копирование наборов необработанных данных. Технический специалист Zmanda помог Prognosys увеличить пропускную способность между сервером резервного копирования и сервером хранения, чтобы Prognosys мог более эффективно использовать мощь своих возможностей интеллектуального планирования, которые снижают сетевой трафик во время сбора данных машинами.

«Статическое резервное копирование наборов необработанных данных было новым для Zmanda, - говорит Томпсон. «Они написали сценарий для автоматизации резервного копирования и были не только осведомлены о том, что привыкли делать. Инженеры Zmanda изо всех сил старались разработать решение, которое сработало для нас ».

Zmanda укрощает статические и динамические данные

Сеть Prognosys Biosciences состоит из серверов и клиентов Linux, Solaris и Mac OS X. Научные инструменты подключаются к клиентам Windows.

Вычисления происходят на сервере Linux, который анализирует данные анализатора генома Illumina Genome Analyzer II и сравнивает данные последовательностей с геномами человека и других геномов. Genome Analyzer II генерирует 50 миллионов считываний по 36 оснований за цикл.

Dell PowerEdge 2950 служит сервером резервного копирования. Модель 2950 оснащена четырехъядерными процессорами Xeon емкостью 1.5 ТБ и Red Hat Enterprise Linux 5. Он подключается к серверу хранения RAID Sun Fire X4500 под управлением Solaris, который ежедневно выполняет резервное копирование данных и выгружает их при заполнении на ленту Dell PowerVault ML600. библиотека.

В библиотеке Dell имеется 36 слотов для лент LTO емкостью 800 ГБ. Динамические данные заполняют четыре ленты, которые повторно используются с четырехнедельной ротацией. Другие ленты предназначены для резервного копирования необработанных данных. После того, как Prognosys завершает запуск с помощью анализатора генома Illumina Genome Analyzer II, он записывает данные на ленты. Ленты с резервными копиями отправляются во внешнее безопасное хранилище.

Средний размер еженедельной резервной копии для необработанных наборов данных составляет один терабайт, а средний ежедневный размер резервной копии для динамических данных составляет около 500 ГБ. Среднее время еженедельного полного резервного копирования на ленту составляет семь часов. Инкрементное резервное копирование динамических данных на диск в среднем 2.5 часа.

Prognosys Biosciences использует Zmanda для душевного спокойствия

С момента внедрения программного обеспечения Zmanda Prognosys смог масштабировать операции без риска потери данных. Решение Amanda Enterprise позволяет Prognosys расширять свою среду и продолжать добавлять клиентов по мере необходимости. В ближайшем будущем Prognosys планирует добавить больше вычислительных мощностей и, возможно, больше серверов хранения.

Prognosys зарезервировал около 20 ТБ с момента внедрения. Томпсон также протестировал реставрацию. После того, как данные выгружены на ленту, в Amanda Enterprise выбирается вкладка восстановления. Amanda Enterprise содержит базу данных, содержащую информацию обо всех каталогах и файлах, для которых были созданы резервные копии. Пользователь запрашивает восстановление в определенный период времени, и Amanda Enterprise сообщает пользователю, какую ленту загружать. Увеличилась нагрузка на сервер и увеличилась пропускная способность между сервером и клиентом.

«Еще одна вещь, которая нам действительно нравится в программе резервного копирования Zmanda, - это то, что это веб-приложение, - говорит Томпсон. «Мы можем отслеживать ход резервного копирования с любой машины в сети».

Кроме того, интерфейс веб-приложения позволяет администрировать резервное копирование нетехническому персоналу. Это плюс для компаний, у которых нет выделенных администраторов хранилища.

Для компаний, которые обрабатывают большие объемы данных, надежное и надежное резервное копирование и восстановление необходимы для успеха. Компании из самых разных вертикальных рынков успешно защищают свои информационные ресурсы с помощью гибкого решения с открытым исходным кодом, а не чрезмерно дорогостоящего проприетарного программного обеспечения.

Еще истории успеха