Понимание блочного хранилища и объектного хранилища

Понимание объектного хранилища и блочного хранилища

Блочное хранилище или объектное хранилище, что лучше всего подходит для современных сред хранения данных?

Этот вопрос, вероятно, заставил почесать голову даже самых опытных администраторов ИТ-хранилищ. Причина? Когда для корпоративных хранилищ данных выбираются Блочное, Файловое хранилище и Объектное хранилище, часто возникают споры между блочным хранилищем и хранилищем объектов. Во всем виноваты масштабные данные, которые делают будущее хранение данных серьезной проблемой. Обработка данных, их хранение и доступ к ним на основе вариантов использования - представьте, насколько сложным является развертывание каждого типа архитектуры!

В этой статье мы обсудим блочное и объектное хранилище, методы доступа и варианты их использования. Опять же, у каждого есть свои возможности и ограничения. В этой статье давайте углубимся, чтобы понять, как они лучше всего подходят для бизнеса, почему они не всегда могут быть лучшим выбором.

Готовы окунуться? Давайте исследуем.

Хранение объектов

TПроще говоря, объектное хранилище - это архитектура хранилища данных, которая позволяет хранить отдельные блоки данных или объекты в виде изолированных контейнеров. Поскольку объектное хранилище имеет плоскую адресную структуру, вы можете хранить каждый объект с равным доступом в нескольких сетевых системах. Самым большим преимуществом использования такого хранилища является то, что вы можете найти объект, даже не зная физического местоположения данных. Благодаря набору атрибутов, которые объектное хранилище приносит в таблицу. Эти:

  1. Данные. Это может быть все, что вы хотите сохранить, от семейного фото, музыки, видео, файла ручного документа на 5,00000 XNUMX XNUMX страниц до любых неструктурированных данных.
  2. Соответствующие метаданные который описывает данные (включая такие детали, как возраст, конфиденциальность, непредвиденные обстоятельства доступа); а также
  3. Пользовательский идентификатор который содержит уникальный идентификационный адрес, позволяющий ОС определять его местонахождение в распределенной системе.

Методы доступа

Важно понимать, что хранилище объектов использует API-интерфейсы для доступа к объектам, которые полагаются на API-интерфейсы передачи репрезентативного состояния (RESTful). В результате, если вы хотите получить заархивированный файл быстрее, вы можете легко отправить запрос API в облачное хранилище блоков, чтобы найти нужный объект. Это делает объектно-ориентированное хранилище отличным выбором для рабочих нагрузок общедоступного облака. Кроме того, вы можете распределять объекты по нескольким географическим точкам, перемещая объекты по разным уровням.

Интересно, что объектное хранилище позволяет вам классифицировать / упорядочивать файлы с информацией о файлах и индексировать их для извлечения данных в любое время. Однако вы можете получить доступ к этим данным, подключив том диска через сервер ОС, совместимый с объектным устройством. Например, AWS, лидер рынка облачных технологий, предоставляет Amazon S3 это предложение для хранения объектов.

Use cases

Хранение неструктурированных данных

Поскольку объектное хранилище не имеет иерархии, оно идеально подходит для хранения таких данных, как мультимедийный контент, файлы, папки, архивы и статический веб-контент, распределенный по географическим точкам.

Разработка облачных приложений

Хранилище объектов облегчает доступность приложений за счет распределения сетей. В результате вы можете легко создавать и разрабатывать собственные системные приложения. Кроме того, вы можете легко хранить, помечать и анализировать данные для анализа больших данных.

Архивное хранилище

С помощью объектного хранилища вы можете добавлять узлы хранения для масштабирования часто обновляемых неструктурированных данных. Это позволяет архивировать файлы, сохраняя при этом мгновенный доступ.

Резервное копирование файлов

Вы можете использовать объектное хранилище для резервного копирования файлов, файлов журналов и дампов баз данных.

Данные могут быть прочитаны / записаны несколько раз

В объектном хранилище данные, записанные один раз, могут быть прочитаны несколькими устройствами. Это очень хорошо работает для глобально распределенных мультимедийных хранилищ, поскольку несколько клиентов могут получать доступ и читать / записывать данные в любом месте.

Оптимизирован для статических данных

После того, как данные записаны, их можно читать много раз. Отныне вы можете управлять большими объемами статических и неструктурированных данных с помощью объектного хранилища. Например, вы можете хранить изображения, видеофайлы, музыку или записи транзакций как объекты.

Почему объектное хранилище для бизнеса?

Что касается разницы между блочным хранилищем и объектным хранилищем, первое является предпочтительным вариантом для хранения неструктурированных данных. Действительно, неструктурированные данные сложно организовать, управлять и искать. Именно здесь объектное хранилище имеет смысл для извлечения информации из хранилища большого объема с использованием метаданных.

Ниже приведены причины выбора технология хранения объектов для ваших нужд хранения:

Возможность поиска:

Метаданные, находящиеся в самих объектах, обеспечивают расширенные результаты поиска. Например, вы можете искать определенный тип файла, который соответствует определенным критериям. Кроме того, вы можете легко создавать собственные метаданные и добавлять атрибуты с течением времени без необходимости создавать базы данных для связывания метаданных с объектами.

Неограниченная масштабируемость:

Объектное хранилище позволяет хранить огромный объем данных, добавляя несколько узлов для использования пространства хранения. Следовательно, вы можете обеспечить масштабируемость по требованию, смешивая и сопоставляя серверы с высокой плотностью размещения. Это обеспечивает высокую доступность данных, поскольку несколько копий одних и тех же объектов рассредоточены по множеству узлов.

Аналитика больших данных:

Чтобы воспользоваться преимуществами аналитики больших данных, положитесь на хранилище объектов. Это потому, что каждый отдельный объект помечен метаданными, которые обеспечивают релевантность, добавляя дополнительный контекст к базовым данным. Следовательно, вы можете извлечь полезную информацию из больших данных, чего нельзя ожидать от традиционных блоков.

Распределенное хранилище по географическим регионам:

Вы можете воспользоваться функцией распределенного доступа в хранилище данных большого размера в несколько петабайт! Благодаря расширяемым метаданным и географической гибкости хранилища объектов. С помощью глобального пространства имен с возможностью поиска по ключевым словам вы можете легко находить, переносить и защищать данные. Другой ключевой момент заключается в том, что благодаря распределению рабочей нагрузки вы можете развертывать мощные функции на серверах. Это не только оптимизирует емкость, стоимость и доступность, но и отвечает требованиям соответствия, тем самым помогая вам достичь бизнес-целей.

Отвечает большим потребностям в хранении данных:

Вы можете хранить большие файлы, данные клиентов и неструктурированные корпоративные данные в пуле хранения. Он может масштабировать сотни петабайт данных. Это устраняет ограничения масштабирования из-за плоских пространств имен - очень привлекательный вариант для предприятий.

Разработка приложений с использованием протокола HTTP (s):

Поскольку объектное хранилище поддерживает доступ по протоколу HTTP (s), вы можете легко интегрировать его в свои приложения, поскольку все запросы выполняются через API HTTP (s). Итак, теперь вы можете создавать, разрабатывать, развертывать облачные приложения для мобильных, адаптивных и даже традиционных приложений.

Почему объектное хранилище не всегда лучший выбор?

Чтобы понять, что блочное хранилище отличается от хранилища объектов, вы должны оценить случаи, в которых хранилище объектов не подходит. Ну вот.

  • С помощью объектного хранилища вы не можете изменять файлы, поскольку объекты предназначены для чтения / записи или перезаписи файлов целиком, а не их части. Если вы загружаете новую версию всего файла, это влияет на производительность ввода-вывода. Отныне это плохой выбор для операций с базой данных.
  • Хранилище объектов не гарантирует, что вы получите последнюю версию файла по запросу на чтение. Это связано с тем, что обновления, распространяемые по всем местам, не являются последними или (в конечном итоге согласованными) всегда, поскольку данные не изменяются постоянно.
  • Для организаций, которые отдают предпочтение производительности хранилища, объектное хранилище обеспечивает медленную производительность операций ввода-вывода для рабочих нагрузок в хранилище. Во всем виновата объектная архитектура, которая требует анализа метаданных. Поскольку данные объединяются с настраиваемыми метатегами, это снижает производительность приложений и рабочих процессов.

Блок хранения

Блочное хранилище (также известное как хранилище на уровне блоков) - это простейшая форма технологии хранения данных, используемая для хранения структурированных данных, таких как базы данных, приложения и т. Д. Поскольку хранилище развертывается в Системы хранения данных (SAN), вы можете хранить сложные файлы и приложения с более высокой производительностью. Благодаря структурированным рабочим нагрузкам, которые позволяют быстрее получать доступ к данным. Однако он поддерживает локальное хранилище и приложения.

В технологии блочного хранения вы можете разделить каждый блок на блоки равного размера, которые работают как отдельные жесткие диски в ПК. Здесь блоки контролируются внешней серверной ОС, которая позволяет вам получать доступ к этим дискам хранения. Это обеспечивает большую гибкость для хранения любых приложений, включая файлы, базы данных, тома виртуальных машин и т. Д. Более того, вы можете предоставить общий доступ к файлам хранилища или сделать резервную копию данных, размещенных в хранилище блоков, с помощью поддерживаемых сторонних инструментов. Например, AWS - это Магазин эластичных блоков Amazon (EBS) - это служба постоянного блочного хранилища, разработанная для Amazon Elastic Cloud Compute (EC2).

Методы доступа

Если вы беспокоитесь о восстановлении высокопроизводительных рабочих нагрузок, у блочного хранилища есть ответ. Доступ к данным на уровне блоков упрощается за счет использования высокопроизводительных протоколов, таких как Fibre Channel и Internet Small Computer Systems Interface (SCSI), которые ускоряют доступ к данным.

Интересно, что каждый блок имеет свой уникальный идентификационный адрес, который позволяет вам быстро получить доступ к определенным данным, выполнить поиск или извлечь данные блока. Поскольку ОС может напрямую читать / записывать / перезаписывать блоки по мере необходимости, вы можете легко настраивать, управлять и организовывать данные в виде (структуры) файловой системы или структуры для конкретного приложения.

Так что теперь вы можете легко восстанавливать приложения с интенсивным использованием данных, сокращая при этом накладные расходы на программное обеспечение. Кроме того, вы можете легко изменить блоки для доступа к специально необходимым блокам, сохраняя при этом старую версию без изменений.

Случаи использования

Создайте необработанный объем хранилища для любого приложения

С помощью блочного хранилища вы можете создавать отдельные жесткие диски для любого приложения, такого как база данных, файлы, файловая система виртуальных машин и т. Д.

RAID-массивы

Вы можете использовать блочные системы хранения в качестве томов RAID (* RAID - это технология хранения для виртуализации данных), которые усиливают защиту данных. Это делается путем настройки отдельных дисков в RAID-массивы.

Согласованные операции ввода-вывода

Вы можете использовать блочное хранилище для приложений, ориентированных на базы данных, которым требуются операции ввода-вывода с очень малой задержкой и согласованные операции хранения (ввод-вывод или чтение / запись).

Почтовые серверы

Поскольку блочное хранилище позволяет увеличить емкость, вы можете использовать блочное хранилище для обработки почтовых серверов, таких как Microsoft Exchange.

Серверы VMware

Используя хранилище на уровне блоков, вы можете развернуть серверы VMware для хранения томов файловых систем виртуальных машин (VMFS).

Загрузка

Вы можете использовать архитектуру блочного хранилища для загрузки операционной системы или внешнего сервера непосредственно из блочного хранилища.

Зачем блокировать хранилище для бизнеса?

Почему блочное хранилище имеет смысл для ИТ-среды?

Ниже приведены причины, по которым блокировка является популярным средством хранения:

Гибкость

Вы можете отформатировать хранилище на уровне блоков, чтобы принять любую используемую файловую систему. Например, серверы VMware будут использовать VMFS; для Windows NTFS является основным форматом.

Трансформируемость

Блочное хранилище обеспечивает быструю настройку для обновления емкости хранилища. Вы можете добавлять тома хранилища или перемещать хранилище между серверами без ущерба для производительности.

Быстрая производительность ввода / вывода данных

Механизмы блочного хранения поддерживают базовые файловые протоколы (NFS, CIFS, ext3 / ext4 и другие) для быстрого доступа к данным ввода-вывода и малой задержки для высокопроизводительных приложений. Таким образом, вы можете выполнять высокоактивные операции ввода-вывода, такие как кэширование, операции с базой данных, файлы журналов и т. Д.

Добавить емкость хранилища

Вы можете легко перейти на хранилище со стандартной скоростью, добавив для клиентов высокопроизводительное хранилище.

Платите по мере использования

Вам просто нужно заплатить за выделенное пространство для хранения блоков. Это означает, что вы можете легко подключить / отсоединить или повторно подключить том блочного хранилища, что снизит ваши расходы.

Масштабируемость

Поскольку том блочного хранилища работает независимо с отдельными блоками данных, вы можете создавать дополнительные блочные тома для горизонтального масштабирования. Производительность масштабируется в зависимости от размера диска или ограничения экземпляров виртуальных машин. Хорошая новость заключается в том, что вам не нужно платить за дополнительные вычислительные возможности.

Простое и понятное управление

Вы можете легко управлять доступом и правами управления в качестве хоста в операционной системе или блокировать тома хранения, напрямую управляя разрешениями на данные.

Почему блочное хранилище - не лучший выбор?

Блочное хранилище может быть не лучшей альтернативой для некоторых случаев. Вот почему.

  • Поскольку архитектура блочного хранилища не имеет метаданных, она имеет ограниченные возможности для анализа данных. Итак, если вы хотите хранить метаданные отдельно, вам понадобится дополнительная база данных. Это ограничивает доступ клиента к определенным файлам с других серверов одновременно.
  • В отличие от многоуровневого ценообразования, ценообразование для всего объема блочного хранилища является предварительно определенным. То есть, чтобы получить доступ к одному фрагменту данных, вам необходимо заплатить за все пространство хранения блоков, которое включает объем хранимых данных, типы выполняемых операций и стоимость передачи данных. В самом деле, это делает оптимизацию емкости хранилища для повышения производительности довольно дорогостоящей.
  • В блочном хранилище распределение файлов является сложным, поскольку каждая единица данных разделяется и хранится отдельно. В результате вы можете столкнуться со значительными потерями вычислительных экземпляров затрат на инфраструктуру. Кроме того, это также может привести к неэффективному использованию ресурсов.
  • Среда SAN блочного хранилища требует дорогостоящего оборудования для хранения данных, что делает его более дорогим для удовлетворения потребностей в хранении.

Взгляните на сравнительную таблицу, которая суммирует разницу между хранилищем блоков и хранилищем объектов.

Хранение объектов
Блок хранения
Данные хранятся в виде объектов в масштабируемых сегментах. Данные хранятся в виде блоков фиксированного размера.
Можно бесконечно масштабировать до петабайт и выше. Ограниченная масштабируемость с блоками фиксированного размера в соответствии с требованиями.
Имея больше контекста для данных (метаданных), вы можете легко организовывать, находить или извлекать данные. Нет метаданных.
Неструктурированные данные можно эффективно хранить в нескольких географических точках. Чем больше расстояние между хранилищами, тем выше задержка.
Лучшая производительность для неструктурированного контента и высокая пропускная способность потока. Лучшая производительность для реляционной базы данных и транзакционных данных.
Возможность подключения к API на основе HTTP (S). Доступно через Fibre Channel и Internet Small Computer Systems Interface (iSCSI).
Неограниченная емкость хранилища файлов. Можно добавлять узлы для увеличения емкости.
Лучше всего подходит для статических файлов и приложений, таких как резервные копии данных, статический контент, архивные изображения, богатый мультимедийный контент (видео, изображения или музыка). Идеально подходит для таких приложений, как корпоративные базы данных и транзакционные данные, которым требуется высокий IOPS и низкая задержка.

Теперь, когда вы знаете, как одно хранилище обгоняет другое, можно с уверенностью сказать, что объектно-ориентированное хранилище больше подходит для ИТ-среды хранения. Но какой бы вариант хранения вам ни нравился, вы, скорее всего, будете хранить свои данные для долгосрочного архивирования. Это справедливо для данных, которые используются реже или вообще не используются, но занимают ценное место для хранения.

Какой бы ни была система хранения, плохо управляемая система хранения может поставить под угрозу весь ваш бизнес. Вам нужна надежная архитектура резервного копирования и хранения, которая обеспечит легкий доступ или восстановление полного набора данных. Здесь может помочь Зманда.

Эффективное резервное копирование и восстановление хранилища с Zmanda

Имея это в виду, Zmanda был разработан для комплексного хранения, резервного копирования и восстановления объектных и блочных хранилищ. С помощью Zmanda вы можете легко реплицировать данные из резервных копий в любое удаленное место по вашему выбору. В настоящее время механизм резервного копирования Zmanda поддерживает следующие типы хранилищ объектов для долгосрочного хранения данных:

Попробуйте их! Или, если вы все еще разрываетесь между архитектурными подходами в качестве идеального масштабируемого решения для хранения данных, у нас есть гибридное / конвергентное решение, отвечающее вашим потребностям. Свяжитесь с нами вместе с нами, чтобы понять, как мы используем каждое решение при значительном снижении совокупной стоимости владения (TCO).


Исследуйте другие темы