Blog

Zrozumienie pamięci obiektowej a pamięci blokowej

Blok, Przechowywanie plików lub Obiekt — Który podstawowy system pamięci masowej jest odpowiedni dla dzisiejszych środowisk przechowywania danych?

To prawdopodobnie odeszło nawet najbardziej doświadczeni administratorzy pamięci masowej IT drapać się po głowach.

Powód? Wybór technologii przechowywania danych w przedsiębiorstwie, takich jak blokowa, plikowa i obiektowa, często powoduje konflikt między pamięcią obiektową a pamięcią blokową. Zrzuć winę na dane na dużą skalę, co sprawi, że przyszłe przechowywanie danych będzie ogromnym wyzwaniem. Poza tym przetwarzanie danych, przechowywanie ich i uzyskiwanie do nich dostępu w oparciu o przypadki użycia - wyobraź sobie złożoność, z jaką wiąże się wdrożenie każdego typu architektury!

Więc gdzie wybierasz przechowywanie swoich danych? Jaką wartość biznesową możesz z tego czerpać?

W tym artykule omówimy pamięć obiektową a pamięć blokową, metody dostępu obsługujące przechowywanie blokowe i obiektowe technologii, ich przypadków użycia, tego, jak dopasowują się do firm i dlaczego mogą nie zawsze być najlepszym wyborem. .

Jaka jest więc różnica między pamięcią blokową a pamięcią obiektową? Odkryjmy.

Przechowywanie obiektów

Obiektowa pamięć masowa, znana w skrócie jako obiektowa pamięć masowa, to architektura przechowywania danych, która wykorzystuje płaski model pamięci do przechowywania odrębnych jednostek danych lub obiektów w postaci izolowanych kontenerów. Te izolowane pojemniki są znane jako wiadra. Płaska struktura działa jak pojedyncze samodzielne repozytorium, w którym każdy obiekt jest przechowywany z równym dostępem w wielu systemach sieciowych. Najlepsze jest to, że możesz zlokalizować obiekt nawet bez znajomości fizycznej lokalizacji danych.

Dzieje się tak, ponieważ każdy przedmiot ma trzy ważne atrybuty:

  1. Dane. Może to być wszystko, co chcesz przechowywać, od zdjęć rodzinnych, muzyki, filmów, pliku ręcznego dokumentu liczącego 5,00000 XNUMX XNUMX stron po dowolne nieustrukturyzowane dane.

  2. Odpowiednie metadane opisujące dane (obejmują takie szczegóły, jak wiek, prywatność, ewentualność dostępu); i

  3. Niestandardowy identyfikator, który zawiera unikalny adres identyfikacyjny, który umożliwia systemowi operacyjnemu zlokalizowanie go w systemie rozproszonym.

Metody dostępu

Metoda dostępu jest techniczną zaletą dla administratorów pamięci masowej, która sprawia, że ​​technologia Object Storage jest aktywna. Na platformie Object Storage można uzyskać dostęp do obiektów za pośrednictwem interfejsów programowania aplikacji HTTP (API), które opierają się na interfejsach API Representational State Transfer (RESTful). Gdy chcesz pobrać plik, wysyła żądanie API do magazynu w chmurze, aby zlokalizować żądany obiekt. To sprawia, że ​​obiektowa pamięć masowa to doskonały wybór w przypadku obciążeń w chmurze publicznej. Ponadto możesz rozmieszczać obiekty w wielu lokalizacjach geograficznych. Dzięki temu możesz przenosić obiekty na różnych poziomach, a nawet w różnych lokalizacjach geograficznych.

Dobrą wiadomością jest to, że możesz zdefiniować metadane, co oznacza, że ​​dla każdej części danych możesz dodać identyfikatory, aby zbudować do nich więcej kontekstu. Znając informacje o metadanych obiektu, możesz je łatwo przeszukiwać. Poza tym możesz klasyfikować / organizować pliki z informacjami o pliku, łatwo je indeksować i uzyskiwać dostęp do pobierania danych w dowolnym momencie. A w przypadku analizy Big Data możliwości są nieograniczone!

Możesz jednak uzyskać bezpośredni dostęp do tych danych jako zamontowanego woluminu dysku za pośrednictwem serwera systemu operacyjnego, który jest zaznajomiony z urządzeniem obiektu. AWS, lider rynku chmury zapewnia Amazon S3 który jest ofertą obiektowej pamięci masowej.

Przypadków użycia

  • Dane nieustrukturyzowane- Ponieważ obiektowa pamięć masowa nie podlega hierarchii, idealnie nadaje się do przechowywania danych, takich jak treści multimedialne, pliki, foldery, archiwa i statyczna zawartość sieci Web rozproszona w różnych lokalizacjach geograficznych.

  • Tworzenie aplikacji w chmurze- Dostęp do pamięci obiektów można uzyskać za pośrednictwem interfejsu API HTTPS. Dzięki temu możesz tworzyć natywne aplikacje systemowe z danymi na dużą skalę, które można przechowywać, oznaczać i analizować na potrzeby analizy danych big data. .

  • Przechowywanie archiwalne- Dzięki obiektowej pamięci masowej można dodawać węzły magazynowania w celu skalowania często aktualizowanych danych nieustrukturyzowanych. Pozwala to na archiwizację plików przy jednoczesnym zachowaniu natychmiastowego dostępu.

  • Kopia zapasowa plików- Obiektowej pamięci masowej można używać do tworzenia kopii zapasowych plików, plików dzienników i zrzutów bazy danych.

  • Obiekty mogą być odczytywane wielokrotnie- Dane pamięci obiektowej są zapisywane raz, ale mogą być odczytywane przez wielu klientów. Działa bardzo dobrze w przypadku globalnie rozproszonego przechowywania multimediów, ponieważ wielu klientów może uzyskiwać dostęp do danych i odczytywać je we wszystkich lokalizacjach. .

  • Zoptymalizowany pod kątem danych statycznych- Możesz zarządzać dużymi ilościami danych statycznych i nieustrukturyzowanych dzięki obiektowej pamięci masowej. Na przykład. obrazy, pliki wideo, muzyka lub zapisy transakcyjne.

Dlaczego obiektowa pamięć masowa dla firm?

Jeśli chodzi o różnicę między pamięcią obiektową i blokową, ta pierwsza wygrywa jako realna opcja dla nieustrukturyzowanego przechowywania danych. Organizowanie, zarządzanie i przeszukiwanie lawiny nieuporządkowanych danych, która rośnie z dnia na dzień, jest skomplikowane. W tym właśnie miejscu obiektowe przechowywanie ma sens w wydobywaniu informacji o danych z pamięci masowej o dużej objętości i dystrybucji danych w różnych lokalizacjach geograficznych, co pomaga w opracowywaniu celów biznesowych. .

Poniżej powody wyboru technologia przechowywania obiektów w scenariuszu pamięci na poziomie bloków a pamięci na poziomie obiektu:

Możliwość wyszukiwania- Metadane znajdujące się w samych obiektach zasilają obszerne wyniki wyszukiwania. Np. możesz wyszukać określony typ pliku, który spełnia określone kryteria. Ponadto można łatwo tworzyć niestandardowe metadane i dodawać atrybuty w miarę upływu czasu bez konieczności tworzenia baz danych w celu powiązania metadanych z obiektami.

Nieograniczona skalowalność- Przechowywanie obiektów umożliwia skalowanie w poziomie poprzez dodawanie węzłów. Zapewnia to wysoką dostępność danych obiektowych, ponieważ wiele kopii tych samych obiektów jest rozproszonych w wielu węzłach. Dzięki temu możesz teraz wykorzystać więcej przestrzeni dyskowej, dodając węzły do ​​klastra i skalując system pamięci masowej w górę iw dół (dodawanie/usuwanie jednostek pamięci masowej) zgodnie z potrzebami przedsiębiorstwa.

Analiza dużych zbiorów danych- Aby skorzystać z analizy big data, wprowadź obiektową pamięć masową. Każdy pojedynczy obiekt jest oznaczony metadanymi, które obsługują trafność, jednocześnie dodając więcej kontekstu do danych źródłowych. Pozwala to na wyodrębnienie praktycznych spostrzeżeń z dużych zbiorów danych który nie można oczekiwać od tradycyjnych klocków.

Rozproszone przechowywanie w różnych lokalizacjach geograficznych- Możesz skorzystać z funkcji dostępu rozproszonego w wielko-petabajtowej pamięci masowej bigtime! Dzięki rozszerzalności metadanych i elastyczności geograficznej przechowywania obiektów. Dzięki globalnej przestrzeni nazw z możliwością wyszukiwania słów kluczowych nie tylko może lokalizujesz, migrujesz i chronisz dane, ale także równoważysz je między warstwami pamięci lokalnej i chmury. W przypadku firm optymalizuje to pojemność, koszty, dostępność i zgodność, pomagając im w ten sposób osiągnąć cele biznesowe.

Spełnia duże wymagania w zakresie przechowywania danych: W puli pamięci można przechowywać duże pliki, dane klientów i nieustrukturyzowane dane przedsiębiorstwa. Może skalować setki petabajtów danych. Eliminuje to ograniczenia skalowania wynikające z płaskich przestrzeni nazw - bardzo atrakcyjna opcja dla przedsiębiorstw.

Tworzenie aplikacji przy użyciu protokołu HTTP(s): Ponieważ obiektowa pamięć masowa obsługuje dostęp za pośrednictwem protokołu HTTP(s), można ją łatwo zintegrować ze swoimi aplikacjami, ponieważ wszystkie żądania są przesyłane za pośrednictwem interfejsu API HTTP(s). Teraz możesz tworzyć, rozwijać i wdrażać aplikacje natywne dla chmury do tworzenia aplikacji mobilnych, responsywnych, a nawet tradycyjnych.

Dlaczego obiektowa pamięć masowa nie zawsze jest najlepszym wyborem?

Aby zrozumieć pamięć obiektową w porównaniu z pamięcią blokową, należy ocenić przypadki, w których obiektowa pamięć masowa nie jest odpowiednia. Proszę bardzo.

  • W przypadku przechowywania obiektów nie można łatwo modyfikować plików, ponieważ obiekty są przeznaczone do odczytu/zapisu lub nadpisywania całych plików, a nie ich części. Jeśli przesyłasz nową wersję całego pliku, wpływa to na wydajność IO. Odtąd jest to zły wybór dla operacji na bazach danych.

  • Obiektowa pamięć masowa nie gwarantuje, że po żądaniu odczytu otrzymasz najnowszą wersję pliku. Dzieje się tak, ponieważ aktualizacje propagowane we wszystkich lokalizacjach nie są najnowsze lub (ostatecznie spójne) zawsze, ponieważ dane nie są stale zmieniane.

  • W przypadku organizacji, które na pierwszym miejscu stawiają wydajność pamięci masowej, obiektowa pamięć masowa zapewnia niską wydajność operacji we/wy dla obciążeń w całej pamięci masowej. Zrzuć to na architekturę obiektową, która wymaga analizy metadanych. Ponieważ dane są powiązane z dostosowanymi metatagami, spowalnia to działanie aplikacji i przepływów pracy.

Zablokuj pamięć

Przechowywanie blokowe (znane również jako przechowywanie na poziomie blokowym) to najprostsza forma technologii przechowywania danych używana do przechowywania danych strukturalnych, takich jak bazy danych, aplikacje itp. Jest powszechnie wdrażana w Systemy sieci pamięci masowej (SAN) lub środowiska pamięci masowej oparte na chmurze. Tak więc, kupując pamięć SAN/blok, ty uzyskaj szybką architekturę pamięci masowej, w której dane są przechowywane jako porcje o stałej wielkości, znane jako bloki.

W technologii blokowej pamięci masowej każdy blok jest podzielony na bloki o jednakowej wielkości, które działają jak osobne dyski twarde w komputerze. Tutaj bloki kontrolowany przez zewnętrzny system operacyjny serwera, który umożliwia dostęp do tych dysków. Przez to, zyskujesz elastyczność przechowywania dowolnego rodzaju aplikacji, w tym plików, baz danych, woluminów maszyn wirtualnych i innych. Najlepsze jest to, że możesz nawet udostępniać pliki pamięci masowej lub tworzyć kopie zapasowe danych umieszczonych w pamięci blokowej za pomocą obsługiwanych narzędzi innych firm lub natywnych narzędzi do tworzenia kopii zapasowych systemu operacyjnego. Dobry przykład przechowywania bloków AWS is Amazon Elastic Block Store (EBS) która jest usługą trwałej pamięci masowej zaprojektowaną dla Amazon Elastic Cloud Compute (EC2).

Metody dostępu

System operacyjny klienta kontroluje blok za pomocą protokołów o wysokiej wydajności, takich jak Fibre Channel i Internet Small Computer Systems Interface (iSCSI). Dzięki temu magazyn jest łatwo dostępny. Ponownie sieć SAN umieszcza te bloki w wielu pamięciach masowych węzły. To umożliwia dostęp do danych bloku pamięci szybciej, zwłaszcza gdy aplikacja jest lokalna.

Inną kluczową kwestią jest to, że każdy blok ma swój unikalny adres ID, który umożliwia wyszukiwanie określonego obiektu lub szybkie pobieranie danych bloku. Ponieważ system operacyjny może bezpośrednio odczytywać/zapisywać/ponownie zapisywać bloki w razie potrzeby, można łatwo konfigurować, zarządzać i organizować dane jako system plików (struktury) lub strukturę specyficzną dla aplikacji. Poza tym przechowywanie obiektowe opiera się na protokole systemu plików (NTFS, XFS lub ext4), co oznacza, że ​​można łatwo modyfikować bloki aby uzyskać dostęp do specjalnie wymaganych bloków, zachowując starszą wersję. W tym miejscu pamięć masowa oparta na blokach wygrywa z szybkością operacji we/wy.

Przypadków użycia

  • Twórz surowy wolumen pamięci dla dowolnej aplikacji- Dzięki blokowej pamięci masowej możesz tworzyć indywidualne dyski twarde dla dowolnej aplikacji, takiej jak baza danych, pliki, system plików maszyny wirtualnej i nie tylko.

  • macierze RAID- Można stosować blokowe systemy pamięci masowej jako woluminy RAID (*RAID to technologia pamięci masowej do wirtualizacji danych), które zwiększają ochronę danych. Odbywa się to poprzez konfigurację poszczególnych dysków w macierze RAID.

  • Spójne operacje we/wy- Magazynu blokowego można używać w przypadku aplikacji zorientowanych na bazę danych, które wymagają bardzo małych opóźnień i spójnych operacji we/wy pamięci masowej (wejście/wyjście lub odczyt/zapis).

  • Serwery e-mail- Obsługuje pamięć masową na poziomie bloku Microsoft Exchange dla poczty e-mail serwery, w przeciwieństwie do systemów przechowywania plików NAS.

  • Serwery VMware- Korzystając z pamięci masowej na poziomie bloków, możesz wdrożyć serwery VMware do przechowywania woluminów systemów plików VM (VMFS).

  • Rozruch- Możesz użyć architektury blokowej pamięci masowej, aby uruchomić system operacyjny lub serwer zewnętrzny bezpośrednio z pamięci blokowej.

Dlaczego warto blokować pamięć masową dla firm?

Więc dlaczego przechowywanie na poziomie bloków ma sens dla środowiska IT? Poniżej przedstawiamy kilka powodów, dla których jest to popularny wybór:

  • Wszechstronność- Możesz sformatować pamięć na poziomie bloków, aby zaakceptować dowolny użyteczny system plików. Np. serwery VMware będą korzystać z VMFS; dla systemu Windows NTFS jest formatem podstawowym.

  • Elastyczność- Przechowywanie blokowe umożliwia szybką konfigurację w celu aktualizacji pojemności pamięci. Możesz dodawać woluminy pamięci masowej lub przenosić pamięć masową między serwerami bez poświęcania wydajności.

  • Szybka wydajność danych we/wy- Mechanizmy blokowej pamięci masowej obsługują podstawowe protokoły plików (NFS, CIFS, ext3/ext4 i inne) w celu szybkiego dostępu do danych we/wy i niskich opóźnień dla aplikacji o wysokiej wydajności. Dzięki temu możesz wykonywać operacje IO o wysokiej aktywności, takie jak buforowanie, operacje na bazach danych, pliki dziennika itp.

  • Dodaj pojemność pamięci- Możesz łatwo przejść na standardową pamięć masową, dodając dla klientów wysokowydajną pamięć masową.

  • Płać jak używasz- Musisz tylko zapłacić za przydzieloną przestrzeń do przechowywania bloków. Oznacza to, że możesz łatwo dołączać/odłączać lub ponownie podłączać blokową pamięć masową, co pozwala obniżyć koszty.

  • Wydajność skalowalna- Ponieważ blokowa objętość pamięci masowej działa niezależnie z oddzielnymi blokami danych, można utworzyć dodatkowe blokowe woluminy w celu skalowania w poziomie. Wydajność skaluje się wraz z rozmiarem dysku lub limitem wystąpień maszyn wirtualnych. Dobra wiadomość jest taka, że ​​nie trzeba płacić za większe możliwości obliczeniowe.

  • Łatwe zarządzanie- Możesz łatwo zarządzać uprawnieniami dostępu i kontrolować jako host w systemie operacyjnym lub blokować woluminy pamięci masowej bezpośrednio kontrolować uprawnienia do danych.

Dlaczego pamięć masowa oparta na blokach nie zawsze jest najlepszym wyborem?

W niektórych przypadkach przechowywanie blokowe może nie być najlepszą alternatywą.

  • Klient podłączony do Internetu nie może w żadnym momencie pobrać pliku przechowywanego w pamięci blokowej. Dzieje się tak, ponieważ architektura blokowej pamięci masowej jest ograniczona do określonej pojemności woluminu jako limitów domyślnych. Jednak klienci mogą zażądać zwiększenia limitów, jeśli muszą rozszerzyć pojemność poza domyślne limity.

  • W przeciwieństwie do cen warstwowych lub opartych na woluminach, cena za cały blok pamięci masowej jest wstępnie zdefiniowana. Oznacza to, że aby uzyskać dostęp do jednego fragmentu danych, musisz płacić niezależnie za całą blokową przestrzeń dyskową, która obejmuje ilość przechowywanych danych, rodzaje wykonywanych operacji i koszt przesyłania danych.

  • Dystrybucja plików jest złożona i kosztowna w przypadku przechowywania blokowego, ponieważ każda jednostka danych jest dzielona i przechowywana oddzielnie. Prowadzi to do marnotrawstwa kosztów infrastruktury i nieefektywnego wykorzystania zasobów.

Poniższa tabela porównawcza podsumowuje różnicę między pamięcią blokową a obiektową. Spójrz.

Przechowywanie obiektów
Zablokuj pamięć
Dane są przechowywane jako obiekty w skalowalnych zasobnikach. Dane są przechowywane w blokach o stałej wielkości.
Można skalować w nieskończoność do Petabajtów i nie tylko. Ograniczona skalowalność dzięki blokom o stałych rozmiarach zgodnie z wymaganiami.
Mając większy kontekst danych (metadanych), możesz łatwo organizować, lokalizować lub pobierać dane. Brak metadanych.
Dane nieustrukturyzowane można efektywnie przechowywać w wielu lokalizacjach geograficznych. Im większa odległość między pamięciami, tym większe opóźnienie.
Najlepsza wydajność w przypadku zawartości nieustrukturyzowanej i wysokiej przepustowości strumienia. Najlepsza wydajność dla relacyjnych baz danych i danych transakcyjnych.
Łączność API oparta na HTTP(S). Dostępne przez Fibre Channel i Internet Small Computer Systems Interface (iSCSI).
Nieograniczona pojemność przechowywania plików. Może dodawać węzły, aby zwiększyć pojemność.
Najlepiej nadaje się do statycznych plików i aplikacji, takich jak kopie zapasowe danych, zawartość statyczna, obrazy archiwalne, bogata zawartość multimedialna (wideo, zdjęcia lub muzyka). Idealny do aplikacji, takich jak korporacyjne bazy danych i dane transakcyjne, które wymagają dużej liczby operacji we/wy na sekundę i małych opóźnień.

Skuteczne tworzenie kopii zapasowych i odzyskiwanie danych dzięki Zmanda

Niezależnie od tego, z jaką opcją przechowywania czujesz się komfortowo, prawdopodobnie przechowujesz swoje dane w celu długoterminowej archiwizacji. Dotyczy to danych używanych rzadziej lub w ogóle niedostępnych, ale zajmuje cenne miejsce do przechowywania. Ale co, jeśli Twoja główna pamięć masowa stanie się niedostępna? Zrelaksować się! Teraz możesz łatwo uzyskać dostęp, odzyskać cały zestaw danych, a nawet uruchomić maszynę wirtualną, aby przechowywać dane na serwerze kopii zapasowych w ciągu kilku minut!

Mając to na uwadze, Zmanda został zaprojektowany do kompleksowego przechowywania, tworzenia kopii zapasowych i Możliwość DR w całym obiekcie i blokowych urządzeniach magazynowych. Dane z kopii zapasowej można replikować do wybranej lokalizacji poza siedzibą firmy.

Obecnie silnik backupu Zmanda obsługuje następujące typy repozytoriów obiektowej pamięci masowej do długoterminowego przechowywania danych:

Wypróbuj je! Lub jeśli nadal jesteś rozdarty między rodzaj podejścia architektonicznego jako idealnego skalowalnego rozwiązania pamięci masowej, mamy rozwiązanie hybrydowe/konwergentne dopasowane do Twoich potrzeb. Masz pytanie? z nami, aby zrozumieć, w jaki sposób wykorzystujemy każde rozwiązanie, jednocześnie obniżając TCO (całkowity koszt posiadania).