Februari 2, 2024

Optimera säkerhetskopieringseffektiviteten med databeroende chunking och deduplicering

Sammanfattning

Har du någonsin funderat på hur mycket av din organisations resurser som går till spillo på ineffektiv säkerhetskopiering och lagring av data? En nyligen genomförd studie: IDC StorageSphere Forecast 2023-2028 av International Data Corporation fann att den globala datasfären förväntas nå 181 zettabyte senast 2025, vilket indikerar en 64% ökning från 2018. Med data som växer exponentiellt är de traditionella metoderna för säkerhetskopiering inte längre hållbara. Så letar du efter säkerhetskopieringslösningar som är byggda kring optimering av säkerhetskopieringseffektivitet och återställningsprocesser borde finnas på din radar.

I den här artikeln kommer vi att utforska databeroende chunking och deduplicering – en teknik som förändrar spelet för att optimera säkerhetskopieringseffektiviteten.

Men först…

Vad är fel med traditionella säkerhetskopieringsmetoder för att optimera säkerhetskopieringseffektiviteten?

Traditionella säkerhetskopieringsmetoder innebär att man tar en första fullständig säkerhetskopia, följt av en serie inkrementella eller differentiella säkerhetskopior för att fånga efterföljande ändringar. Även om detta ger möjlighet att återställa alla nödvändiga data, lagrar det också flera kopior av oförändrad delar av specifika filer. Ineffektiviteten multipliceras när det finns flera instanser av samma fil i varje filsystem eller till och med en säkerhetskopia.

Deduplicering och databeroende chunking: Bryt upp det

Databeroende chunking (DDC) och deduplicering har ett mer intelligent tillvägagångssätt. Denna metod innebär att dela upp data i mindre, varierande bitar baserat på det faktiska filinnehållet. Denna metod säkerställer att endast modifierade eller unika databitar bearbetas under säkerhetskopiering och återställning.

Fig: Optimera säkerhetskopieringseffektiviteten med deduplicering

Hur deduplicering och databeroende chunking fungerar – Backpacking-analogin

Föreställ dig att du planerar en ryggsäcksresa med dina vänner. Var och en lägger ut all din utrustning – ditt tält och stavar, vandringsstavar, mat, vatten, skor, etc.

Nu vet alla som har backpackat att viktminskning är avgörande. Så, vad gör du när en av dina vänner dyker upp med 25 burkar Boston-bakade bönor?

Du börjar deduplicera.

Du tar fram en penna och papper och börjar inventera. För varje nytt föremål noterar du vad det är (t.ex. en böna eller ett tältstångssegment) och dess överordnade föremål (t.ex. en burk bönor eller tältstång) innan du lägger den i din ryggsäck. När du stöter på ett identiskt föremål gör du helt enkelt en sammanställning bredvid originalanteckningen och lägger duplikatet åt sidan.

Efter den här processen kan ditt lager se ut ungefär så här:

I din ryggsäck (antal 1)	Del av…	Antal dubbletter
Segment för tältstång	Tält pinne	10
Böna	Burk med bönor	10,000
Aluminiumburk för bönor	Burk med bönor	25
Tältskal	Tält	1
Vattendroppe	Kanna med vatten	1,000,000
Ned fjäder	Sovsäck	1,000,000

Denna metod minskar avsevärt vikten du bär – att bära föremålen tillsammans med listan är mycket lättare att transportera och lagra än alla föremål och deras dubbletter. illustrerar kärnan i deduplicering. Men hur hänger detta ihop med säkerhetskopiering av data?

Översätta analogin till datasäkerhetskopiering

I samband med datahantering representerar föremålen i din ryggsäck unika databitar, medan de dubbletter som lagts åt sidan är som redundanta data i ditt lagringssystem. Precis som du inte skulle bära flera identiska burkar med bönor på en vandring, säkerställer dedupliceringstekniken att endast en instans av varje databit lagras, oavsett hur många gånger den visas i dina filer.

Databeroende chunking tar detta ett steg längre genom att analysera och lagra data i varierande stora bitar baserat på dess innehåll, ungefär som att bestämma om du ska packa hela burken med bönor eller bara den mängd du behöver. Detta tillvägagångssätt möjliggör effektivare lagring och snabbare backup- och återställningsprocesser, eftersom endast de unika eller ändrade bitarna hanteras under dessa operationer.

3 olika nivåer av deduplicering för att optimera säkerhetskopieringseffektiviteten

Även om det finns tre olika tillvägagångssätt där deduplicering kan uppnås - det finns en anledning till varför databeroende chunking är den mest effektiva framför de andra. Låt oss gå in i varje tillvägagångssätt och lista deras för- och nackdelar för att ta reda på varför databeroende chunking fungerar bäst för stora datamängder.

Deduplicering på filnivå– Den här metoden fungerar på helfilsbasis och identifierar och lagrar endast en instans av varje fil, oavsett hur många gånger den visas. Tänk tillbaka på vår campingliknelse: det är ungefär som att packa bara en burk bönor, oavsett hur många du behöver eller har.

Alla tillgångar på ett och samma ställe

Enkelhet: Det är enkelt att implementera och kräver minimala ändringar av befintliga system.
Effektivitet för dubbletter: Idealisk för miljöer med många identiska filer, vilket säkerställer ett rent, deduplicerat lagringsutrymme.

Nackdelar:
Begränsat omfattning: Kämpar med filer som har mindre skillnader, vilket leder till ineffektivitet i lagringen för ofta uppdaterade filer.
Förbisedda detaljer: Kan inte identifiera duplicerat innehåll i en fil, vilket kan lämna överflödiga data orörda.

Fast blockdeduplicering– Den här metoden deduplicerar filer baserat på en fast blockstorlek. Denna blockstorlek kan konfigureras eller hårdkodas beroende på programvaran och kan deduplicera block av data i och över filer

Alla tillgångar på ett och samma ställe

Granularitet: Erbjuder ett mer detaljerat tillvägagångssätt än deduplicering på filnivå, som kan identifiera dubbletter av block i och över filer.
Förbättrad effektivitet: Generellt uppnår man bättre dedupliceringsförhållanden genom att fokusera på mindre databitar med fast storlek.

Nackdelar:
Styv struktur: Den fasta storleken på blocken kan begränsa effektiviteten, eftersom dubbletter som inte passar perfekt med blockgränserna kan missas.
Komplexitet: Att konfigurera och bibehålla den optimala blockstorleken kräver en känslig balans för att maximera effektiviteten.

Variabelt block or Databeroende deduplicering – Det är metoden som vi har diskuterat hela tiden. Den justerar dynamiskt bitstorleken baserat på själva data, vilket säkerställer att varje databit endast lagras en gång, oavsett dess storlek eller plats i filen.

Alla tillgångar på ett och samma ställe

Optimal effektivitet: Genom att justera chunkstorlekarna så att de passar data maximerar den lagrings- och nätverkseffektiviteten, vilket gör den till guldstandarden för deduplicering.
Resursoptimering: Minskar behovet av lagringsutrymme och bandbredd, vilket optimerar systemets övergripande prestanda.

con:
Dess sofistikerade tillvägagångssätt kräver mer avancerad installation och hantering, vilket potentiellt överkomplicerar scenarier där enklare metoder kan räcka.

Så om du hanterar omfattande datauppsättningar är flexibiliteten och effektiviteten i databeroende chunking oöverträffad. Även om deduplicering på filnivå och fast block har sina fördelar, särskilt i specifika sammanhang, överensstämmer den adaptiva karaktären hos deduplicering av variabelblock sömlöst med komplexiteten och dynamiken i storskaliga datamiljöer. Det handlar inte bara om att spara utrymme; det handlar om intelligent hantering av data för att stödja snabb åtkomst, återställning och skalbarhet.

7 fördelar med databeroende chunking (DDC) och deduplicering för att optimera säkerhetskopieringseffektiviteten

Även om liknelsen med att inte vilja släpa runt en 60lb ryggsäck på en vandring är relaterbar, tar konceptet med databeroende chunking och deduplicering denna idé in i det digitala rummet.

Så här omvandlar dessa tekniker säkerhetskopiering och lagring av data:

Effektivt lagringsutnyttjande: DDC och dedupe fokuserar på att eliminera redundant data, vilket säkerställer att endast unika eller ändrade databitar lagras. Detta tillvägagångssätt minskar lagringsbehoven avsevärt, vilket gör användningen av lagringsresurser både mer ekonomisk och effektiv.
Snabbare databehandling: Endast en kopia av varje unik bit behöver komprimeras och krypteras för säkerhetskopiering och dekrypteras och dekomprimeras för återställning. Detta minskar drastiskt tiden och resurserna som krävs för att utföra dessa operationer.
Optimerad nätverksprestanda: Under säkerhetskopiering och återställning överförs endast de unika databitarna mellan källan och lagringsplatsen. Detta innebär att för en given operation flyttas endast data som saknas eller har ändrats, vilket förbättrar effektiviteten i dataöverföringen och minskar nätverksbelastningen avsevärt.
Förbättrad skalbarhet: Minskningen av dataredundans sparar inte bara utrymme utan stöder också större skalbarhet. Organisationer rapporterar ofta att de har minskat datastorleken med upp till 30 % eller mer, vilket innebär att de kan lagra betydligt mer data på samma mängd lagringsutrymme.
Minskade lagringskostnader: Det kan låta som att vi upprepar oss själva, och det är för att vi är det. Men det är värt att säga igen att lagring är dyrt, och att minska mängden data du behöver lagra kan spara tusentals eller till och med tiotusentals dollar varje år bara i lagringskostnader.
Minimerad påverkan på produktionssystemen: Traditionella säkerhetskopieringsprocesser kan ibland lägga en stor belastning på produktionssystemen, vilket leder till prestandaproblem. Databeroende chunking minimerar denna påverkan genom att specifikt rikta in sig på endast de väsentliga databitarna. Detta säkerställer att backupprocesser löper smidigt utan att onödigt påverka den dagliga driften av produktionssystemen.
Förbättrad RTO (återställningstidsmål): Databeroende chunking påskyndar inte bara säkerhetskopierings- och återställningsprocesserna, utan det förbättrar också datahämtningshastigheterna. När behovet uppstår för att komma åt specifika data, möjliggör den selektiva bearbetningsmetoden snabbare hämtning, vilket minskar den totala stilleståndstiden i kritiska situationer.

Databeroende chunking och deduplicering för att optimera säkerhetskopieringseffektiviteten med Zmanda

Zmanda har en erfarenhet av att leverera tillförlitlig och effektiv säkerhetskopiering och återställning för stora företag. Vår senaste version – Zmanda Pro är känt för sin robusta och effektiva dedupliceringsteknik och snabba, oföränderliga säkerhetskopior med luftgap.

Kolla in vår kompatibilitetsmatris för att förstå hur väl Zmanda Pro Backup-lösningen kan implementeras i din befintliga miljö, eller ta en 14-dagars gratis provperiod att uppleva produkten på egen hand.

Blogg Nyheter Baner Blogginlägg Disaster Recovery

Plan	Företag	Business Plus	Företag
Vem är det till?	Små företag skyddar data med 3-2-1-1 backup	Företag som skyddar kritisk IT arbetsbelastning och data	Skräddarsydda lösningar för företag och komplexa miljöer
Priser
Zmanda One Licensing (Per servrar, virtuella datorer och DB:er)	$ 3.99 / mån	$ 5.99 / mån	Custom
Per TB för säkerhetskopior av NAS och fildelning. Första 10 TB gratis	$ 4.99/TB/månad	$ 5.99/TB/månad	Custom
Microsoft 365 säkerhetskopiering		$ 1.99 / användare / månad	Custom
Pris per TB Zmanda Cloud Storage	$ 5.99/TB/månad	$ 6.99/TB/månad	Custom
Funktioner
Linux backup
Windows backup
Databasbackup
Virtuell maskin backup
NAS/filer delar säkerhetskopior
Zmanda molnlagring
Ransomware-skydd
Microsoft 365-säkerhetskopia
För alltid inkrementella säkerhetskopior
Katastrofåterställning
Valv
Deduplicering på klientsidan
SSO
Avancerade distributionsalternativ
Anpassade automatiseringsskript
Anpassade användningsnivåer
Support
Teknisk support	Standard	Premium	Premium
*Support 247**
Professionell service ingår		10 timmar	Custom
Träning ingår		8 timmar	Custom
Dedikerad kontohanterare
Expertkonsultation & design
Ytterligare professionell service (per timme)	$ 200 / timme	$ 200 / timme	$ 200 / timme

Optimera säkerhetskopieringseffektiviteten med databeroende chunking och deduplicering

Vad är fel med traditionella säkerhetskopieringsmetoder för att optimera säkerhetskopieringseffektiviteten?

Deduplicering och databeroende chunking: Bryt upp det

Hur deduplicering och databeroende chunking fungerar – Backpacking-analogin

Översätta analogin till datasäkerhetskopiering

3 olika nivåer av deduplicering för att optimera säkerhetskopieringseffektiviteten

7 fördelar med databeroende chunking (DDC) och deduplicering för att optimera säkerhetskopieringseffektiviteten

Databeroende chunking och deduplicering för att optimera säkerhetskopieringseffektiviteten med Zmanda

Christian Moon

Utforska fler ämnen

Redaktörens val

Tapes

Nyheter

Tanke ledarskap

Blogg

Teknisk dokumentation

AWS

Endpoint Backup

Optimera säkerhetskopieringseffektiviteten med databeroende chunking och deduplicering

Vad är fel med traditionella säkerhetskopieringsmetoder för att optimera säkerhetskopieringseffektiviteten?

Deduplicering och databeroende chunking: Bryt upp det

Hur deduplicering och databeroende chunking fungerar – Backpacking-analogin

Översätta analogin till datasäkerhetskopiering

3 olika nivåer av deduplicering för att optimera säkerhetskopieringseffektiviteten

7 fördelar med databeroende chunking (DDC) och deduplicering för att optimera säkerhetskopieringseffektiviteten

Databeroende chunking och deduplicering för att optimera säkerhetskopieringseffektiviteten med Zmanda

Dela detta:

Christian Moon

Läs mer

10 steg för planering av katastrofåterställning (DRP) med Zmanda

Checklista för Ultimate Disaster Recovery Plan 2024

Offsite Backups: Mastering Disaster Recovery—Del 2

Utforska fler ämnen

Redaktörens val

Tapes

Nyheter

Tanke ledarskap

Blogg

Teknisk dokumentation

AWS

Endpoint Backup