Programmering

Hvad virkelig opbevaring af hyperskala betyder

Lad os være klare: Hyperscale handler ikke om, hvor stor du er.

Organisationer behøver ikke at være enorme for at udnytte hyperscale-løsninger. Men det er præcis, hvad mange it-infrastrukturer, operationer og devops-professionelle tænker, når de først lærer om hyperscale.

Den fremherskende tro er, at hyperscale-arkitektur er beregnet til ekstremt store infrastrukturer - som dem, der drives af LinkedIn, Amazon eller Netflix - fordi den skaleres til tusindvis af forekomster og petabytes af data. Som det viser sig, er det bedre at tænke på hyperscale som en nærme sig hellere end størrelse. Det handler om automatisering, orkestrering og opbygning af IT, der skaleres intelligent, når og når virksomheden har brug for det. Hyperscale-implementeringer kan og bør starte i det små og skaleres derefter på ubestemt tid. De skal også give dig mulighed for uafhængigt at skalere kun den del af infrastrukturen, der har brug for det, hvilket er i modstrid med en anden nye datacentertendens, hyperkonvergens.

Forvirret endnu? I så fald er du ikke alene. Lad os dykke lidt dybere ind.

Definition af hyperskala

Konceptet med at opbygge en hyperskalaarkitektur er forvirret af mange tangentielle termer. Især ser vi kunder forvirrede over hyperkonvergeret, hyperscale (eller web-skala), konvergeret, softwaredefineret og råvarebaseret infrastruktur.

Lad os tage et øjeblik til at afklare definitioner på disse ingrediensbetingelser:

  • Software-defineret: Infrastruktur, hvor funktionaliteten er helt afkoblet fra den underliggende hardware og er både udvidelig og programmatisk. Læs dette indlæg for især vores uddybning af softwaredefineret lagring.
  • Råvarebaseret: Infrastruktur bygget oven på råvare eller industristandard infrastruktur, normalt en x86 rackmonteret eller bladserver. Som vi tidligere har skrevet, må du ikke samle råvarer med billige.
  • Konvergeret: En udskalningsarkitektur, hvor server-, lager-, netværks- og virtualiserings- / containeriseringskomponenter er bundet sammen som en forprøvet, præintegreret løsning. Komponenter er stadig forskellige i denne arkitektur.
  • Hyperkonvergeret: En udskalningsarkitektur, der tager konvergeret infrastruktur et skridt videre ved at kombinere softwaredefinerede komponenter oven på råvarehardware, pakket som en enkelt løsning - ofte et enkelt apparat. Komponenter er ikke længere adskilte.
  • Overskala: En udskalningsarkitektur, der også er softwaredefineret og råvarebaseret, men hvor server-, lager-, netværks- og virtualiserings- / containeriseringsressourcerne forbliver adskilte. Hver komponent er særskilt og kan skaleres uafhængigt.

Sammenfattende tænk på hyperkonvergeret infrastruktur som den moderne, logiske ekstreme af konvergerede systemer, mens hyperscale er den moderne, logiske ekstreme af, hvordan vi har bygget datacentre i 30 år. Begge giver mening for specifikke miljøer, som vist nedenfor.

Overskala og hyperkonvergeret

Hos Hedvig stræber vi efter at levere en lagerløsning, der kan skræddersys fleksibelt til enhver arbejdsbyrde, fra private skyer, herunder Docker og OpenStack, til big data-implementeringer, der kører Hadoop eller NoSQL til mere traditionel servervirtualisering, katastrofegendannelse, backup og arkivering. Hedvig Distribuerede lagerplatform virtualiserer og aggregerer flash- og centrifugeringsdisk i en serverklynge eller sky og præsenterer den som et enkelt, elastisk lagersystem, der kan tilgås via fil-, blok- eller objektgrænseflader.

Den distribuerede lagerplatform Hedvig består af tre komponenter:

  • Hedvig Storage Service: En patenteret motor med distribuerede systemer, der skalerer lagerets ydeevne og kapacitet med x86- og ARM-servere fra hylden. Hedvig Storage Service kan køres lokalt eller på offentlige skyer som AWS, Azure og Google. Den leverer alle de lagringsmuligheder og funktioner, der kræves til en virksomhedsinstallation, herunder inline deduplicering, inline-komprimering, snapshots, kloner, tynd provisionering, autotiering og caching.
  • Hedvig Storage Proxy: En let VM eller container, der giver adgang til Hedvig Storage Service via industristandardprotokoller. Hedvig understøtter i øjeblikket NFS til fil og iSCSI til blokering samt OpenStack Cinder- og Docker-drivere. Hedvig Storage Proxy muliggør også caching og deduplicering på klientsiden med lokale SSD- og PCIe-flashressourcer til hurtig lokal læsning og effektiv dataoverførsel.
  • Hedvig API'er: REST- og RPC-baserede API'er til både objektlagring og Hedvig-operationer. Hedvig understøtter i øjeblikket Amazon S3 og Swift til objektlagring. Udviklere og it-driftsadministratorer kan bruge administrations-API'erne til at muliggøre adgang til alle Hedvig-lagringsfunktioner til at automatisere klargøring og styring med selvbetjeningsportaler, applikationer og skyer.

Hedvig understøtter hyperkonvergens ved at samle Hedvig Storage Proxy og Hedvig Storage Service som virtuelle apparater, der kører på en handelsserver med en hypervisor eller container OS. For hyperskala indsættes Hedvig Storage Service på bare metal-servere for at danne et dedikeret lagringsniveau, mens Hedvig Storage Proxy distribueres som en VM eller container på hver server i computerniveauer.

Hvorfor vælge hyperskala til opbevaring

Data vokser langt hurtigere end lagerbudgetter. Økonomien lammer for virksomheder, der ikke har ressourcer fra internetgoliater som Amazon, Google og Facebook. Således skal virksomheder omfavne softwaredefineret og råvarebaseret lagring for at reducere omkostningerne og opretholde den nødvendige fleksibilitet og skalerbarhed for at holde trit med forretningskravene.

Hos Hedvig har vi bemærket, at omkring 80 procent af tiden vælger kunder en hyperskalaarkitektur snarere end hyperkonvergeret, på trods af at vi støtter begge dele. Hvad der er endnu mere interessant er, at mange af vores kunder kommer til os og tænker det modsatte. Omkring 80 procent anmoder oprindeligt om en hyperkonvergeret løsning, men efter at de har lavet deres lektier, vælger de hyperscale-tilgangen.

Hvorfor? I en nøddeskal, fordi de foretrækker fleksibilitet (eller smidighed, hvis du skal bruge dette udtryk) frem for alt andet, når du arkitekturer deres infrastruktur. Overvej følgende:

  • Et hyperkonvergeret system tilbyder en forenklet "byggesten" tilgang til IT. For lean IT-organisationer, der ønsker at sænke omkostningerne ved at implementere og udvide en skylignende infrastruktur, giver hyperkonvergens en god løsning. Men det kræver et relativt forudsigeligt sæt arbejdsbelastninger, hvor "datalokalitet" er en topprioritet, hvilket betyder, at applikationen eller VM skal være placeret så tæt på dataene som muligt. Dette er grunden til, at VDI har været et plakatbarn for hyperkonvergens. Brugere vil have deres "virtuelle C: drev" lokalt. Men det er ikke fleksibelt, da det involverer skalering af alle elementer i lockstep.
  • Et hyperscale-system holder opbevaring uafhængig af beregning, hvilket gør det muligt for virksomhedens IT at skalere kapacitet, når virksomheden kræver det. Den hyperscale tilgang til datacenter og skyinfrastruktur tilbyder en høj grad af elasticitet, hvilket hjælper organisationer med hurtigt at reagere på skiftende applikations- og datalagringsbehov. Det er også en arkitektur, der bedre matcher moderne arbejdsbelastninger som Hadoop og NoSQL, såvel som dem, der er arkitekteret med skyplatforme som OpenStack og Docker. Alt dette er eksempler på distribuerede systemer, der drager fordel af uafhængigt skaleret delt lager.

Det, vi har oplevet med vores kunder, er en samlebekræftelse på, hvad vi har bemærket i et stykke tid nu: at hyperkonvergeret er en svar og ikke det svar, når du udforsker moderne opbevaringsarkitekturer. For at være sikker ser branchen et stort pendul svinge til hyperkonvergeret på grund af sin enkelhed. Men hvis dine data vokser eksponentielt, og dine beregningsbehov ikke er, så har du et impedansmatch, der ikke er velegnet til hyperkonvergens.

Overskala eller hyperkonvergeret?

Hyperconverged kan være en enklere og mere omkostningseffektiv tilgang. Hvad vores kunder opdager med Hedvig er imidlertid, at vi understøtter en funktion, der gør hyperscale passende til næsten alle arbejdsbelastninger: caching på klientsiden. Hedvig kan drage fordel af lokale SSD- og PCIe-enheder i dit beregningsniveau til at opbygge en gennemskrivningscache. Dette forbedrer læseevnen betydeligt og, vigtigere, løser datalokalitetsudfordringen. Opbevaring er stadig afkoblet og kører i sin egen dedikerede, hyperscale tier, men applikationer, VM'er og containere kan drage fordel af data, der cachelagres lokalt i beregningsniveauet. Dette løser også problemet med, hvordan du vokser dit caching-niveau, men det er et emne for en anden artikel.

Som et eksempel på denne fordel valgte en kunde Hedvigs hyperscale-tilgang til VDI, en arbejdsbyrde, der traditionelt er forbeholdt hyperkonvergerede løsninger som beskrevet ovenfor. I dette tilfælde havde kunden “strømbrugere”, der krævede 16 vCPU'er og 32 GB hukommelse til at være dedikeret til hvert hostede skrivebord. Som et resultat blev virksomheden tvunget til at distribuere et stort antal hyperkonvergerede noder for at understøtte processering og hukommelseskrav, mens den unødigt øgede lagringskapacitet i lockstep.

Med Hedvig-platformen var kunden i stand til at oprette dedikerede noder til at køre Citrix XenDesktop-gården på bøfede bladservere med tilstrækkelig CPU og RAM. Dataene blev holdt på en separat hyperscale Hedvig-klynge på rackmonterede servere, med data cachelagret på XenDesktop-serverne i lokale SSD'er. Resultatet? En dramatisk billigere løsning (60 procent mindre). Mere vigtigt, det gav også et mere fleksibelt miljø, hvor virksomheden kunne køre på Moores lov og købe de mest kraftfulde servere, der var nødvendige for at opgradere deres desktop-ydeevne uden at skulle opgradere lagerservere.

Baseret på vores erfaring er der nogle lette tommelfingerregler for at bestemme, hvilken arkitektur der passer til dig.

  • Vælg hyperscale når ... din organisation har 5.000 ansatte eller mere, mere end 500 terabyte data, mere end 500 applikationer eller mere end 1.000 virtuelle computere.
  • Vælg hyperkonvergeret, når ... du er under disse vandmærke numre, har fem eller færre medarbejdere, der administrerer din virtuelle infrastruktur, eller du er i et fjerntliggende eller filialkontor.

Den gode nyhed er, at det ikke behøver at være en eller anden beslutning. Du kan starte i et hyperkonvergeret miljø og derefter skifte til hyperscale, eller du kan blande og matche de to. Vores filosofi er, at dine applikationer dikterer, hvilken du skal bruge. Og da dine applikationsbehov ændres over tid, bør din implementering også ske.

I moderne virksomheder er forandring og vækst obligatorisk. I stigende grad er der ingen måde at løse dette gåde uden den hyperscale arkitektur, som webgiganterne var pionerer på. Hvad der er ændret er, at enhver virksomhed nu kan drage fordel af hyperscale-tilgangen.

Rob Whiteley er direktør for marketing hos Hedvig.

New Tech Forum giver et sted at udforske og diskutere nye virksomhedsteknologier i hidtil uset dybde og bredde. Valget er subjektivt baseret på vores valg af de teknologier, som vi mener er vigtige og af største interesse for læserne. accepterer ikke markedsføringssikkerhed til offentliggørelse og forbeholder sig retten til at redigere alt bidraget indhold. Send alle forespørgsler til [email protected]