Hibrid adattárolási megoldások nagyvállalatoknak, Microsoft StorSimple

Egy érdekes tanulmánnyal készültünk olvasóink számára, melynek szerzője Safranka Mátyás, a Microsoft Consulting Services Azure szakértője, a Windows Azure lépésről lépésre könyv egyik szerzője:

A felhő rugalmas és végtelen bővítési kapacitása új lehetőségeket nyit a nagyvállalati adattárolás területén. Hibrid (saját és felhőben való) adattárolás és archiválás a Microsoft StoreSimple eszközzel és Windows Azure felhőszolgáltatással egy költség hatékony és egyben kellően gyors elérésű, nagy teljesítményű adattárolási és archiválási megoldás kialakítás lehetőségét jelenti a nagyvállalatok számára.

Magam részéről több mint öt éve vezetek hibrid autót, először négy évig csak félig hibrid, most meg már egy teljesen hibrid kialakításút. A hibrid (azonos feladatra két eltérő technológiát egyesítő) megoldásokban én két okból hiszek, és ezt most az autós analógiában mutatnám be:

  • Óvatos lépés egy új technológia megismerése felé: A teljes hibrid (full-hybrid) autók esetében definíció szerint a belsőégésű motor egy opcionális komponens, az autó a belső égésű motor nélkül is képes elindulni, haladni (természetesen megállni) vagyis egy teljes értékű elektromos autó + benzinmotor. Ezt a képet persze árnyalja, hogy a csak elektromos autóként való működés esetén csak néhány kilométer a megtehető távolság. A teljes elektromos autók esetében is ma még mindössze 160-300 km közötti hatótávolságról beszélünk, ami messze alul marad (egyelőre) a benzines üzemű autók képességeitől, a tisztán elektromos autók – különösen a megfelelő töltő infrastruktúra hiányában – ma még erőteljesen kompromisszumos megoldást nyújt. Azonban úgy gondolom, hogy mivel kipróbáltam a fél hibrid és a teljesen hibrid üzemű autókat, megismertem a viselkedésüket, menet jellemzőiket mind tisztán elektromos mint hibrid autóként, megtanultam mire kell figyelni egy olyan autón ami részben akkumulátorról, elektromos motorral megy. Pl.: többet használjam a motorféket a fékpedál helyett, hiszen így a regenerativ fék visszatölti az akkumulátort és így „megmenti” azt a mozgási energiát, amit a fékek egyébként csak hővé disszipálnának, vagy pl. milyenek a menettulajdonságai egy olyan autónak, amiben nincsenek sebesség fokozatok). Ezáltal én úgy gondolom, hogy felkészültebben tudok átülni majd egy teljesen elektromos autóba, mint valaki, aki esetleg egyből egy „hagyományos, kézi váltós, belsőégésű motoros autóból ül át majd egyszer az elektromos autóba. Összefoglalva: a hibrid megoldás használata lehetővé teszi, hogy kipróbáljak egy új technológiai irányzatot (pl.: elektromos autó) úgy nem vagyok teljes mértékben kitéve az új technológia hiányosságainak (elektromos autók rövid hatótávolsága, szemben a hagyományos autók hatótávolságával)
  • Működési költségek csökkentés lehetősége az innováció révén: A technológiai innováció mindig az emberek életének jobbá tételéről szól. Ez jelentheti, hogy olyan dolgok válnak elérhetővé, amelyek korábban nem (vagy nem mindenkinek) elérhető, amely új távlatokat nyit meg, vagy segíti a meglevő életünk kényelmesebbé vagy éppen olcsóbbá tételét. Ha a technológiai innovációt vállalati, vállalkozási szempontból nézzük akkor annak az árbevétel növekedését és/vagy működési költségek csökkentését, új üzleti lehetőségek megjelenését és/vagy ügyfél elégedettség növelését kell, hogy segítse. Az autós példánál maradva ugyan valamivel többet költöttem a teljes hibrid kialakítású autómra, mint amit az autó kategóriájában az átlag, viszont a 3,7-4,5 l/100km-es fogyasztás révén az autó használati ideje alatt sokkal kevesebbet költök üzemanyagra, mint ha egy ugyanilyen méretű hagyományos autót vettem volna, vagy pláne ha egy ugyan ilyen árban levő nagyobb autót vettem volna.

Összefoglalva és az autós részt lezárva: a hibrid kialakítással alacsony kockázattal tudom kipróbálni és használatba venni  egy újonnan megjelenő technológiában levő lehetőségeket.

És akkor az autózás után térjünk át egy másik kedvenc témámra az adat és fájltárolásra. A fájlkiszolgáló technológia gyakorlatilag a számítás technika ősi ideje óta velünk van, emiatt sokan hajlamosak elsiklani felette, mondván itt már nincs új a nap alatt. Noha ebben a cikkben nem a Windows Server fájlszerver újdonságait szeretném bemutatni, azok akik utoljára a Windows Server 2003 fájlszerver képességeit nézték át, javaslom mindenképpen nézzék meg mi minden újdonság/lehetőség van a Windows Server 2012 és Windows Server 2012 R2 fájl kiszolgálókban, mint például:

  • Fájl klasszifikáció,
  • Kvóta menedzsment
  • Fájl típus szűrés
  • Jelentések
    Dinamikus hozzáférési listák (Dynamic ACLs)
  • iSCSI target és initiator
  • SMB 3.0

Ebben a cikkben a tárolási képességek egy másik új technológiai innovációjáról a felhő alapú adattárolásról szeretnék egy bemutatót tenni. Korábban definiáltuk a felhő fogalmát, ami természetesen a felhő alapú adattárolásra is vonatkozik. A Microsoft felhő megoldásaiban egy közös és szerintem nagyon fontos jellemző más gyártók megoldásaihoz képest, hogy a Microsoft rendelkezik privát és a publikus felhő megoldásokkal egyaránt és ezek a megoldások, átjárhatóak oda-vissza. Vagyis minden vállalat és IT eldöntheti, hogy mennyi publikus és mennyi privát felhőt szeretne használni, ami számára ideális költségek, lehetőségek, és rugalmasság tekintetében. Ez igaz a fájlszerver és adattárolásra is.

A problémakör bemutatása, definiálása

Napjainkban az adattárolási igények folyamatosan növekednek. A felhasználók egyre több és több fájlt hoznak létre, ahogy a vállalati élet minden területe egyre jobban digitalizálódik. Azonban ha az egy adott adat elérési gyakoriságát és az időt vizsgáljuk, akkor valami hasonló görbét kapunk:

1106.StorSimple001

Vagyis az adatok a keletkezésük idején nagyon gyakran, később egyre kevésbé kerülnek elérésre, de archiválás, adattárolási szabályzat, stb. miatt szükség van arra, hogy megtartsuk. A storage technológiákban jártasak számára ismerős a „Tiering” kifejezés, vagyis hogy az adatokat az elérési gyakoriságuk alapján osztályozzuk és a ritkábban elért adatokat olcsóbb tárolóra mozgatjuk. Nézzük át hogy „hagyományos storage” megoldás esetén a „tiering” és a teljes adattárolás milyen rétegekből, komponensekből áll (itt most nagyvállalati értelemben vett, üzlet és üzletfolytonosság kritikus adattárolásra gondolok, olyanokra amelyek elvesztése anyagi kárt jelent a vállalat számára).

  1. Elsődleges storage réteg: teljesíti a gyakran elért adatokkal, adatbázisokkal kapcsolatos teljesítmény igényeket (IOPS). Jellemzője: legmagasabb egységnyi tárolt adatra vett ár (HUF/GByte)
  2. Archiválási storage réteg: Nagy kapacitású, de kisebb teljesítményű tároló (pl.: NAS ami SAS vagy egyéb olcsó tárolási megoldást használ). Az első rétegnél szignifikánsabban alacsonyabb az egy GByte-ra eső adattárolási költség. Ez a réteg szolgál a hosszabb távon megőrizendő, ritkábban használt de továbbra is a felhasználók számára az IT beavatkozása nélkül elérhető adatok tárolására.
  3. Disk alapú adatmentési réteg: A változások, fájlverziók módosításainak tárolása („pl: a reggeli verzióban még benne volt az a fejezet, biztos valaki véletlenül kitörölte”)
  4. Szalagos mentési réteg: archiválás hosszú távú megőrzés (amely a felhasználó számára nem transzparensen elérhető)
  5. Geo-adattárolás, másodlagos telephelyre való adatreplikáció vagy átszállítás: célja az adatok több helyen való tárolása, az adatok védelme érdekében. Ez vállalati, adatmegőrzési igények, előírások, stb. szerint több különböző módon történhet: az adatok hálózati replikációjával, vagy a fizikai adathordozók (pl. szalagos mentés) másodpéldányainak átszállításával. „sose becsüld alá a teherautó jelentette sávszélességet”

A fenti rétegek közül egy nagyvállalt legalább az első réteggel és legalább még egy – de nagyobb valószínűséggel több – réteggel rendelkezik.

fentiekből jól látszik a növekvő adattárolási igények legfőbb problémája – ami helyett én jobban szeretem a lehetőség, vagy megoldandó feladat kifejezést  – miszerint: egy új GB adat tárolása több rétegben is megjelenik, a tárolási költségek eszerint növekednek (storage-t kell bővíteni, mentési kapacitást kell bővíteni, a másodlagos adatközpont adattárolási kapacitását kell bővíteni, stb., stb.).

Az elasztikus, rugalmasan bővíthető felhő szolgáltatások tehát itt jó költség megtakarítási lehetőséget nyújthatnak, ám a felhő technológiák adattárolási lehetőségeinek hiányosságait (mint ahogy a teljesen elektromos autók limitált hatótávolságát kompenzálja a hibrid elektoromos-benzines kialakítás).

Microsoft StorSimple működésének és előnyeinek áttekintése

A Microsoft StorSimple egy adattároló eszköz, ami a hasonló nevű cég felvásárlása révén került a Microsofthoz. Ha egy mondatban kellene megfogalmazni akkor kissé pongyolán azt mondanám egy saját adatközpontban levő gyorsító tár a Windows Azure nevű végtelen kapacitású adattárolóhoz. Az analógia alapja a CPU-ban is használt cache gyorsító tár, amely a mai gépekben levő GB-os TB-os RAM memória méretekhez képest elenyészően picinek tűnik (a L3-as cache is néhány MB a legmodernebb szerver kategóriás CPU-kban is, az L2, L1 cache ami a legközelebb van a CPU-hoz és a leggyorsabb még mindig kByte méretekben mérendő). A CPU cache (L1-L2-L3) feladata hogy az adatok elérhetőségét a CPU sebességén biztosítsa, mivel a RAM (még a modern DDR3 RAM-ok is) a CPU adatfeldolgozási sebességének töredékével képesek csak adatot írni és olvasni. Pontosan így kell elképzelni a StorSimple és a Windows Azure által biztosított hibrid adattárolást, természetesen néhány lényeges elemmel kiegészítve.

Nézzük meg egy ábrán, hogy néznek ki az adattárolási rétegek a StorSimple esetén:

4628.StorSimple002

Vagyis a StorSimple a korábban látott akár hat adattárolási réteget egy saját infrastruktúrában, és egy felhőben megvalósított rétegben valósítja meg. A korábban látott rétegek feladatait a StorSimple és a Windows Azure által biztosított megoldás a következő képen biztosítja:

  • A legfrissebb és leggyakrabban elért („legforróbb”) adatokat egy SSD adattárolón tárolja, ez jelenti a nagy teljesítményű elsődleges adat elérési réteget.
  • Ahogy az adatok folyamatosan érkezek be és az SSD adatterületen a szabad hely fogytán van akkor a StorSimple eszköz először is blokk szinten de-duplikálja az adatokat (teljesen szabványos, hagyományos blokk – tehát nem fájl szintű módon). Ez jelenti az első archiválási és mentési réteget. A mentési réteget azért, mert a blokk szintű de-duplikáció hatékony tárolást biztosít hogy több verziót tudjunk tárolni ugyan abból a fájlból hasonlóan a Windows Server „Previous version” opciójához. Példa: van egy 30 Mbyte-os PowerPoint prezentációm a fájlszerveren. Erről csinálok snap-shot mentést, ami az aktuális állapotot tartalmazza. Holnap egy kollégám megmódosít 3 diát és felül írja a fájlomat. Azt hogy ezt egy korábbi állapotból visszahozzam, kell a korábbi snap-shot mentés. Viszont mivel a snap-shot mentés, az eredeti és a módosított fájl is a StorSimple által kezelt tárolón van így töredék annyi helyet használok: 30 MB lenne a snap-shot mentés adattárolási igénye és 30 MB lenne a módosított fájl is a fájlkiszolgálón és 30 MB tárhely kellene a korábi verzió visszaállítására. Ez összesen 90MB lenne, de StoreSimple-n a deduplikáció miatt ez csak 30MB + „eredeti fájlhoz képesti 3 dia módosítás” helyigényt jelent.
  • Ahogy az adatok folyamatosan érkezek be és a de-duplikáció után is alacsony az elérhető szabad hely az SSD tárolókon utána a már de-duplikált adatblokkokat a StorSimple eszköz tömöríti és utána a SAS tároló lemezekre írja. A tömörítés az nagyobb tárolási kapacitás mellett gyorsabb adatelérést is biztosít, mivel a CPU-k sebessége nagyságrendekkel gyorsabban fejlődött, mint a merevlemezek adatátviteli sebessége. Ez is az archiválási és adat mentési réteg része, amely még mindig saját infrastruktúrában található.
  • Ha az SSD és a SAS diszk rétegekben is egy adott szint alá kerül az elérhető szabad hely, akkor a StorSimple eszköz titkosítja (AES256) az adat blokkokat és a Windows Azure felhőbe írja. A titkosítási kulcs kizárólag on-premise található meg, tehát a Windows Azure tárolóban levő adatokhoz sem a Microsoft sem senki más illetéktelen nem férhet hozzá. A Windows Azure jelenti a korlátlan adat archiválás, mentés és georeplikációs réteget. A Windows Azure-ban egy adatblokk minimum három példányban kerül tárolásra egy adatközpontban és ha explicit nem tiltjuk le akkor régión belül automatikusan replikálódik két adatközpont között. Ez azt jelenti hogy 6 példányban van tárolva a Windows Azure-ban tárolt adat (3-3 példány egy-egy adatközpontban), ezáltal a georeplikációs adatvédelem is biztosított. (A Windows Azure adatközpontok olyan távolságra vannak egymástól, hogy természeti, ipari vagy egyéb katasztrófák ne tudjanak egyszerre több régiót vagy az ott tárolt adatokat elérhetetlenné tenni. A nagyon nagy előnye ennek az on-premise adat archiválás, mentés és georeplikációhoz képest, hogy itt a költségek az adatmennyiséggel egyenes arányban nőnek, míg onpremise esetben a plusz archive diszk, plusz mentési kapacitás, plusz georeplikáció, plusz másodlagos adatközpontban tárolási költség, stb is megjelenik.. Amenniyben egy Windows Azure-ban tárolt adatra van szükség akkor azt a StorSimple beolvassa a felhőből, és elhelyezi a SAS vagy SSD adattárolóban (de nem törli a Windows Azure-ből)

Fontos megemlíteni hogy a különböző rétegek közötti adat mozgatást a StorSimple eszköz automatikusan végzi, tehát mind az üzemeltetőnek, mind a végfelhasználónak egybefüggő nagy adattárolási területnek látszik a StorSimple + Windows Azure tárterület.

A fentieket ábrázolva a StorSImple és Windows Azure adattárolási megoldás költség előnye:

7776.StorSimple003

A Windows Azure révén elméletileg korlátlan tároló kapacitás áll rendelkezésünkre a StorSimple + Windows Azure mint archiválási megoldás révén, amely költség hatékony, hiszen a tárolási költségeink a kapacitás igényekkel lineárisan nőnek (vagy még az alatt, mivel aki már nézegette a Windows Azure publikus ár kalkulátort láthata, hogy egységnyi adattárolás költsége nagyobb kapacitás igények esetén valamelyest alacsonyabb a Windows Azure-ban.

Egy nagyon érdekes adattárolás tervezési kérdést vet ez fel mégpedig, hogy milyen arányú legyen a „lokális cache” és az allokált felhő tárolási kapacitás. Mivel ez adat igényektől, használattól, technológiai lehetőségektől stb. függő sok ismeretlenes egyenlet, amire általános javaslatot nem tudok tenni, pontosabban csak annyit hogy mi (Microsoft Consulting Services, Premier Support Services) és Windows Azure rendszerintegrátor partnereink állunk minden ügyfelünk rendelkezésére.🙂

Amit fontos viszont kiemelnem:
A StorSimple és Windows Azure adattárolónkat elsődlegesen nem nagy teljesítmény igényű nagy adatmennyiségű adatok tárolására használjuk, amelyek esetén igaz az a megállapítás, hogy az adatok kis része van gyakran használatban a többi inkább csak archív:

  • Fájlszerver: Klasszikus irodai fájlmegosztás a legelső és egyik leghatékonyabb felhasználási területe a StorSimple és Windows Azure alapú adattárolásnak (CIFS-SMB, NAS, NFS)
  • Nagy média fájl archívumok: Mérnöki anyagok, CAD, EMR/PACS, naplók, logok, jogi, építészeti, stb.
  • SharePoint: Blob tárólók, adatbázisok
  • Virtualizációs környezet: VM archívumok, library-k, nem elsődleges telephelyek VM gépeinek háttértára

Természetesen egy StorSimple és Windows Azure tároló megoldás a fenti igényeket egyszerre is tudja kezelni.

Fentartással legyunk azokban az esetekben amikor ez a fajta tárolási mód nem ideális, mint például:

  • Virtuális gépek amik nagy teljesítményt igényelnek
  • Archívumok amiket az alkalmazásuk folyamatosan indexel, katalogizál
  • SQL adatbázisok (mérettől függően)

Semmilyen körülmények között ne használjuk a StorSimple és Windows Azure alapú tárolást az alábbiakra:

  • Mentő szoftver háttértára (se System Center 2012 Dataprotector Manager, se más harmadik fél). A DPM képes közvetlenül a Windows Azure-ba menteni, használjuk az ha közvetlenül a felhőbe szeretnénk menteni.
  • Nagy teljesítmény igényű rendszerek (ERP, CRM, adatbányászat és analitika)
  • Exchange, vagy egyéb levelező rendszer

Az eszköz

Zárásként azok kedvéért, akiket érdekelnek a technológiai részletek is a StorSimple eszközt szeretném bemutatni:

1581.StorSimple004Az eszköz felépítését és javasolt hálózati kialakítását az alábbi ábra mutatja:

2476.StorSimple005Látható hogy a két controller két-két hálózati kártyával rendelkezik az iSCSI forgalom számára, illetve mind a két kontroller rendelkezik egy management és egy internet csatlakozást biztosító adapterrel a Windows Azure tároló eléréséhez. Az eszköz management-je megoldható az iSCSI Ethernet csatlakozókon keresztül is, nem kötelező (de javasolt) a management hálózat használata

Az eszköz rendelkezik egyaránt MMC és webes konfigurációs felülettel is. Használat tekintetében ugyan úgy kell kezelni mint bármilyen iSCSI storage-t, ki kell alakítanunk diszk területeket, amiket az iSCSI initiator-oknak (kiszolgálóknak) egyszerűen diszkekként kiallokálunk (akár MPIO-n keresztül). A lényeges különbség hogy egy hagyományos SAN-nal ellentétben itt a benne levő SSD és SAS diszkek kapacitásai feletti tárolási kapacitást tudunk kiallokálni és felhasználni.ű

Összefoglalás

Azokra az adattárolási igényekre, amelyek mérsékelt teljesítmény igényű, viszont nagyon-nagy archiválási kapacitás igényűek azokra a StorSimple eszköz a Windows Azure olcsó adattárolási képességével egy hatékony és a nagyvállalati igényeket (archiválás, mentés, georedundáns tárolás) teljes mértékben kielégítő, költséghatékony megoldást tud nyújtani.

A hibrid adattárolást nem lehet 1:1-ben összehasonlítani a hagyományos adattárolási technológiákkal, fontos hogy értsük a működését, lássuk a használati területeket, hol jelent előnyöket, de ugyan úgy lássuk a korlátait is. Ez se nem egy általános célú high-end, se nem egy mid-range enterprise storage, hanem egy új adattárolási lehetőség, amely előnyeit komplexen az adattárolási, archiválási és mentési megoldások egészével kell összevetni üzemeltetés és költségek tekintetében.

Vélemény, hozzászólás?

Adatok megadása vagy bejelentkezés valamelyik ikonnal:

WordPress.com Logo

Hozzászólhat a WordPress.com felhasználói fiók használatával. Kilépés / Módosítás )

Twitter kép

Hozzászólhat a Twitter felhasználói fiók használatával. Kilépés / Módosítás )

Facebook kép

Hozzászólhat a Facebook felhasználói fiók használatával. Kilépés / Módosítás )

Google+ kép

Hozzászólhat a Google+ felhasználói fiók használatával. Kilépés / Módosítás )

Kapcsolódás: %s