Innebygget raid gir økt driftsikkerhet

Nå kan server og Industri-PC løsninger for 19” rack og konsoll få Raid mulighet for en svært rimelig pris, og det finnes mange forskjellige konfigurasjoner som ikke nødvendigvis vil koste noen formue ettersom prisen pr GB på harddiskene har falt hvert eneste år. Historisk sett har det vært en type komponenter som har vært utsatt for begrenset driftsikkerhet i PC. Det er enheter som er i bevegelse, og de mest kjente kritiske komponentene er harddisker og kjølevifter. Begge har roterende kulelager og utsatt for slitasje spesielt ved høy varme. Harddiskene sliter i tillegg med lese armer og overflateskader på disker. Vi har her beskrevet litt om kjølevifter og levetider, samt hvilke grep vi valgte å gjøre da vi laget vår første PC løsning basert på en kundes behov.
Våre 2U PC løsninger for skap montering kan utstyres med Raid 0 eller 1 med sine 2 disker (se også Intel Matrix Storage Technology som er beskrevet om Raid 10), mens våre 3U PC løsninger for skap montering kan med sine 4 disker konfigureres som Raid 5 og 10 i tillegg.

Når det gjelder Raid har vi nedenunder beskrevet litt av fordelene (og ulempene ?) med Raid. Et raid oppsett blir oftest kaldt et «Array» på engelsk.

Raid 0

Dette blir også kalt «striping» og er i realiteten ikke noe annet en en hastighetsoptimalisering av 2 harddisker.

Raid 1

Raid 1 blir også kaldt «mirroring» eller «speiling» og er den enkleste form for å øke driftsikkerheten om det oppstår problemer med en harddisk. Raid 1 benytter 2 disker på samme måte som Raid 0, men kopierer alle data fra den ene disken til den andre automatisk slik at om en disk feiler vil systemet fortsatt kunne fungere tilfredsstillende med den andre disken. Det bør benyttes 2 identiske disker til et slikt system. Om en skal bytte disk på et senere tidspunkt må en velge identisk disk eller en disk med større kapasitet (som da blir nedskalert til å fungere som om den var identisk med den friske disken). Raid 1 kan senke lese og skrive hastigheten noe, men i de fleste applikasjoner vil en ikke merke noe til dette med de prosessorene, chip settene og diskene en har idag.

Raid 5

Dette kalles ofte «striping med paritet» og består av minimum 3 disker som deles inn i såkalte «blokker». Paritet er en matematisk metode for å gjenfinne og skrive data som evt går tapt om en disk feiler. På denne måten økes feiltolleransen. Data og paritet er fordelt («striped») på diskene som er en del av et slikr «Raid Array» og paritet bits blir fordelt i en roterende sekvens for å redusere flaskehalser som f.eks. beregning av paritet.

Raid 10 (0+1)

Raid 10 blir også kalt Raid 0+1 ettersom et «array» (et Array» kan også sees på som en samling harddisker som arbeider sammen i et system) består av minimum 4 disker som kan konfigureres som en kombinasjon av Raid 0 og Raid 1. Dermed får en både den teoretiske hastighetsøkningen og den økte driftsikkerheten ved såkalt speiling.

Nå har Intel med sin Intel Matrix Storage Technology gitt mulighet for Raid 0+1 ved bruk av bare 2 disker ved å lage 2 partisjoner på hver harddisk for å simulere Raid 0 og 1. Teknologien gir også mulighet til å modifisere/endre partisjon størrelsen uten å reformatere.

Besøk også Intel sine sider for å lese mer om dette.

Økonomi og priser

Nye SATA harddisker i Raid 1 konfigurasjon gir mulighet for økt oppetid og driftsikkerhet til en svært lav innkjøpskostnad.

Mens det for noen få år siden kostet 7-8.000,- for en Raid 1 løsning (speiling) har prisene nå falt dramatisk både for disker og ikke minst kontrollere. Dette tilsier at for under 1000,- (avhengig av diskstørrelse) kan en øke levetiden til en server med flere år. Om en ser hva kostnadene ved nedetid for en server er vil en raskt innse at det er verd pengene. Deler av årsaken til dette er at mange prosessorkort nå har slike kontrollere innebygd på hovedkortet og at både chipset og andre produksjonskostnader derfor har kommet ned i pris.

Fortsatt innehar disse rimelige løsningene kun en såkalt ”software Raid” løsning. Men for de som kan slå av maskinen i 2 minutter samt spanderer noen hundrelapper på å ha diskene i skuffer, vil en slik investering sannsynligvis tjenes inn svært raskt. For noen vil det kanskje være spart inn i løpet av bare ett år. For at nedetid koster både penger, tid og irritasjon er det liten tvil om.

Slik ”software raid” (eksempelvis Promise og Intel sine kontrollere) har i dag en kostnad som kan sammenliknes med vanlig IDE interface. Det fungerer aldeles utmerket for de aller fleste anledninger og gir driftsansvarlige pusterom i en situasjon som ellers kan være ganske stressende. Noen velger imidlertid å holde seg til hardware raid. I hovedsak fordi det gir såkalt ”hot-swap” funksjon, noe som medfører at disker kan byttes uten å kjøre ned maskinene. Andre velger slike løsninger fordi de mener det gir mindre ”overhead” (dvs. tar mindre prosessorkraft). Det siste er vel kun et argument der CPU kraften er strekt til det ytterste av forskjellige årsaker. Med vanlig IDE interface vers. SCSI var det flere som mente at dette tok 7-8% av prosessorkraften. Kanskje et argument når brukerne hadde en Pentium på 150 MHz eller lavere. Men med dagens CPU løsninger vil slike argumenter stort sett bare være aktuelt for de mest krevende applikasjonene.

Nedenfor har vi forsøkt å visualisere antatt tidsforbruk og de fordeler som Raid 1 og skuffer for disker gir. En slags visualisering av MTTR (Mean Time To Repair) problematikken ettersom nedetid blir stadig mer kritisk. Søylen til venstre angir antatt tidsforbruk i minutter som maskinen må være nede pga ny installasjon (hardware og software).

Irontech har valgt å tilby Raid 1 som en standard selv for de maskiner som har svært liten dybde (38cm eller 36,4 cm byggedybde) og liten høyde (2U). Bakgrunnen for dette er behovet for et minimum av oppetid i driftkritiske applikasjoner uten vesentlige kostnader. Både software raid og hardware raid inngår som en del av produktspekteret. Men ettersom vi vet at behovene kan variere stort er det naturligvis også tilgjengelig systemer uten Raid.

Å kjøre en Raid 1 løsning har frem til i dag vært forbeholdt de større serverne med byggedybde på 600 til 700 mm. Nå kan selv applikasjoner med krav om fleksibel montering eller mangelfull plass, for eksempel i skap ned til 400 mm dybde, nyte godt av slike løsninger og fortsatt ikke oppta mer enn 2U. Et alternativ vi vet mange vil være svært fornøyd med. Ikke minst pga prisen slike de ”nye” SATA alternativene gir.

Diskenes levetid avhengig av temperatur og kjøling

Etter hvert har også rimelige raid løsninger fått gode kjølesystemer. Dette gir både lengre levetid på diskene og flere fornøyde brukere, og driftsikkerhet er ikke noe en bare kan legge inn som en funksjon i ettertid. Ofte må det designes inn som en del av løsningene helt fra starten, avhengig av hva slags driftsikkerhet en snakker om. Dette inkluderer også perifer enheter som harddisker, tiltross for at svært mange standardsystemer kan legge til slike funksjoner i ettertid, om det finne fysisk plass til det.

Andre viktige forutsetninger er å lese ”spesifikasjoner” korrekt. Om harddisk leverandøren oppgir 1 million timer som MTBF (Mean Time Between Failure) betyr det slett ikke at forventet levetid er 1 million timer. Årsaken er at flere leverandører har lagt inn forutsetninger om at diskene må byttes med jevne mellomrom, noe mange oppfatter som en ”utvanning” av de opprinnelige definisjonene. Dermed har de oppgitte MTBF tallene blitt mer relatert til systemets oppetid for harddisker som byttes. Og vibrasjoner og ikke minst temperatur har mye å si for å oppnå nødvendig driftsikkerhet. En disk med arbeidstemperatur på for eksempel 45°C vil neppe overleve lenge. En kjøling ned til 30°C kan i mange tilfeller gi en levetid som er 2 år mer enn 45°C.

Slike behov for kjøling av harddisker er det dessverre ikke alle produsenter som ivaretar fordi løsningene designes med pris som fokus. Hvor rimelig slike investeringer er, kan naturligvis diskuteres om det stadig oppstår feil på for eksempel harddisk.

Under punktet om kjøling har vi beskrevet noe av årsaken til at vi kan opprettholde en så god driftsikkerhet som vi gjør (les mer om kjøling her). For å spare noen tiere på billige kulelager er nødvendigvis ikke den beste investeringen på sikt.

 

Copyright © 2020
Jørn Jensen

Gjengitt med tillatelse.

Om ønsker informasjon som ikke finnes på våre sider, ber vi deg kontakte oss med f.eks. en mail til vår support avdeling. Vi vil da forsøke å få opp mer informasjon så raskt som mulig.

Skroll til toppen