|
Teknikken bag missionskritiske servere

En anden måde at tænke på
"If it ain't broken, dont fix it," siger et ordsprog. I forlængelse af den
tanke, har amerikanske Stratus Technologies vendt ideen bag de eksisterende
missionskritiske systemer på hovedet. Hvorfor overhovedet bygge en server,
der kan gå ned, og koncentrere al udvikling, penge og kræfter på at redde
flest mulige data - og derefter få den op at køre igen?
Standard Intel system
Hvorfor ikke udvikle en server med
udgangspunkt i billige Intel-processorer, og lade to computere køre
parallelt i den samme server. Det der kaldes redundans, hvor diskene og processorerne er synkroniseret
præcist ned på hver eneste CPU clockcyclus - og lade de to parallelle
systemer løse præcist de samme opgaver. Hvis den ene står af, kører den
anden jo stadig. Uden afbrydelse.
Online overvågning - automatisk reparation
Tanken førte til det legendariske Lockstep patent. Et realtidssystem, der
konstant overvåger og analyserer driftsfejl i serveren - for hver enkelt
CPU cyklus. Er fejlen alvorlig, kalder systemet automatisk op til et
døgnbemandet support center, der analyserer fejlen og eventuelt sender en
ny enhed med posten. Imens kører serveren naturligvis stadig - på "det ene
ben." Stratus kalder det ft-servere (Fejl Tolerante servere), fordi de kan
tåle at fejle uden at gå ned. Harddiske og CPU'er i ft-servere kan
naturligvis også skiftes ud i takt med, der kommer nye produkter på
markedet.
Den lille forskel - programmerne
kører uden tilretning
Traditionelle cluster baserede server løsninger kræver som oftest, at alle
applikationer bliver rettet til. Det er dyrt. Samtidig er teknologien
sårbar overfor tab af transaktion data, når en server i clusteret fejler. Online data
i hukommelsen går som regel tabt, når en server bryder ned i et cluster
system, og den efterfølgende fejlanalyse risikerer at blive dyr og
tidskrævende.
Synkroniseringen af diskene og
processorerne i en ft-server ligger på niveauet under applikationerne, så
alle standard applikationer kører uden justeringer af softwaren. Alle
standard Windows programmer kan installeres og afvikles direkte uden
modifikationer.
De fem ni-taller - næsten perfekt oppetid
Drømmen er naturligvis at konstruere servere, der bare kører og kører. 100
procent hele tiden. Men i praksis er målet de legendariske fem ni-taller
altså en oppetid på 99,999 procent, som udviklere af computere i årtier
har drømt om.
Men målingerne fra overvågningen af Stratus-servere kloden over, viser en
samlet og generel oppetid på mere end 99,999 procent. Det svarer til, at
systemet er nede 5,25 minutter i løbet af et år. Nu er det kun den
fjerde decimal, der mangler...
Vi har scoret den fjerde decimal
Men
Stratus Tecnologies og PC Instruments tilbyder et såkaldt Perfect
Performance serviceprogram, der napper den fjerde decimal. Vi
garanterer hundrede (100) procent oppetid. Bedre bliver det vist ikke.
Home
|