Listiger Lurch an Houston, wir haben ein Problem!

Über das Wochenende haben wieder viele Bleichgesichter folkloristische Kleinkunst im Online-Shop der Shoshones eingekauft. Gerade zur närrischen Zeit gehen die indianischen Outfits besonders gut. Bei den Shoshone herrscht Hochkonjunktur und nun kommt es darauf an, dass die Prozesse im Versand reibungslos funktionieren. Und wie das halt immer so ist, ausgerechnet am Montag funktioniert das Drucken der Versandlabels für den Deutschen Haschisch Lieferanten nicht. Und das kann schwerwiegende Folgen haben, weil die Ware nicht fristgerecht versendet werden kann.

In so einem Fall ruft Lagerchef lahmer Mustang seinen Chef listigen Lurch an und der zitiert seinen Medizinmann und Chief Information Officer (CIO) falscher Hase ins Wigwam. Das bedeutet wieder ziemlich dicke Luft bei den Shoshone und Praktikantin Monia geht erst mal in Deckung. Der Chef hat mal wieder ziemlich miese Laune.

Nach einem kurzen aber heftigen Tamtam im Wigwam vom Chef gibt falscher Hase einen Notruf via indianischer Fernmeldetechnik in Richtung unseres griechischen Austausch-Schraubkopf Dimitri Stoupakis ab. Der Empfängt die Rauchzeichen und eröffnet sofort ein Service-Ticket in seinem neuen Ticket-System: „Versandlabels können nicht gedruckt werden. Priorität hoch!“

Anfrage vs. Störung vs Notfall

An diesem Punkt ist Dimitri richtig gefordert. Er muss jetzt die Rauchzeichen aus dem Dorf der Shoshone qualifizieren, um die Rauchzeichen richtig einordnen zu können. Für Häuptling listigen Lurch ist die Sache klar. Für ihn ist das ganze schon wieder eine Katastrophe. Aber was ist es jetzt genau, fragt sich Dimitri. Schauen wir uns doch mal die Definition der Begrifflichkeiten durch das Bundesamt für Sicherheit in der Informationstechnologie an:

Störungen, Notfälle, Krisen und Katastrophen im Verständnis des BSI-Standards 100-4

Einfache Störung

  • Kurzzeitiger Ausfall von Prozessen oder Ressourcen mit nur geringem Schaden.
  • Behandlung ist Teil der üblichen Störungsbehebung.

Notfall

  • Länger andauernder Ausfall von Prozessen oder Ressourcen mit hohem oder sehr hohem Schaden.
  • Behandlung verlangt besondere Notfallorganisation.

Krise

  • Im Wesentlichen auf die Institution begrenzter verschärfter Notfall, der die Existenz der Institution bedroht oder die Gesundheit oder das Leben von Personen beeinträchtigt.
  • Da Krisen nicht breitflächig die Umgebung oder das öffentliche Leben beeinträchtigen, können sie, zumindest größtenteils, innerhalb der Institution selbst behoben werden.

Katastrophe

  • Räumlich und zeitlich nicht begrenztes Großschadensereignis, zum Beispiel als Folge von Überschwemmungen oder Erdbeben.
  • Aus Sicht einer Institution stellt sich eine Katastrophe als Krise dar und wird intern durch deren Notfallorganisation in Zusammenarbeit mit den externen Hilfsorganisationen bewältigt.

Okay für Häuptling listiger Lurch ist der Ausfall eines Dienstes, der für einen Prozess benötigt wird gleich eine Katastrophe, die eine Notfallorganisation in Zusammenarbeit mit einer externen Hilfsorganisation erfordert. Für Dimitri ist das eine einfache Störung der Geschäftsprozesse, die nach einer bestimmten Zeit behoben ist. Das hätte aber auch unser Medizinmann falscher Hase wissen können.

Die Sache mit den Service Level Agreements

Nun will aber unser Häuptling listiger Lurch wissen, wann denn der Dienst vom Deutschen Haschisch Lieferanten wieder zur Verfügung steht. Seine Stammesbrüder im Lager stehen ja nur dumm herum und die Ware muss ja schließlich raus. Und die dadurch entstehenden Überstunden kosten listiger Lurch ja schließlich auch Geld.

Unser griechischer Austausch Schraubkopf fragt sich an dieser Stelle, wie sind überhaupt die Service Level Agreements des Deutschen Haschisch Lieferanten und Häuptling listiger Lurch antwortet, bis jetzt haben die immer innerhalb von ein bis zwei Werktagen geliefert. Falscher Hase wirft ein, das es auch mal drei oder vier Tage sein können. Dimitri greift sich an die Stirn und klärt unsere beiden Rothäute auf.

Jungs das ist eine Vereinbarung für wiederkehrende Dienstleistung die der weiße Mann mit euch Rothäuten schließt. Da beschreibt der weiße Mann die zugesicherten Leistungseigenschaften, wie Leistungsumfang, Reaktionszeit und Schnelligkeit der Bearbeitung. Unsere beiden Rothäute sehen sich an und sagen im Chor: „Servicelevel was?“

Dimitri denkt sich, okay ich muss konkret werden: „Ein Beispiel ist der Betrieb eures Servers, der 24 Stunden 7 Tage die Woche mit einer Ausfallrate von maximial 0,1% im Jahr und einer Reaktionszeit von 30 Minuten von mir gewährleistet werden soll.“

Falscher Hase meint darauf, das die Shoshone glücklich sein können, das der Schrott von Dimitri an 0,1% der Tage wenigstens einigermaßen funktioniert und man froh sein kann, wenn er am nächsten Tag, wenn die Sonne am höchsten steht, am Horizont erscheint.

Dimitri entgegnet ihm, das die Schoshone eigentlich Schotten sind und noch nicht mal das Geld für die Holzklasse Tier 1 eins ausgeben wollten. Lahmer Mustang wirft daraufhin ein, dass die Shoshone eine Menge Tiere haben, zum Beispiel Hunde und Mustangs. Langsam wird es Dimitri zu bunt.

Mit den Level Tier 1 bis 4 wird angegeben, wie hoch die Ausfallsicherheit eines Rechenzentrums ist.

  • Tier 1:
    Verfügbarkeit: 99,671%,
    Ausfallzeit pro Jahr: 28,8h,
    Komponenten: 1 (keine Redundanz),
    Versorgungsweg: einfach
  • Tier 2:
    Verfügbarkeit: 99,749%
    Ausfallzeit pro Jahr: 22h
    Komponenten: N+1 ,
    Versorgungsweg: einfach
  • Tier 3:
    Verfügbarkeit: 99,982%
    Ausfallzeit pro Jahr: 1,6h
    Komponenten: N+1 ,
    Versorgungsweg: ein aktiver, ein passiver
  • Tier 4:
    Verfügbarkeit: 99,995%
    Ausfallzeit pro Jahr: 0,8h
    Komponenten: 2 x (N+1),
    Versorgungsweg: zwei aktive

Listiger Lurch denkt sich nur, so viele Tiere. Welchen toten Mustang soll ich jetzt reiten.

Um mal den Jüngern der Krabbelgruppe vom Niederrhein die Entscheidung einfach zu machen. Je höher das Tier, desto sicherer das Netzwerk. Und bei einer Verfügbarkeit von 99,995 fällt eine Ausfallzeit pro Jahr von 48 Minuten nun wirklich nicht mehr ins Gewicht. Hat das Rechenzentrum nur Tier eins mit einer Verfügbarkeit von 99.671%, stehen die die Dienste an immerhin 28 Stunden und 48 Minuten den Anwendern nicht zur Verfügung. Und wenn es schlecht läuft sind das mehr als drei Arbeitstage – Shit happens.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.