Dr. Carsten Jörns
28. August 2014 1
Cloud

Cloud mit Zukunft: Qualität zählt

Cloud ist eines der Top-Themen, der kommenden Jahre, nicht nur bei T-Systems. Die Kernbotschaft ist, dass Cloud nicht als ein Hype gesehen werden kann und darf, sondern als das Modell der Zukunft. Konsequenterweise wird dies dadurch unterstrichen, dass nahezu alle künftigen T-Systems Produkte oder Releases auf der Cloud-Technologie basieren oder sie es bereits heute schon tun. So weit so gut und bekannt.

In meinem Beitrag will ich dazu die Frage beleuchten: Was bedeutet dies für das tägliche Arbeiten, vor allem mit Blick auf das Qualitätsziel „Zero Outage“ (also Null Fehler oder keine Ausfälle)?
Die Antwort ist dabei recht einfach:

Nichts und alles!

  • Nichts, da Zero Outage selbstverständlich auch für alle Cloud-Plattformen gilt.
  • Alles, weil das Wort „Zero“ in Zero Outage bei Cloud-Plattformen viel breiter wirkt. Denn ein Ausfall hätte unter Umständen Auswirkungen auf einen großen Kundenkreis dieser Plattform.

Von daher ist Zero Outage bei Cloud nicht nur ein Anspruch, sondern ein Muss.

Nehmen wir ein einfaches Beispiel aus dem Alltag: Letztlich hat jeder Nutzer, die selbe Erwartungshaltung, wenn er sein Tablet, Smartphone oder den Rechner einschaltet: Die Dienste sollen jederzeit verfügbar und performant zur Verfügung stehen – bei einem Top-Produkt ist Top-Qualität eben unumgänglich.
Bezogen auf die Cloud und unsere Anteile als T-Systems daran, bedeutet dies, nichts weniger als dass alle Ebenen eines technisch komplexen Cloud-Produktes – von der Stromversorgung des Rechenzentrums bis hin zur graphischen Aufbereitung der Applikation – jederzeit funktionieren. Dieser Grundsatz gilt bereits heute bei den „klassischen Produkten“ und muss insbesondere auf die Cloud-Produktpalette ausgeweitet werden.

Cloud heißt: alles ist wichtig!

Bei Cloud-Produkten kann nur in wenigen Fällen davon ausgegangen werden, dass man sich bei einer umfangreichen Wartung eng mit jedem einzelnen der betroffenen Kunden abstimmen kann. Hintergrund ist, dass in Cloud-Umgebungen fast alle Komponenten von vielen Kunden genutzt werden, nicht zuletzt durch den hohen Grad der Virtualisierung. Dieses Prinzip wirkt sich in allen anderen ITIL-Prozessen aus, so auch im Störungsfall: Der Ausfall einer (virtuellen) Komponente im Cloud-Stack kann sich an vielen Stellen niederschlagen und somit auch viele Kunden betreffen – man denke dabei an einen der vielen Switches, die eingesetzt werden.

Somit ist der Null-Fehler-Ansatz in der Cloud besonders wichtig. Hier bedeutet Zero Outage gleich Mehreres:

  • Ein absolut zuverlässiges Monitoring, das Störungen entdeckt, bevor sie entstehen
  • Außerordentlich schnelle Behebungsmechanismen
  • Alle Ebenen müssen zusätzlich durch Redundanzen abgesichert werden
  • Alle vorgenannten Teile müssen kontinuierlich getestet werden, um deren Wirksamkeit zu gewährleisten

Vor allem zeigt sich, dass das Prinzip Cloud – neben den bekannten und täglich gelebten Qualitäts-Methoden – ein sauber verzahntes Design aller Betriebs-Prozesse mit dem Release-Zyklus der Produkte selbst benötigt. Bereits beim Produkt-Design müssen Ausfälle durch höchste Redundanz abgesichert werden. Außerdem ist ein Produkt so zu gestalten, dass Release-Upgrades durchgeführt werden können, ohne den Betrieb zu beeinträchtigen. Dies ist besonders wichtig, wenn es um den Übergang neuer Features in den Betrieb oder das Starten neuer Dienste geht. Die muss ebenso reibungslos abgewickelt werden können wie das Meistern eines Ausfalls in einem Layer.

Experten sind der Schlüssel

Neben der Technik sind also Menschen gefragt, die diese Komplexität beherrschen und so ausfallsicher gestalten, dass Zero Outage bereits ein integrierter Bestandteil des Produktes selbst ist und nicht nur des Betriebes.
Darüber hinaus bedarf es angesichts der zu beherrschenden Komplexität Werkzeuge, die den Menschen den Ein- und Durchblick beziehungsweise auch den Durchgriff auf die jeweils wichtigen Aspekte ermöglichen. Insbesondere ist eine hochgradige Automatisierung nötig, die alle relevanten Ereignisse ständig überwacht und situationsgerecht notwendige Prozesse entweder selbsttätig ausführt, oder Operatoren darauf hinweist, entsprechende Schritte zu einem Prozess beizutragen. Genauso muss die neue Umgebung in der Lage sein festzustellen, ob während eines Teilausfalls oder nach einer Änderung der Service für alle potenziell betroffenen Kunden wieder in vollem Umfang zur Verfügung steht, um nicht auf Störungsmeldungen warten zu müssen, sondern proaktiv arbeiten zu können.

Zero Outage-Kultur etablieren

Nicht zuletzt noch ein wichtiger Aspekt, der leicht vergessen wird: Ein Schlüssel zur echten Zero-Outage-Kultur ist, dass diese nicht außerhalb unserer eigenen Tür Halt machen kann. Da unsere Cloud-Angebote oft im Zusammenspiel mit Partnern und Lieferanten geliefert werden – oder auf deren Offerings basieren – werden diese von Anfang an mit in das Design der Produkte und übergreifenden Prozesse von T-Systems einbezogen. Nur so ist wirklich absolut gewährleistet, dass im Fall der Fälle alle Kräfte verfügbar sind, um den Service stabil zu halten. Bei T-Systems wird dies durch das bestehendes Zero Outage-Supplier-Programm sichergestellt.

Zusammenfassend lässt sich somit festhalten: Zero Outage in der Cloud heißt nichts weniger als Zero Outage zu hundert Prozent in unser Denken, Planen und Handeln zu verankern und bei allen schnellen Schritten nach vorne immer auch im Blick zu haben.

Dr. Carsten Jörns

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

Mit dem Absenden des Kommentars akzeptieren Sie unsere Kommentar-Policy.

a) Leser sind herzlich zum Kommentieren eingeladen.

b) Kommentare sollten den Wert des Weblogs erhöhen.

c) Bitte haben Sie Verständnis dafür, dass wir Kommentare erst nach Prüfung frei schalten.

d) Kommentare, die nichts mit dem Thema des Beitrags zu tun haben, offensichtlich Urheberrechte verletzen, beleidigenden Inhalt oder persönliche Angriffe enthalten, werden gelöscht.

e) Links können gerne eingebunden werden, sollten aber zum Thema des jeweiligen Blog-Postings gehören. Links zu anderen Webseiten oder Blogs, die nichts mit dem jeweiligen Blog-Posting zu tun haben, werden als Spam angesehen und gelöscht.

 
 

Twitter

tsystemsde @tsystemsde
T-Systems DE  @tsystemsde
Start der #HM17 in Hannover: Die @deutschetelekom und #TSystems freuen sich auf Ihren Besuch in Halle 7! https://t.co/hwTpLIMxRJ 
T-Systems DE  @tsystemsde
Die letzten Vorbereitung für den morgigen Start der @hannover_messe laufen - wir freuen uns auf alle Besucher #HM17 https://t.co/AWsrq2wsbm 
T-Systems DE  @tsystemsde
Alle Kollegen/innen des Innovation Centers sind mit ihrem Equipment in Hannover angekommen und freuen sich auf inte… https://t.co/ehaSDWI8js 
T-Systems DE  @tsystemsde
Wir begrüßen SALT auf unserem Stand der @hannover_messe - er wird uns bei den Präsentationen kommende Woche unterst… https://t.co/trsHderyYO 
T-Systems DE  @tsystemsde
Die „Biene“ @roam_bee hat geliefert - der Aufbau des #TSystems Innovation Center auf der @hannover_messe ist fast f… https://t.co/oEehmjPRx8 
T-Systems DE  @tsystemsde
So sieht die fleißige "Biene" @roam_be im Einsatz aus - Transport des eBikes nach Hannover #HM17 https://t.co/yq1BS5wvT4 
T-Systems DE  @tsystemsde
Wieder unterwegs - die Transportüberwachungslösung @roam_be begleitet zwei #TSystems Kollegen, die ein eBike nach H… https://t.co/kVAHCzIYXs