Tier-Klassifizierung des Uptime Institute

Sie lernen die Tiers des Uptime Institute sowie ihre Bedeutung für Betriebssicherheit und Redundanz in Rechenzentren kennen.

In diesem Modul erhalten Sie eine Einführung in die Klassifizierung von Rechenzentren basierend auf Tiers des Uptime Institute. Sie erfahren, welche vier Tiers es gibt und welche Bedeutung ihnen in Bezug auf die Betriebssicherheit und die Redundanz in der Infrastruktur von Rechenzentren zukommt.

Die Klassifizierung von Rechenzentren erfolgt anhand von vier Tiers, die vom Uptime Institute definiert wurden. Diese Tiers sind nicht hierarchisch, sondern stehen für unterschiedliche Anforderungen, wobei jeder Tier die der darunter liegenden umfasst. Tier IV umfasst beispielsweise alle Merkmale von Tier III plus erhöhte Betriebssicherheit und Redundanz. Jeder Tier verfügt über eine bestimmte Redundanzstufe, dargestellt als „N“. „N“ ist die Basiskapazität. Dabei verfügt ein Rechenzentrum über alles, was für den Betrieb benötigt wird, aber es gibt nichts, um den Ausfall oder die Wartung der Ausstattung aufzufangen. Alles, was über N hinausgeht, bietet dem Rechenzentrum zusätzliche Sicherheit. Die Klassifizierung nach Tiers berücksich- tigt auch die operative Nachhaltigkeit mit Fokus auf Managementverfahren und Risikominderung mit dem Ziel, langfristige Geschäftsziele zu unterstützen.

Schauen wir uns nun die Tiers an.

Tier I: Eine solche Anlage liefert Strom und Kühlung für die volle IT-Last, bietet aber keine Redundanz für kritische Systeme und muss daher für Wartung oder Reparaturen vollständig heruntergefahren werden. Die zentralen Anforderungen:

  • Eine unterbrechungsfreie Stromversorgung (USV) für Stromspitzen und Ausfälle.
  • Ein ausgewiesener Bereich für IT-Systeme.
  • Ein Motor-Generator.
  • Spezielle Kühlanlagen, die außerhalb der Bürozeiten laufen.

Mit einer höchsten zulässigen Ausfallzeit von bis zu 28,8 Stunden pro Jahr verfügen Tier-I-Rechenzentren über keinerlei Redundanz. Dies führt zu einer jährlichen Verfügbarkeit von 99,671 %, der niedrigsten unter den vom Uptime Institute bewerteten Einrichtungen.

Tier II: Tier-II-Rechenzentren umfassen alle Tier I-Funktionen und zusätzlich Rückfalloptionen für einen höheren Schutz bei Störungen. Diese Rechenzentren verfügen über:

  • Zusätzliche Motor-Generatoren.
  • Energiespeicher.
  • Kühler.
  • Doppelböden.
  • USV-Module.
  • Pumpen.
  • Ausrüstung zur Wärmeabführung.
  • Kraftstoffbehälter und -zellen.
  • Zusätzliche Kühlaggregate.

Trotzdem verfügen Tier-II-Rechenzentren nur über einen einzigen Verteilungspfad für Strom und Kühlung, was sie anfällig für unerwartete Störungen macht. Zulässig sind 22 Stunden Ausfallzeit pro Jahr mit einer Verfügbarkeit von 99,741 %. Redundanz ist nur teilweise gegeben und das System ist nicht fehlertolerant.

Tier III: Die meisten Rechenzentren sind nach Tier III des Uptime Institute zertifiziert. Sie ermöglichen mit redundanten Strom- und Kühlwegen die Wartung im laufenden Betrieb, um Abschaltungen bei Wartungs- oder Austauscharbeiten zu vermeiden. Dank N+1-Redundanz ist der Betrieb auch bei Ausfall einer Komponente gewährleistet. Tier-III-Einrichtungen erfordern eine Rückfalllösung für mindestens 72 Stunden Betrieb nach einem Ausfall, die maximal 1,6 Stunden Ausfallzeit pro Jahr verspricht, was einer Verfügbarkeit von 99,982 % entspricht. Sie bieten viele Vorteile von Tier IV, aber mit etwas weniger umfassendem Schutz.

Tier IV: Tier-IV-Rechenzentren erweitern Tier-III-Designs mit Fehlertoleranz dank doppelter Stromversorgung und mehrerer unabhängiger Verteilungspfade. Sie erfordern:

  • Zwei Generatoren, USV-Systeme und Kühlanlagen für alle Komponenten.
  • Unabhängige Verteilungswege zur Vermeidung kaskadierender Fehler.
  • Fortführung des Betriebs für mindestens 96 Stunden nach einem Stromausfall ohne externe Stromquellen.
  • Physische Trennung redundanter Systeme, um gleichzeitige Schäden zu vermeiden. Diese Maßnahmen sind entscheidend für die erweiterte Fehlertoleranz von Tier IV und einen ununterbrochenen Betrieb.

Tier-IV-Rechenzentren weisen 2N- oder 2N+1-Redundanz auf, also vollständig duplizierte Systeme oder doppelte Kapazität mit einer zusätzlichen Rückfalloption, die bei Ausfällen den kontinuierlichen Betrieb sicherstellt. Sie garantieren maximal 26,3 Minuten Ausfallzeit pro Jahr, was einer jährlichen Verfügbarkeit von 99,995 % entspricht. Wegen möglicher Wartungsprobleme ist keine 100%ige Verfügbarkeit garantiert, aber Tier-IV-Einrichtungen stellen sicher, dass der Betrieb der Kunden nicht beeinträchtigt wird, da es für kritische Dienste mehrere Rückfallsysteme gibt. Dies ist Voraussetzung für den Erhalt der Tier-IV-Zertifizierung. 

Bei Rechenzentren sind mehrere wichtige Faktoren für den effizienten Betrieb zu berücksichtigen, unter anderem:

  • Geschwindigkeit und Agilität.
  • Verfügbarkeit.
  • Kreislaufwirtschaft.
  • Vertrauen und Zuverlässigkeit.
  • Sicherheit.
  • Tier-Zertifizierung.
  • Redundanz.
  • Power Usage Effectiveness (PUE). PUE ist das Maß für die Energieeffizienz von Rechenzentren und gibt das Verhältnis des Gesamtenergieverbrauchs der Anlage zum Energieverbrauch der IT-Geräte an.
  • Water Usage Effectiveness (WUE). WUE ist eine von The Green Grid entwickelte Nachhaltigkeitskennzahl und gibt an, wie viel Wasser im Verhältnis zum Strom- verbrauch der IT-Geräte verbraucht wird.

Eine zuverlässige Kühlanlage ist für Rechenzentren unverzichtbar. Eine sorgfältige Planung ist daher unerlässlich, um einen reibungslosen Betrieb ohne Probleme zu gewährleisten.

Kursübersicht

Module
Module: 6
Dauer
Dauer: 35 Minuten
Schwierigkeitsgrad
Schwierigkeitsgrad: Mittel