Gebe Bernhard Recht.
Verträge zwischen Rechenzentren und Endkunden sehen oft so aus, dass dort eine bestimmte Availability garantiert wird (ich habe gesehen: 95% und 98%).
Es gibt Systeme (highend z.B. bestimmte Tivoli Produkte), die diese availability messen.
Das Thema wird noch komplizierter, wenn nicht nur ein System, sondern mehrere Systeme an einer Anwendung beteiligt sind. Z.B. interessiert es den Anwender nicht, wenn der Domino Server 100% up ist, falls gleichzeitig die DB2, auf die die Anwendung zugreift ist, 50% down ist.
Ähnlich wie übrigens auch bei der geforderten "Performance" bestimmter Funktionalitäten, wo oft auch in Verträgen maximal Zeiten stehen, sollte sich ein Projektteam aus Anwendern und technischen Betreibern auf bestimmte vernünftige Schwellenwerte einigen. Die technischen Betreiber müssen dann versuchen, sicherzustellen, dass der Wert erreicht ist.
Sehr oft wissen die technischen Betreiber aber gar nicht, wie die die Verfügbarkeit ihrer Anwendungen messen können. Das ist ein Problem, da dann die Bewertung der Leistung der technischen Betreiber nicht mehr objektiv nachweisbar ist. So setzen sie sich der Gefahr aus, als unfähige Looser zu gelten, obwohl die von ihnen betreuten Anwendungen 99.8% up sind. Dann nämlich, wenn gerade zufällig in den 0.2% ein mächtiger Mensch in der Fresskette auf die Anwendung zugreift.
Das Thema ist - wie Bernhard schon gesagt hat - komplex. Die Anwender sind nämlich gar nicht an der Server.Availability interessiert, sondern vielmehr an Zugriff auf Business-Funktionen, sprich Anwendungen.
Deren downtime hat aber nicht unbedingt was mit dem Server zu tun. Ursache kann auch unsaubere Programmierung, doofe Projektplanung, fehleranfällige maintainance etc. sein.
<wird_ein_bischen_out_of_topic>
Es gibt inzwischen so coole Tools, dass ich bei angenommen funktionierendem Server, konstanten Netzwerk-Durchsatz, laufender Hardware sehr genau ex-ante messen kann, dass bei dem gleichzeitigen Zugriff von 100 Usern auf die Funktionalität x, die oder jene response-time zu erwarten ist (Last-Test)
So kann man bei einem bestimmten erwarteten Verhalten der Anwender einen Max-Wert von Userzugriffen bestimmen, ab dem es kritisch wird.
Ein sehr faszinierendes Thema, für das ich zu wenig Zeit habe.
</wird_ein_bischen_out_of_topic>