Der Cluster-Failover wird über den sogenannten "Availability-Index" und den zugehörigen "Availability-Threshold" gesteuert (nachzulesen
hier)
Mit "show cluster" kannst Du Dir den aktuellen Availability Index der im Cluster befindlichen Server anzeigen.
Der Availability-Index berechnet sich nicht rein aus der Prozessor-Last sondern aus verschiedenen Faktoren wie Antwortzeiten, Auslastung, etc.
Wichtig zu wissen: Der Index bezieht sich auf eine theoretische "Höchstlast" des Systems und ist relativ zu dieser berechnet. Das wird später noch wichtig.
Wenn Du möchtest, dass ein Server ab einer bestimmten Belastungsgrenze die User an den Cluster-Partner übergibt, dann setzt Du den notes.ini- Parameter
SERVER_AVAILABILITY_THRESHOLD=x
Dieser Parameter bestimmt, ab welchem Availability Index der Server beginnt, Verbindungen auf den Cluster-Partner abzugeben. Ist z.B. der Threshold 50 und die Availability ist 48, dann gibt er ab, bei einem Index von z.B. 60 behält er die Verbindungen.
Wichtige Ergänzung hierzu: Das "Abwerfen" bei unterschreiten des Threshold passiert nur für NEUE Verbindungen. Die bestehenden Userverbindungen bleiben bestehen, es sei denn man macht einen "drop all", dann werden auch hier die Verbindungen "umverteilt", wenn der Threshold überschritten ist.
Sind beide / alle Server im Cluster unterhalb ihres Threshold passiert nichts, die Benutzer bleiben auf dem Server, den sie kontaktieren.
Es gibt zwei "Spezialwerte" für den Threshold:
SERVER_AVAILABILITY_THRESHOLD=0 bedeutet: Der Server kann nie unter diesen Threshold fallen, gibt also freiwillig nie Verbindungen ab...
SERVER_AVAILABILITY_THRESHOLD=100 bedeutet: Der Server ist IMMER unter dem Threshold, nimmt also freiwillig nie Vebindungen an, es sei denn es ist kein anderer Cluster-Partner verfügbar. Diesen Wert verwendet man, wenn man einen "Hot-Standby"- Cluster erreichen will, wo einer der Partner nur dann was tut, wenn der andere down ist.
Nun zurück zum Thema "Availability Threshold ist relativ".
Der Server "berechnet" den Threshold anhand interner Kriterien. Um verschiedene Server-Ausstattungen dabei "vergleichbar" zu machen, gibt es den sogenannten "Expansion Factor", der -einfach gesagt- die Leistungsfähigkeit der Maschine beschreibt. Dieser geht im Default von einer eher schwachen Maschine aus, so dass der Availability Index zu gering berechnet wird und ein frühes "Abwerfen stattfindet.
Den korrekten Expansion Faktor kann man bestimmen, indem man an der console "show ai" eingibt. Dazu sollte der Server aber schon eine Weile gelaufen sein und zumindest einmal die "Maximale Belastung" erfahren haben.
Der Befehl gibt dann den aktuellen Factor an und eine Empfehlung, wie man den Factor auf dieser Maschine mittels
Set SERVER_TRANSINFO_RANGE=x
setzen sollte.
Wenn man das auf beiden Cluster- Partnern macht und ggf. immer mal wieder mittels show ai prüft, dann kann man mittels geeignetem Threshold eine schöne Verteilung zwischen den Servern erreichen.
Wichtige Information: Die Benutzer kontaktieren für ihr eigenes Mailfile immer zuerst den im Personendokument eingetragenen Mail-Server.
Wenn man die User also auf einem einzelnen Server registriert, wird dieser immer zuerst ausgelastet. Das kann man mitigieren, indem man die Benutzer quasi "abwechselnd" auf den Clusterpartnern registriert, so dass man auf beiden Servern etwa gleich viele Benutzer registriert hat.