Autor Thema: Cluster-Failover, bei Erreichbarkeit aber 0 Performance eines Clusterpartners? (Gelesen 1802 mal)

hasebergen · « **am:** 17.10.24 - 07:32:46 »

Moin,

normalerweise werden in einem Domino-Cluster User via Failover ja redirected, wenn der eine Clusterpartner nicht erreichbar ist (gecrasht etc.) Wenn ein Server aber schon grundsätzlich erreichbar ist, nur durch andere Prozeße dessen Performance am Boden liegt und so quasi für die User nicht nutzbar ist, gibt es Einstellmöglichkeiten, auch schon in diesem Falle einen Redirect auf den Clusterpartner zu veranlassen?
Praxis:
Wir hatten diesen Fall in einem Mailcluster (D 12.02FP1), dessen einer Partner eine CPU-Auslastung von 100% hatte, aber grundsätzlich erreichbar war, so daß die dortigen User "drauf" waren, aber nicht wirklich arbeiten konnten. Die hätten wir natürlich lieber auf dem anderen - CPU-mäßig im grünen Bereich befindlichen Clusterpartner.

Grüße Hannes

Tode · « **Antwort #1 am:** 17.10.24 - 10:21:59 »

Der Cluster-Failover wird über den sogenannten "Availability-Index" und den zugehörigen "Availability-Threshold" gesteuert (nachzulesen hier)

Mit "show cluster" kannst Du Dir den aktuellen Availability Index der im Cluster befindlichen Server anzeigen.
Der Availability-Index berechnet sich nicht rein aus der Prozessor-Last sondern aus verschiedenen Faktoren wie Antwortzeiten, Auslastung, etc.
Wichtig zu wissen: Der Index bezieht sich auf eine theoretische "Höchstlast" des Systems und ist relativ zu dieser berechnet. Das wird später noch wichtig.

Wenn Du möchtest, dass ein Server ab einer bestimmten Belastungsgrenze die User an den Cluster-Partner übergibt, dann setzt Du den notes.ini- Parameter

SERVER_AVAILABILITY_THRESHOLD=x

Dieser Parameter bestimmt, ab welchem Availability Index der Server beginnt, Verbindungen auf den Cluster-Partner abzugeben. Ist z.B. der Threshold 50 und die Availability ist 48, dann gibt er ab, bei einem Index von z.B. 60 behält er die Verbindungen.
Wichtige Ergänzung hierzu: Das "Abwerfen" bei unterschreiten des Threshold passiert nur für NEUE Verbindungen. Die bestehenden Userverbindungen bleiben bestehen, es sei denn man macht einen "drop all", dann werden auch hier die Verbindungen "umverteilt", wenn der Threshold überschritten ist.

Sind beide / alle Server im Cluster unterhalb ihres Threshold passiert nichts, die Benutzer bleiben auf dem Server, den sie kontaktieren.

Es gibt zwei "Spezialwerte" für den Threshold:

SERVER_AVAILABILITY_THRESHOLD=0 bedeutet: Der Server kann nie unter diesen Threshold fallen, gibt also freiwillig nie Verbindungen ab...
SERVER_AVAILABILITY_THRESHOLD=100 bedeutet: Der Server ist IMMER unter dem Threshold, nimmt also freiwillig nie Vebindungen an, es sei denn es ist kein anderer Cluster-Partner verfügbar. Diesen Wert verwendet man, wenn man einen "Hot-Standby"- Cluster erreichen will, wo einer der Partner nur dann was tut, wenn der andere down ist.

Nun zurück zum Thema "Availability Threshold ist relativ".

Der Server "berechnet" den Threshold anhand interner Kriterien. Um verschiedene Server-Ausstattungen dabei "vergleichbar" zu machen, gibt es den sogenannten "Expansion Factor", der -einfach gesagt- die Leistungsfähigkeit der Maschine beschreibt. Dieser geht im Default von einer eher schwachen Maschine aus, so dass der Availability Index zu gering berechnet wird und ein frühes "Abwerfen stattfindet.

Den korrekten Expansion Faktor kann man bestimmen, indem man an der console "show ai" eingibt. Dazu sollte der Server aber schon eine Weile gelaufen sein und zumindest einmal die "Maximale Belastung" erfahren haben.

Der Befehl gibt dann den aktuellen Factor an und eine Empfehlung, wie man den Factor auf dieser Maschine mittels

Set SERVER_TRANSINFO_RANGE=x

setzen sollte.

Wenn man das auf beiden Cluster- Partnern macht und ggf. immer mal wieder mittels show ai prüft, dann kann man mittels geeignetem Threshold eine schöne Verteilung zwischen den Servern erreichen.

Wichtige Information: Die Benutzer kontaktieren für ihr eigenes Mailfile immer zuerst den im Personendokument eingetragenen Mail-Server.
Wenn man die User also auf einem einzelnen Server registriert, wird dieser immer zuerst ausgelastet. Das kann man mitigieren, indem man die Benutzer quasi "abwechselnd" auf den Clusterpartnern registriert, so dass man auf beiden Servern etwa gleich viele Benutzer registriert hat.

Werner Götz · « **Antwort #2 am:** 18.10.24 - 07:00:17 »

again what learned

Danke Torsten für diese gute Erklärung!
-Werner

hasebergen · « **Antwort #3 am:** 21.10.24 - 08:12:09 »

Moin Torsten,

man lernt nie aus ... auch von mir besten Dank :-)

VG Hannes

Tode · « **Antwort #4 am:** 21.10.24 - 09:35:30 »

Wichtige Ergänzung: Das "Abwerfen" bei unterschreiten des Threshold passiert nur für NEUE Verbindungen. Die bestehenden Userverbindungen bleiben bestehen, es sei denn man macht einen "Drop all", dann werden auch hier die Verbindungen "umverteilt", wenn der Threshold überschritten ist.

Autor Thema: Cluster-Failover, bei Erreichbarkeit aber 0 Performance eines Clusterpartners? (Gelesen 1802 mal)

hasebergen

Cluster-Failover, bei Erreichbarkeit aber 0 Performance eines Clusterpartners?

Tode

Antw:Cluster-Failover, bei Erreichbarkeit aber 0 Performance eines Clusterpartners?

Werner Götz

Antw:Cluster-Failover, bei Erreichbarkeit aber 0 Performance eines Clusterpartners?

hasebergen

Antw:Cluster-Failover, bei Erreichbarkeit aber 0 Performance eines Clusterpartners?

Tode

Antw:Cluster-Failover, bei Erreichbarkeit aber 0 Performance eines Clusterpartners?