Ausgangslage:
2 Server mit Windows 2003, Domino 654 FP3 LP Deutsch,
ca 550 User
Der "alte" Server (Dual Proz 3,8GHz, 3,5GB RAM) hat bis vor kurzem ohne Probleme die Last alleine getragen, jetzt ist ein weiterer Server (nahezu identische Leistung, nur etwas neuer) dazu gekommen.
Beide wurden geclustert um Ausfallsicherheit zu erreichen.
Beide haben 2 Netzwerkkarten, unterhalten sich über Ihren Cluster-Port miteinander und über die andere Netzwerkkarte mit den clients.
Seit der Clusterung ist die performance auf dem "alten" Server streckenweise unter aller Sau:
Im Log erscheinen (jeden Tag etwa zur selben Zeit, 9 Uhr morgens und ca. 14:00) viele viele Meldungen, dass er "load balancing off of Server1..." macht, und das öffnen von Datenbanken (speziell von einer sehr grossen CAS- Db (3,5GB) geht gar nicht mehr.
Nach ca. 2-5 Minuten hat er sich wieder gefangen, und alles sieht aus wie vorher.
Zu diesen Zeiten
a) laufen zwar Agents, aber immer unterschiedliche
b) zeigt der Server-Availability-Index eine Verfügbarkeit von über 50 (unser Threshold) an.
c) ist die Prozessorlast (Task-Manager) nicht aussergewöhnlich hoch
d) läuft kein Indexer o.ä. (sh tasks), der das erklären könnte
e) zeigt die statrep.nsf keine aussgerwöhnlichen Werte in den Statistiken zu Platform, Cluster, etc. (haben wir kurzfristig auf 15min. eingestellt)
Der Server scheint einfach nur von aussen "tod" zu sein, und kurz darauf ist wieder alles eitel Sonnenschein. In diesen Perioden lässt sich von der oben erwähnten Datenbank nicht einmal die DB- Eigenschaftsseite öffnen (Netzwerkoperation wurde nicht in angemessener Zeit abgeschlossen), während andere Datenbanken teils ohne Probleme funktionieren.
Die DB als Ursache wurde schon ausgeschlossen: Sie wurde schon komplett gelöscht und vom Clusterpartner als neue Replik neu erstellt.
Hilfe....
Irgend ne Idee, wie ich dem ganzen auf die Schliche komme ?
Thanx
Tode