Wir haben hier auf verschiedenen Servern sporadisch folgendes Problem:
Plötzlich reagiert der Server nicht mehr auf Verbindungsanfragen (weder Clients noch Admins). Obwohl der Server im Cluster ist, finden keine Failovers statt, bzw. der Failover dauert SEHR lange, weil der Server wohl noch irgendwie "rudimentär" antwortet...
An der Console ist alles normal:
Befehle lassen sich ausführen, Tasks starten und beenden, und der Server scheint fast "gelangweilt":
- Platten IO ist niedrig
- Prozessor ist nicht annähernd ausgelastet
- Memory ist mehr als genug frei
Ein Blick auf die Statistiken (und eine stündliche Überwachung ebendieser) hat gezeigt, dass die Anzahl User- Sessions plötzlich und sprunghaft von ca. 300 auf über 4000 ansteigt.
Der Server scheint sich dann mit den Sessions zu Tode zu verwalten.
Ein
drop all
an der Serverkonsole behebt -wie wir jetzt festgestellt haben- das Problem: Alle Benutzer können wieder normal arbeiten.
Das ganze passiert auf mehreren Servern in der Domain, einer davon ist KEIN Clustermember, so dass wir das eigentlich ausschliessen können. Bei diesem hatten wir im übrigen auf einmal 20.000 sessions....
Da wir das mit dem Drop all gerade erst herausgefunden haben, untersuchen wir gerade, wer die vielen Sessions öffnet, aber auf den ersten Blick sieht es so aus, dass einfach jeder User und jeder verbundene Server (andere Mail- Server, Blackberry- Server, der Cluster- Partner) multiple sessions aufmacht und nicht wieder schliesst.
Kennt jemand dieses Phänomen?
Ein SPR wird natürlich gerade eröffnet, trotzdem wüsste ich gerne, ob jemand ähnliche Erfahrungen gemacht hat.
Ach ja: Die User arbeiten alle mit "Local Office", also mit einer lokalen Replik der Mailfile, die im Intervall repliziert wird.
Für jeden Tipp bin ich dankbar, Google und IBM KB haben nichts ausgespuckt, aber vielleicht habe ich ja auch nur mit den falschen Begriffen gesucht.