Autor Thema: Cluster: Performance Probleme  (Gelesen 2146 mal)

Offline Tode

  • Moderatoren
  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 6.883
  • Geschlecht: Männlich
  • Geht nicht, gibt's (fast) nicht... *g*
Cluster: Performance Probleme
« am: 27.04.06 - 14:04:37 »
Ausgangslage:

2 Server mit Windows 2003, Domino 654 FP3 LP Deutsch,
ca 550 User

Der "alte" Server (Dual Proz 3,8GHz, 3,5GB RAM) hat bis vor kurzem ohne Probleme die Last alleine getragen, jetzt ist ein weiterer Server (nahezu identische Leistung, nur etwas neuer) dazu gekommen.

Beide wurden geclustert um Ausfallsicherheit zu erreichen.
Beide haben 2 Netzwerkkarten, unterhalten sich über Ihren Cluster-Port miteinander und über die andere Netzwerkkarte mit den clients.

Seit der Clusterung ist die performance auf dem "alten" Server streckenweise unter aller Sau:
Im Log erscheinen (jeden Tag etwa zur selben Zeit, 9 Uhr morgens und ca. 14:00) viele viele Meldungen, dass er "load balancing off of Server1..." macht, und das öffnen von Datenbanken (speziell von einer sehr grossen CAS- Db (3,5GB)  geht gar nicht mehr.

Nach ca. 2-5 Minuten hat er sich wieder gefangen, und alles sieht aus wie vorher.

Zu diesen Zeiten
a) laufen zwar Agents, aber immer unterschiedliche
b) zeigt der Server-Availability-Index eine Verfügbarkeit von über 50 (unser Threshold) an.
c) ist die Prozessorlast (Task-Manager) nicht aussergewöhnlich hoch
d) läuft kein Indexer o.ä. (sh tasks), der das erklären könnte
e) zeigt die statrep.nsf keine aussgerwöhnlichen Werte in den Statistiken zu Platform, Cluster, etc. (haben wir kurzfristig auf 15min. eingestellt)

Der Server scheint einfach nur von aussen "tod" zu sein, und kurz darauf ist wieder alles eitel Sonnenschein. In diesen Perioden lässt sich von der oben erwähnten Datenbank nicht einmal die DB- Eigenschaftsseite öffnen (Netzwerkoperation wurde nicht in angemessener Zeit abgeschlossen), während andere Datenbanken teils ohne Probleme funktionieren.

Die DB als Ursache wurde schon ausgeschlossen: Sie wurde schon komplett gelöscht und vom Clusterpartner als neue Replik neu erstellt.

Hilfe....

Irgend ne Idee, wie ich dem ganzen auf die Schliche komme ?

Thanx
Tode
« Letzte Änderung: 02.05.06 - 14:49:20 von Tode »
Gruss
Torsten (Tode)

P.S.: Da mein Nickname immer mal wieder für Verwirrung sorgt: Tode hat NICHTS mit Tod zu tun. So klingt es einfach, wenn ein 2- Jähriger versucht "Torsten" zu sagen... das klingt dann so: "Tooode" (langes O, das r, s und n werden verschluckt, das t wird zum badischen d)

Offline knoedel0815

  • Aktives Mitglied
  • ***
  • Beiträge: 167
Re: Cluster: Performance Probleme
« Antwort #1 am: 27.04.06 - 21:47:53 »
Des Rätsels Lösung würde mich auch interessieren.
Wenns aber immer zu bestimmten Uhrzeiten auftritt - gibts vielleicht Verbindungsdoks, die während der Zeiten mit Replikationen loslegen - ggfls. auf anderen Servern?
Wie sieht denn die Netzlast aus?
Was sagt denn "sh ta" bzgl. gerade laufender Agenten (obwohl eigentlich schon beantwortet)?
Gibts evtl. auf OS-Ebene Tasks, die viel CPU ziehen?

Fragen über Fragen...

Offline smoki

  • Senior Mitglied
  • ****
  • Beiträge: 325
  • Geschlecht: Männlich
    • Smoki's Lotus Notes
Re: Cluster: Performance Probleme
« Antwort #2 am: 28.04.06 - 10:11:39 »
Also so ein ungelöstes Phänomän hatte ich auch mal und es ist von selbst verschwunden, aber der Grund würde mich auch interessieren!  8)

Vielleicht verliert er manchmal seinen Default-Port für die Anwender??

Ist die Standard TCP Port auf einer IP genagelt oder dynamisch (vom OS?)... Ich würde diesen auf die IP festlegen! (notes.ini)

TCPIP_TCPIPAddress=0,aa.bb.cc.dd:1352

Gruss
Chris

Driri

  • Gast
Re: Cluster: Performance Probleme
« Antwort #3 am: 28.04.06 - 10:15:46 »
Hast Du schon mal geschaut, ob das evtl. gar kein Domino-Problem ist ? Evtl. rennt da zu den Zeiten ja irgendwas auf OS-Ebene los ?

Offline Tode

  • Moderatoren
  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 6.883
  • Geschlecht: Männlich
  • Geht nicht, gibt's (fast) nicht... *g*
Re: Cluster: Performance Probleme
« Antwort #4 am: 02.05.06 - 10:58:26 »
Danke für die vielen Anregungen, aber leider hilft das alles nicht wirklich weiter.

Ich verfolge das ganze täglich, und habe jetzt folgende (spärliche) Zusatzinformationen sammeln können:

1. Ich konnte das Failovern verringern, indem ich den SERVER_TRANSINFO_RANGE auf 25 hochgesetzt habe, laut einem KB- Eintrag ist derr Standard- Wert von 6 für aktuelle Server viel zu gering.

2. Ausserdem habe ich einen Event- Generator erstellt, der vom neuen Server die Performance des alten Servers per öffnen einer grossen DB überwacht, und der zeigt, dass der Server relativ häufig "beschäftigt" ist (teilweise alle 10 Minuten)

Jetzt eine wirklich neue "Spur": Wann immer der Server1 (alt) für den Server2 (neu) nicht /nur langsam erreichbar ist, laufen kurz vorher Agenten an, die über ODBC Daten aus einer AS/400 auslesen. Kann so ein ODBC- Zugriff das Netz so zumachen, dass ein Server nicht mehr antwortet ?

Ich bin so langsam am verzweifeln und schon fast so weit, den Cluster wieder abzuschalten, damit hier wieder einigermassen "Normal" gearbeitet werden kann.

Irgendwelche Tipps wären toll...

Tode
Gruss
Torsten (Tode)

P.S.: Da mein Nickname immer mal wieder für Verwirrung sorgt: Tode hat NICHTS mit Tod zu tun. So klingt es einfach, wenn ein 2- Jähriger versucht "Torsten" zu sagen... das klingt dann so: "Tooode" (langes O, das r, s und n werden verschluckt, das t wird zum badischen d)

Offline Tode

  • Moderatoren
  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 6.883
  • Geschlecht: Männlich
  • Geht nicht, gibt's (fast) nicht... *g*
Re: Cluster: Performance Probleme
« Antwort #5 am: 02.05.06 - 11:18:00 »
so, jetzt noch mal die Beantwortung aller Fragen:

Die Ports sind Explizit per Notes.ini- Eintrag festgelegt:
TCPIP_TCPIPAddress=0,aa.bb.cc.dd:1352
TCPIPCLU_TCPIPAddress=0,ee.ff.gg.hh:1352

sh port tcpipclu zeigt bei beiden Servern, dass sich die Cluster- Partner über das Cluster- Netzwerk unterhalten (genau wie traces, etc)

Das Betriebssystem tut nix ausser Domino

Agenten:

Wie gerade geschrieben: Es scheint einen Zusammenhang mit Agenten mit ODBC- Zugriffen zu geben... Leider laufen auf dem Server so viele Agenten, dass eigentlich immer irgend was aktiv ist, was die Analyse nicht gerade erleichtert. Die Agenten laufen in "lebensnotwendigen" Datenbanken, können also auch nicht abgeschaltet werden.

Netzlast:

Die bewegt sich irgendwo bei 1- (maximal) 12% (laut Task- Manager) also auch nix grossartiges.

Alle Hinweise führen ins leere....

Gruß
Tode
Gruss
Torsten (Tode)

P.S.: Da mein Nickname immer mal wieder für Verwirrung sorgt: Tode hat NICHTS mit Tod zu tun. So klingt es einfach, wenn ein 2- Jähriger versucht "Torsten" zu sagen... das klingt dann so: "Tooode" (langes O, das r, s und n werden verschluckt, das t wird zum badischen d)

Offline Tode

  • Moderatoren
  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 6.883
  • Geschlecht: Männlich
  • Geht nicht, gibt's (fast) nicht... *g*
Re: Cluster: Performance Probleme
« Antwort #6 am: 02.05.06 - 11:36:24 »
ich krieg die Krise: Ich habe den Server1 (alt) aus dem Cluster rausgenommen (alle Tasks sind beendet, der Server ist erfolgreich raus), und die Probleme BLEIBEN.

Jetzt bin ich auf einer ganz anderen Fährte...
Hat jemand schon mit MCAfee GroupShield gearbeitet ? Kann der einen Server so in die Knie zwingen (Version 5.3) ?

Das wäre der Hammer, wenn Unsere Probleme gar nix mit dem Cluster zu tun hätten...

Tode
Gruss
Torsten (Tode)

P.S.: Da mein Nickname immer mal wieder für Verwirrung sorgt: Tode hat NICHTS mit Tod zu tun. So klingt es einfach, wenn ein 2- Jähriger versucht "Torsten" zu sagen... das klingt dann so: "Tooode" (langes O, das r, s und n werden verschluckt, das t wird zum badischen d)

Offline Tode

  • Moderatoren
  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 6.883
  • Geschlecht: Männlich
  • Geht nicht, gibt's (fast) nicht... *g*
Re: Cluster: Performance Probleme
« Antwort #7 am: 02.05.06 - 14:49:04 »
hmmm.... Seit ich den MCAfee ausgeschaltet habe, gibt es keine Probleme mehr...

Ich denke, der Schuldige wurde gefunden. Jetzt geht's weiter an den NAI- Support...

Jetzt habe ich nur noch ein kleines Problem, wegen dem mache ich aber einen neuen Fred auf.

Danke an alle, die sich Gedanken gemacht haben.

Gruß
Tode
Gruss
Torsten (Tode)

P.S.: Da mein Nickname immer mal wieder für Verwirrung sorgt: Tode hat NICHTS mit Tod zu tun. So klingt es einfach, wenn ein 2- Jähriger versucht "Torsten" zu sagen... das klingt dann so: "Tooode" (langes O, das r, s und n werden verschluckt, das t wird zum badischen d)

 

Impressum Atnotes.de  -  Powered by Syslords Solutions  -  Datenschutz