Autor Thema: seltsame Servercrashs  (Gelesen 1066 mal)

Online Wolfgang

  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 1.412
    • Mit dem Fahrrad durch Wüste, Regenwald und Arktis ...
seltsame Servercrashs
« am: 27.02.04 - 12:19:03 »
Hallo zusammen,

ich habe hier eine kleine Batchdatei im Einsatz, die zu bestimmten Zeiten den ein oder anderen Dominoserver beendet und neu startet, um z.B. zeitgesteuert Transactionlogs freizugeben oder Virensignaturen zu aktualisieren.

Das funktionierte auch seit Monaten ohne ein einziges Problem (Domino 5.0.11 auf NT), aber nach dem Update auch Domino 6.5 treten seltsame Phänomene auf.

Der Server fährt runter und beim Neustart bricht er in 80% der Fälle ab. Über Fault Recovery startet er dann erneut. Manchmal klappt es dann, manchmal auch nicht und gelegentlich bricht er dreimal hintereinander ab und das wars dann. Ab und an bricht er nicht ab, sondern bleibt einfach stehen und nichts weiter passiert oder er scheint korrekt hochzufahren, reagiert auch an der Konsole auf Befehle, kann aber von Clients nicht erreicht werden. Und manchmal startet er auch ganz normal.

Wenn ich die Batchdatei per Hand starte, wird der Server nach wie vor _immer_ korrekt beendet und neu gestartet. Ich habe keine Ahnung, wie ich das Problem eingrenzen kann, aber vielleicht hat eine/r von Euch eine Idee?  ... oder kennt eine verständliche Anleitung, wie man die Logprotokolle von NSD verstehen kann?

Gruß
Wolfgang

cybermike

  • Gast
Re:seltsame Servercrashs
« Antwort #1 am: 27.02.04 - 17:40:29 »
Hallo Wolfgang,

zu deinem Problem hab ich leider keine Lösung (6.5er Server haben wir ebenfalls noch keinen im Einsatz). Zum Annotieren der nsd Files kann ich dir aber einige hilfreiche Tips geben:

Wenn einzelne Tasks abschmieren, nach "FATAL" im nsd Log suchen (evt. "CRASH" oder "FAIL" oder "ERROR").

Ergebnis sieht dann so aus:

############################################################
### FATAL THREAD 1/5 [ nupdate:07b0: 1964]
### FP=0012e8cc, PC=60054d83, SP=0012e8b0, stksize=28
Exception code: c0000005 (ACCESS_VIOLATION)
############################################################
@[ 1] 0x60054d83 nnotes._NSFComputeSetFileInfoFast@20+35 (0,7ff,12ea88,0)
@[ 2] 0x60080cd8 nnotes._NSFComputeSetFileInfo@12+24 (0,7ff,12ea88,1d85f67e)

Der schuldige Thread ist also der update; "07b0" ist die ThreadID.  Sucht man nocheinmal nach "FATAL", bekommt man zusätzlich zu den Funktionen den Callstack aufgelistet:

############################################################
### PASS 2 : FATAL THREAD with STACK FRAMES 1/5 [ nupdate:07b0: 1964]
### FP=0012e8cc, PC=60054d83, SP=0012e8b0, stksize=28
Exception code: c0000005 (ACCESS_VIOLATION)
############################################################
# ---------- Top of the Stack ----------
       # 0012e8b0  1f0f00cc 0012ec6c 0012e9e4 f01c11d5  |....l...........|
       # 0012e8c0  0012ffb0 609ad2b0 ffffffff 0012e8e8  |.......`........|

Du kannst aber auch direkt die Thread ID suchen - so kommst du dann auch an die wichtigen Informationen.

Man findet häufig im Callstack den Datenbank-Namen, die LotusScript-Prozedur oder den Agentnamen (welche zu dem Zeitpunkt "in use" sind).

Steht kein Name drin, ist die ebenfalls im nsd enthaltenen Liste der offenen Files sehr hilfreich (nach "open databases" suchen)

Hoffe das hilft dir, das nsd File zu analysieren, und somit den Fehler bzw. die Ursache deiner Abstürze zu finden.

 

Impressum Atnotes.de  -  Powered by Syslords Solutions  -  Datenschutz