Das Notes Forum
Domino 9 und frühere Versionen => ND6: Administration & Userprobleme => Thema gestartet von: Hugin am 17.06.08 - 11:35:33
-
Hallo,
auf einem meiner Server läuft der Task nupdate.exe 4x und hat pro Task zwischen 700 und 780MB
da ich seit einiger Zeit auch mit häufigen Serverabstürzen zu kämpfen habe.
Im Log aber steht nichts, bin ich auf der Suche nach Ursachen bei der RAM auslastung gelandet.
Der Server läuft auf einem Windows Server 2003 (32 bit). Da dort nur etwas über 3GB zur Verfügung stehen kommt mir die Vermutung das es wohl damit zusammenhängen könnte.
Die nupdate.exe aktualisiert doch "nur" die Indexe der Datenbanken.
Nun zu meinen Fragen:
Das der Prozess nupdate.exe 4 mal gestartet wird ist normal?
Die Größe auch?
Kann ich die Anzahl und Grösse der Tasks begrenzen?
Gruß
Hugin
-
Hallo Hugin,
meines Wissens nach ist es so, dass bei dir vier Indexer gleichzeitig laufen können, die sich im Task-Manager als nupdate.exe zeigen. Jeder wird für sich angezeigt, jedoch ist die RAM-Anzeige für die einzelnen Prozesse irreführend, da dies nicht zusammengerechnet wird, sondern die Werte sich immer aktualisieren, sobald der erste, zweite usw. Indexer gelaufen ist. Der größte Wert ist also meines Wissens nach der Aussagekräftige.
Gruß
Thomas
-
Ach ja, der verantwortliche Update Task und die Einstellungsmöglichkeiten finden sich in der Administrator-Hilfe Einfach mal Indexer eingeben und sich den Task anschauen.
Gruß
Thomas
-
Danke für die Hinweise,
wenn es sich mit der Speicherbrechnung für den Agentmanager
ähnlich verhält, weis ich warum er nicht noch öfter abstürzt.
Wo würdet ihr den die Ursache für einen Serverabsturz suchen?
In den Logs oder auch in den Windowsevents finde ich leider keinen Hinweis.
So ein paar Stichworte würden mir schon helfen.
-
Hallo,
Wo würdet ihr den die Ursache für einen Serverabsturz suchen?
Immer zuerst im nsd-file
Gruß Werner
-
Tja, da finde ich leider auch nix.
Hmhm.
Fühlt sich jemand für Server Absturzursachen-Suche ohne Anhaltspunkte im Raum Wiesbaden berufen?
Gute Nerven und Göttliche Eingebung am besten mitbringen.
Falls ja werde ich mal mit meinem Chef verhandeln was sich machen lässt.
Oder könnt ihr jemand mit entsprechenden Eigenschaften empfehlen?
Achja, zur Vorwarnung es ist ein gewachsenes System und als Ansprechpartner gibt es nur jemand der das System so vor ein paar Monaten geerbt hat.
D.H. schulterzucken muss manchmal als Antwort genügen.
Speziell bei der Frage was sich der Erbauer wohl dabei gedacht hat.
Gruß
Hugin
-
Hallo,
"nur immer langsam mit den jungen Pferden"
Wo hast Du denn nach dem nsd / den nsd´s gesucht?
Gruß Werner
-
Ich habe versucht aus der Logdatei in dem Verzeichnis
Data\IBM_TECHNICAL_SUPPORT
etwas rauszulesen. Ausser Endlosen Dateilistings fand sich gerade mal am Ende etwas interessantes was mir aber leider nicht weitergeholfen hat.
Vorhin habe ich zufällig den Absturz auf der Serverkonsole gesehen.
Der letzte Eintrag war das er ein Mail abgwiesen hat... wie unzählige vorher.
NSD lief und kurz darauf war er weg.
Immerhin ist mir aufgefallen das das Backup zu der Zeit noch lief.
Aber das hat eigentlich einen eigenen Notesagenten für die Sicherung.
Gruß
Hugin
-
Hallo Hugin,
such im File nach Fatal, Panic, error.
LG
Hans
-
Hallo,
wie Hans sagt, öffne die letzen nsd..... Dateien und suche nach Fatal,
evtl. kanns Du ja auch mal einen Auschnitt daraus (die Zeile mit fatal und einige darunter) hier posten.
Du kannst Die nsd-files auch gezippt an IBM zur Auswertung senden wenn Du dafür eine PMR aufmachst.
Oder das IBM tool dafür verwenden.
Aber ich bin fast sicher, dass es am 3GB Ram nicht liegt.
Gruß Werner
-
@Hans
das verkürzt die Suche erheblich, bringt aber leider auch kein Ergebnis.
Nur für Error gibt ein paar Treffer in Filenamen.
Aber nichts was auf ein Problem des Servers kurz vor dem reboot hindeutet.
@WernerMo
Beim letzten Absturz hab ich auf den Specicher geschaut ....
Es waren nicht die 3 GB, Norton hatte wohl Recht mit der Berechnung.
Dann kommt der benutze Bereich ungefähr hin.
Nur eine Logdatei so glänzend wie ein Babypopo...
Zumindest die mit der Uhrzeit des Absturzes.
Die Logdatei vom Neustart hat einige Einträge mit
"FATAL"
btw. kann mir jemand sagen worauf diese Meldung abzielt?
"----------- Monitor Clients ---------
ERROR (0): Monitor client data is corrupted
0 0 [ 0:4294967295] [ 0:4294967295] [ 0:4294967295] [ 0:4294967295]"
Hugin
Gruß
Hugin
-
Hallo
in diesem Verzeichnis muss es Dateien geben, die mit "nsd" anfangen, und die Endung ".log" haben,
z.b. nsd_W32I_xServernamex_2008_06_18@10_03_45.log
vor dem "@" steht immer das Datum, hinter dem @ immer die Uhrzeit.
Gruß Werner
-
Jupp, die habe ich.
Das erstellen des Files dauerte solange das ich dachte das gehört zum Neustart.
Immerhin, da gib es auch diverse Einträge die auf Probleme zeigen.
Ich hab mal 4 mir auffälige Warnungen rausgesucht, vieleicht sagt euch das was.
1________________________________________________________________________
entry 2: OPEN FD: -4 FileName: d:\notedata\~notes.lck
WARNING (3): can't get process 23330816 status
accessor 1: [ ???:1640000:20000] OSFD: 14942210, RefCnt=65536, Next: 0
entry 3: OPEN FD: -5 FileName: e:\Translog\S0000009.TXN
2________________________________________________________________________
Mapped proc vaddr 7fdf0000 to 761b0000 segsz=1003520
ERROR (5): can't access process [ nrouter:1688] memory @0x29b20000 - (0) unknown
3________________________________________________________________________
INFO: (memcheck) 1521 errors, 669 warnings
DBG(11c8) 12:42:10
@@@@@@@@@@@@@@@@@ Performance Data @@@@@@@@@@@@@@@@@
Total Physical Memory: 2.0G
Avail Physical Memory: 770.0M
Memory Usage : 78%
Total Paging File : -1
Avail Paging File : 2.2G
Total Virtual Memory: 2.0G
Avail Virtual Memory: 1.5G
4________________________________________________________________________
##########################################################
### PASS 2 : FATAL THREAD with STACK FRAMES 8/39 [ nrouter:1688:0980]
### FP=2096e278, PC=600019de, SP=2096e250, stksize=40
Exception code: c0000005 (ACCESS_VIOLATION)
#####################################################
2 +4 deuten auf den Notesrouter hin. Dieser Eintrag ist auch sehr häufig identisch untereinander.
Der letzte Eintrag in der Konsole war bisher auch immer ein abgewiesenes Mail, aber irgendwie kann ich mir nicht vorstellen das er deshalb schmollt.
Appropo, welches IBM Tool meintest du?
Gruß
Hugin
-
Vielleicht ist nur die MAIL.BOX korrupt?
Bernhard
-
Appropo, welches IBM Tool meintest du?
Dieses (http://atnotes.de/index.php?topic=41079.0)
-
Hallo,
du vermutest richtig, dass es am router-task liegt, und da liegt wieder die Vermutung von Bernhard nahe, dass eine Mail.box korrupt (oder "übergelaufen") ist.
Kannst Du die Mail.box(en) öffnen?
Wie viele tote Mails sind da drin,
wie groß sind die Mail.box?
Was steht im Logfile (Mailrouting) auffallendes?
Gruß Werner
-
Vielleicht ist nur die MAIL.BOX korrupt?
Bernhard
Wir haben 2 und eine, manchmal 2 erwischt es öfter mal.
Das letzte mal habe ich sie vor ca. 1 Woche neu angelegt.
Aber die bleiern doch sonst nicht alle 2 Tage ab, zumindest
bei uns liefen die früher deutlich länger ;-)
@tks: danke
-
Hallo,
das must Du genauer erklären, bei uns "laufen" die ewig.
Was macht ihr, dass die "ab bleiern" (?)
Gruß Werner
-
Tja, da fragste was.
Eigentlich haben wir kein so grosses System, einen Mailcluster und 4 weitere Notesserver
Die Mails kommen vom Brightmailserver zu dem Notesserver.
Als "Erweiterung" haben wir noch die IQ Suite 8.6 laufen.
Die habe ich zwischendrin auch immer mal im Verdacht.
Den tm_grab lasse ich derzeit nachts neu starten, aber ich weis nicht ob er wirklich was damit zu tun hat,
derzeit siehts nicht so aus.
Wenn eine der mail.box hängt, erstelle ich eine neue und kopiere den Inhalt der alten in die neue mail.box,
woraufhin die Zustellung problemlos läuft.
Bis zum nächsten mal das die mail.box corrupt ist. das passiert im Schnitt alle 2-4 Monate mal.
Beim schreiben fiel mir eben auf, das mir hier doch letztens was ungewöhnliches war.
Wie ich eben das nochmal prüfe vermisse ich 2 Agenten die von der IQ Suite hätten eingtragen sein müssen.
Die Schaltfläche in der Ansicht ist aber noch da.
hmm...
Da werd ich wohl mal in der Richtung was suchen, wer weis was da noch fehlt ...
Ich hoffe, das zeigt mal auf das Problem ;-)
Hugin
-
Wenn ihr die iQSuite nutzt, wie groß sind eure Quarantäne-Datenbanken (falls verwendet) ? Die iQSuite bekommt lustige Performanceprobleme, wenn eine Q-Datenbank größer als 4GB wächst.
-
Wenn ihr die iQSuite nutzt, wie groß sind eure Quarantäne-Datenbanken (falls verwendet) ? Die iQSuite bekommt lustige Performanceprobleme, wenn eine Q-Datenbank größer als 4GB wächst.
mannmannmann,
da hast was gefunden.
Die QuarantäneDB ist nur 80MB gross.
Aber da ich schon am prüfen war habe ich mal auf die anderen geschaut.
Die Logdatei der IQ Suite ist über 11GB gross.
Dieses Verzeichnis hab ich auch nie auf die Grösse geprüft, immer nur mal n Blick auf die Quarantäne DB
Die entsprechende datei auf dem anderen clusterserver ist 130MB gross... der stürzt auch nie ab.
Es sieht so aus als ob Notes noch länger braucht um die zu öffnen.
Ich geh heim und bin direkt mal neugierig auf morgen.
Selbst wenn das nicht eine der Ursachen ist, das wäre wohl bald ein Problem geworden.
Besten Dank erstmal an alle, ich melde mich morgen
Hugin
-
Also 11GB große Log ist heftig und führt unter Garantie zu Performanceeinbußen.
Die Quarantäne-Datenbanken sind von der Größe her absolut unproblematisch.
-
Also 11GB große Log ist heftig und führt unter Garantie zu Performanceeinbußen.
Die Quarantäne-Datenbanken sind von der Größe her absolut unproblematisch.
Nur Performance wäre nicht so schlimm, die täglichen Abstürze fressen an meinen Nerven.
450.000 Logdateien in der Datenbank und das bei dem empfohlenen Loglevel 6.
Ich bräuchte ne Idee wie ich die durch eine frische ersetze ohne den Server neu zu starten.
Gruß
Hugin
-
Hallo,
+49 (0)721/4901-112 oder
hotline@group-technologies.com
Gruß Werner
-
Setz doch einfach beim Platzsparer ein, dass alle Dokumente älter als X-Tage (30 als Vorschlag) gelöscht werden. Das sollte schon massig Platz schaffen und dir vielleicht helfen.
Gruß
Thomas
-
IQ.Suite anhalten (TM_Grab, ggf. TD_Grab). IQSuite Log DB wegkopieren oder löschen und eine neue anlegen.
IQ.Suite neu starten - fertig.
-
So, die LogDB der IQ-Suite ist nun frisch. Ende nächste Woche gebe ich mal eine
Zwischenmeldung durch ob es was zur Serverstabilität beigetragen hat.
Kann mir jemand sagen wann die IQ-Suite 8.6 ungefähr erschienen ist?
Danke und Gruß
Hugin
-
Die Version 8.6.x gibt es m. E. seit (Anfang) 2005.
-
Hallo,
ich wollte nochmal ein vorläufiges Ergebnis posten.
Nachdem ich die Log Datei der IQ-Suit neu angelegt hatte kam es erst nach 4 Tagen zu einem unfreiwilligen Reboot. Nach ca. 3 Reboots am Tag (gefühlt 10) vorher schonmal deutlich besser.
Den Loglevel hatte ich bei dem Reboot noch von 6 (empfohlen) auf 3 umgestellt.
Seitdem läuft es.
Der empfohlene Loglevel 6 hatte mir über 30MB Logs am Tag beschert, mit Stufe 3 sind es nun unter 2 MB.
Fazit, ausser der Grösse der QuarantäneDB sollte man unbedingt die Grösse der LogDB im Auge halten.
An dieser Stelle nochmal Danke an alle die sich hier beteiligt haben
Gruß
Hugin
-
Btw.:
Zum Thema Notes nimmt mehr Speicher als es eigentlich kann:
http://www-1.ibm.com/support/docview.wss?uid=swg21109688
http://www-1.ibm.com/support/docview.wss?uid=swg21230851