Autor Thema: [ Erledigt ] Welche Konfigurationen beeinflussen die FT-Volumina ?  (Gelesen 4164 mal)

Offline J Parlin

  • Senior Mitglied
  • ****
  • Beiträge: 392
Moin Kollegen,

ich hab hier ein seltsames Phänomen:

3 8.5.3er FP6 Clustermember im SAN, alle die gleiche Anzahl Mail-DBs mit gleichen Replik-IDs ( knapp 2 TB Volumina ) - 300 User, davon dann jeweils 100 je Cluster.

Was mich stutzig macht: Cluster-Member 1 und 3 haben knapp 100GB FT-Indizes-Volumina, Member 2 hat aber stolze knappe 1 TB an FT-Indizes.

Ich hab mal etwas gegoogelt, aber so gut wie nichts gefunden, in wie fern tägliches und z.B. stündliches oder sofortiges Indizieren die Volumina beeinflußt  ( jeder Cluster-Member hat 3 separate Indexer-Tasks ) .

Außerdem hab ich ( nur Interesse halber ) nichts gefunden, wofür die einzelnen Unterordner im FT-Ordner stehen.

PS: wir wollen jetzt die Indizes auslagern / separieren vom \data , wie kalkuliert ihr dieses separate Volume von Speicherplatz her.  

Danke für die Infos ....  

« Letzte Änderung: 11.07.16 - 10:41:36 von J Parlin »

Offline J Parlin

  • Senior Mitglied
  • ****
  • Beiträge: 392
Re: Welche Konfigurationen beeinflussen die FT-Volumina ?
« Antwort #1 am: 11.07.16 - 10:41:11 »
So, hab mich jetzt mal mit einem Bekannten beraten, jetzt ist einiges klarer an der ganzen Sache ( Parameter der Indizierung incl. / excl. Attachments etc. ) - z.B. bei Aktivierung des FT-Index ohne weitere Parameter kann mal als Faustformel um die 5% FT-Volumina der Mail-DB rechnen, bei uns waren es teilweise 200% der Mail-DB mit Indizierung der Attachments incl. weiterer Parameter ( da wir relativ viele und größere PDF als Attachments bekommen ).

Es ist auch immer nicht so konstruktiv, wenn zu viele "Köche" am Domino rumschrauben ( ohne Kommunikation ), teilweise waren es wohl auch User, die bei fehlendem FT-Index die Indexer-Parameter etwas ungünstig konfiguriert hatten ( aber eben übertriebenermaßen an der einen Maschine wohl durch einen co-administrativen User ).

Sehr gute kompakte Info kann man sich hier nochmal rausziehen: http://www.ibm.com/developerworks/lotus/library/ls-search_variables/

Danke ans Forum - für mich erledigt die Sache.
« Letzte Änderung: 11.07.16 - 10:45:18 von J Parlin »

Offline Pfefferminz-T

  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 1.204
Der Parameter bzgl. der Indizierung der Anhänge hat sicherlich die grösste Auswirkung, auch was die Dauer der Aktualisierung betrifft. Wenn viele Änderungen/neue Dokumente mit grossen Anhängen in eine Datenbank kommen und die Aktualisierung auch noch auf "Sofort" gesetzt ist, dann wird das den Server ordentlich beschäftigen und es kann sogar zu einem "Dauerlauf" des FTI für eine Datenbank kommen.

Ist ja auch klar, wenn ein Text mit 100 Wörtern oder ein PDF mit 1000 Seiten indiziert wird, macht das einen Unterschied in der Grösse. Auch wenn ein FTI korrupt ist, dann wächst der im Verhältnis zur Grösse der eigentlichen Datenbank richtig an.
Grüsse,
Thorsten

Offline koehlerbv

  • Moderator
  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 20.460
  • Geschlecht: Männlich
Da es sich bei einem FTI um eine BTree-Struktur handelt, wächst dieser auch mit seinem Alter und seinen erforderlichen Aktualisierungen. Prinzipiell gilt: "Alter" FTI (zum Teil erheblich) grösser als ein ganz frischer.

Bernhard

Offline J Parlin

  • Senior Mitglied
  • ****
  • Beiträge: 392
Wenn denn hier noch etwas nachdiskutiert wird: die Einstellung SOFORT oder TÄGLICH für den Indexer auf der Mail-DB:

Welcher Unterschied besteht jetzt, ob SOFORT kleinere Änderungen in einem kleinem Zeitrahmen für den FT-Index angefasst / erledigt werden, oder dann TÄGLICH an einem Stück eine größere Menge der Änderungen eines Tages durch den INDEXER abgefrühstückt werden muß  ;-)

Danke

 

Offline MacSpudik

  • Aktives Mitglied
  • ***
  • Beiträge: 211
  • Geschlecht: Männlich
Welcher Unterschied besteht jetzt, ob SOFORT kleinere Änderungen in einem kleinem Zeitrahmen für den FT-Index angefasst / erledigt werden, oder dann TÄGLICH an einem Stück eine größere Menge der Änderungen eines Tages durch den INDEXER abgefrühstückt werden muß  ;-)

Ausschlaggebend ist u.a. die Uhrzeit und die Folge der Abarbeitung:
Beim täglichen Indizieren läuft der Indexer einmal in der Nacht durch. D.h. zum Einen in einer Zeit, wo der Server nicht stark belastet ist und zum Anderen eben nur einmal.
Beim sofortigen Indizieren beantragt jede Anwendung bei jeder Änderung eine Indizierung, d.h. der Indexer muss ständig auf Zuruf indizieren und wird nie fertig und das mitten am Arbeitstag, wo die Änderungen stattfinden.
Eine sofortige Indizierung setzt man daher i.d.R. nur in Ausnahmefällen.

Grüße von
Sebastian
"Es ist schwierig zu antworten, wenn man die Frage nicht versteht."

Offline J Parlin

  • Senior Mitglied
  • ****
  • Beiträge: 392
Also kann man so zusammenfassen: viele Admins setzen die FT-Indizierung auf TÄGLICH, bei Bedarf einzelne DBs auf kürzere Intervalle

Was mich jetzt an gegebenen Antworten noch interessiert: ist das wirklich in der Praxis so relevant und stellt sich wie gesagt da, dass sich die Indexer-Tasks dann verheddern / nicht fertig werden / den Domino stark belasten, trotzdem ich mehrere Indexer-Tasks am Laufen habe.

Wie viele Indexer-Tasks hat der ein oder andere so an seinen DOMINOs am Laufen ( je nach aktiver User- / DB-Anzahl auf der Maschine ) ?

Offline Pfefferminz-T

  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 1.204
Seitens der Administration und bezüglich der Serverlast ist die tägliche Aktualisierung sicherlich die bevorzugte Variante, der Anwender und so manche Applikation sieht natürlich die sofortige Aktualisierung gerne.

Das hat schon einen guten Einfluss, wenn ein Update-Task dauerhaft auf einer Datenbank gebunden ist... viele neue Dokumente mit Attachments in kurzer Zeit sind dann der Killer, wenn der FTI sofort aktualisiert werden soll.
Grüsse,
Thorsten

Offline MacSpudik

  • Aktives Mitglied
  • ***
  • Beiträge: 211
  • Geschlecht: Männlich
ist das wirklich in der Praxis so relevant und stellt sich wie gesagt da, dass sich die Indexer-Tasks dann verheddern / nicht fertig werden / den Domino stark belasten, trotzdem ich mehrere Indexer-Tasks am Laufen habe.

Wie viele Indexer-Tasks hat der ein oder andere so an seinen DOMINOs am Laufen ( je nach aktiver User- / DB-Anzahl auf der Maschine ) ?
Hier kommt aus meiner Sicht wieder das berühmte "es kommt darauf an".
Ich würde mich nicht unbedingt daran orientieren, wieviele Indexer andere am laufen haben, auch nicht, wenn die Anwenderanzahl gleich ist.
Was hilft mir der andere, wenn mein Unternehmen bzw. "meine" Anwender und Anwendungen einfach anders ticken.
Ich persönlich schaue mir gerne das betreffende (mein) System an, d.h. im indexer Fall: wieviele indexer habe ich gerade am laufen und wieviele sind derzeit überhaupt beschäftigt.
Da nimmt man dann Stichproben über den Tag verteilt und bekommt nach einer Weile ein Gefühl dafür, wieviele überhaupt derzeit gebraucht werden.
Dann kommt die Frage nach der Serverleistung. Wieviele Indexer könnte ich denn nun noch laufen lassen, wenn ich sie bräuchte, ohne dem Server und somit den Anwendern woanders Ressourcen/Leistung wegzunehmen?
Hier würde man dann auch wieder Schritt für Schritt 1-2 Indexer hinzunehmen und schauen, wie der Server und die Performance darauf reagiert (wenn die Indexer überhaupt gebraucht werden).
Und wenn man das eine Weile im Blick hat, dann kann man gut und gerne einige Anwendungen mehr auf sofortige Indizierung stellen. Ich persönlich würde dies aber nur den "wichtigen" Personen und Anwendungen zur Verfügung stellen.
Je öfter und intensiver dann wiederum indiziert wird, desto größer wird der Index und desto eher kann dieser dann auch mal beschädigt werden. D.h. desto häufiger sollten die FTs gelöscht und neu aufgebaut werden. Hierfür gibt es ein nettes Tool von Daniel Nashed: Run Special Tasks
http://www.nashcom.de/nshweb/pages/nshrun.htm

Grüße von
Sebastian
"Es ist schwierig zu antworten, wenn man die Frage nicht versteht."

Offline Jörg P.

  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 720
  • Ich liebe dieses Forum!
Moin,

geht es primär um Mailfiles, sind gerade bei größeren Umgebungen lokale Repliken eine Überlegung wert.
Nimmt viel Last (CPU, Memory und Speicher) vom Domino und eine Aktualiserung des Volltextindex erfolgt bei jeder Replikation, wenn ich mich nicht irre.
A programming error was found but will not be corrected. It will be a permanent restriction.  ::)

 

Impressum Atnotes.de  -  Powered by Syslords Solutions  -  Datenschutz