Domino 9 und frühere Versionen > ND6: Entwicklung

Wie HASH Wert eines Anhangs bestimmen ?

<< < (2/3) > >>

eknori:
Lustig ist auch, daß man die Reihenfolge der Header Dateien beachten muss

#include "lncppapi.h"
#include "stdafx.h"

umgekehrt gibt es Gemeckertes vom Linker ... :P

flaite:
Meine Idee mit den diff-Tools gestern abend war natürlich Quatsch.
Thx. Hash ist das Ding.
Könnte es jetzt nicht u.U. hilfreich sein, das alles in (imho besser) Relationale Tabellen schreiben.
1. Tabelle DocUniqueIDs
PrimKey: id Identity/autoInkrement
VarChar: DocUniqueID
VarChar: DatenbankServer
VarChar: DatenbankPfad

2. Tabelle: AttachmentHashs
PrimKey: id identity/autoInkrement
long: idDocUniqueID (fremdschlüssel auf DocUniqueIDs.id
VarChar: Hash (wie groß sind die Hashs?)

Ich vermute, es gibt nichts bessere als SQL, um die Duplikate in AttachmentHashs.Hash zu finden, in denen Datensatz:AttachmentHashs.idDocUniqueId <> Datensatz:AttachmentHashs.idDocUniqueId.
Geht natürlich auch in einer NotesDatenbank. Nur dürfte das ziemlich lange dauern.

eknori:
Nein, SQL ist in dem Fall das richtige Medium.

Das Tool soll nicht nur über MailDBs laufen sondern letztendlich auch über das Filesystem. Das das lange dauert, ist mir klar. Mengengerüstmäßig reden wir dann über ein paar Millionen Einträgen in der Datenbank;  da sehe ich bei Notes selber schwarz.

Ich denke, daß man die eigentliche Auswertung in der SQL DB dann einfacher gestalten kann, als das im Coding zu berücksichtigen.

Wir brauchen das Tool übrigens zur Kostenanalyse; rechnet sich die Anschaffung einer Centera ? Wo liegen unsere größten Redundanzen ? Sind es wirklich die doppelt und zehnfach verschickten Firmenpräsentationen in den Mailfiles oder ist die Volumenersparnis auf dem Filesystem vergleichsweise größer.

Insgesamt aber interessant für jeden, der sich mit Redundanzen herumquält ...

P.S. sollte diese Zeilen hier jemand von pro-clients lesen; ich weiß, daß ihr ein solches Tool im Angebot habt.

flaite:
ich probier jetzt direkt mal aus in meine mySql 5.000.000 Einträge zu kloppen und guck mal was passiert.

flaite:
zur Zeit ca. 0.050 sek pro insert.
4991000to go
brauch jetzt mein eclipse wieder.
Sah aber bis 4973000to go stabil aus. Blieb ungefähr bei 0.05 sec.
Kein Bulk-Insert (der wesentlich schneller ist).

Navigation

[0] Themen-Index

[#] Nächste Seite

[*] Vorherige Sete

Zur normalen Ansicht wechseln