Lotus Notes / Domino Sonstiges > Tools & Downloads
FileIndexer - indizieren von Dateien mit Notes
JulianBuss:
hab nun einen Download fertig gemacht, und es gibt nun auch ein Forum:
Forum: http://www.youatnotes.de/php-bin/viewforum.php?f=15
Download:
siehe Wiki unter http://www.youatnotes.de/web/youatnotes/fileindexer-wiki.nsf
Marinero Atlántico:
Warum benutzt du nicht Lucene?
Es kann unterschiedliche Dateitypen indizieren und wir haben damit eigentlich gute Erfahrungen gemacht.
Gruß Axel
JulianBuss:
1.) habe ich noch nicht gekannt, danke für den Tipp :-)
2.) auf den ersten Blick habe ich nicht erkennen können, dass Lucene PDF, Office-Dokument etc. indiziert Mir fehlt aber ein Indexer der wirklich alles wichtige indizieren kann.
3.) ich will ja grade die Daten im Notes haben, damit ich die Suche auch von Notes aus ausführen und das Suchergebnis im Notes anzeigen kann.
So wie ich das auf den ersten Blick gesehen hab kann man auch in Lucene eigene "Filter" implementieren - also hätte ich bestimmt auch darauf aufbauen können.. aber viel Ersparnis hätte es mir wohl nicht gebracht, da ich wohl die "wichtigen" Filter für PDF, DOC & Co auch selbst hätte bauen müssen. Und die Logik, den Index ins Notes zu bringen, auch.
Gibts eine Liste von unterstützten Dateiformaten für Lucene?
Danke jedenfalls für den Tipp :)
Marinero Atlántico:
--- Zitat von: JulianBuss am 15.11.04 - 12:16:41 ---da ich wohl die "wichtigen" Filter für PDF, DOC & Co auch selbst hätte bauen müssen.
--- Ende Zitat ---
gibts schon als openSource.
--- Zitat von: JulianBuss am 15.11.04 - 12:16:41 ---Und die Logik, den Index ins Notes zu bringen, auch.
--- Ende Zitat ---
Stimmt. Aber Lucene ist relativ einfach einzubinden. Bei uns aus einer Tomcat Anwendung waren das glaub ich 3 statische Methoden.
--- Zitat von: JulianBuss am 15.11.04 - 12:16:41 ---Gibts eine Liste von unterstützten Dateiformaten für Lucene?
--- Ende Zitat ---
Verstreut hier: http://www.jguru.com/faq/Lucene und http://jakarta.apache.org/lucene/docs/contributions.html
Wenn ich mich recht erinnere wurden bei uns MS-Office Dokumente erstmal durch irgendwelche POI gejagt.
--- Zitat ---Danke jedenfalls für den Tipp :)
--- Ende Zitat ---
gerngeschehen.
Ein ganz guter Einsteigerartikel ist der hier: http://www.javaranch.com/newsletter/200404/Journal200404.jsp#a1
Eric Hatcher (tolles Ant Buch) schreibt ein Buch für Manning, das angeblich diesen Monat herauskommt. Meine mich aber zu erinnern, er hätte auf der Ranch von Februar 2005 gesprochen.
http://www.manning.com/hatcher2
Gruß Axel
Marinero Atlántico:
Hatchers Buch ist draussen. Ich habs mir direkt als PDF gekauft (sehr guter Autor, legendäres Ant-Buch).
Dagegen anzuprogrammieren dürfte schwierig sein.
Lucene ist B I G. Es gibt jetzt Porting Projekte nach C/++, .NET, Python und Perl.
Diese Woche gibt es in Javaranch eine Buch Promotion mit Hatcher und einem Co-Autor mit nicht zumerkenden Südslavischen Namen.
http://saloon.javaranch.com/cgi-bin/ubb/ultimatebb.cgi?ubb=get_topic&f=64&t=000969
Axel
Navigation
[0] Themen-Index
[#] Nächste Seite
[*] Vorherige Sete
Zur normalen Ansicht wechseln