Lotus Notes / Domino Sonstiges > Tools & Downloads

FileIndexer - indizieren von Dateien mit Notes

<< < (2/3) > >>

JulianBuss:
hab nun einen Download fertig gemacht, und es gibt nun auch ein Forum:

Forum: http://www.youatnotes.de/php-bin/viewforum.php?f=15
Download:
siehe Wiki unter http://www.youatnotes.de/web/youatnotes/fileindexer-wiki.nsf

Marinero Atlántico:
Warum benutzt du nicht Lucene?
Es kann unterschiedliche Dateitypen indizieren und wir haben damit eigentlich gute Erfahrungen gemacht.

Gruß Axel

JulianBuss:
1.) habe ich  noch nicht gekannt, danke für den Tipp :-)
2.) auf den ersten Blick habe ich nicht erkennen können, dass Lucene PDF, Office-Dokument etc. indiziert Mir fehlt aber ein Indexer der wirklich alles wichtige indizieren kann.
3.) ich will ja grade die Daten im Notes haben, damit ich die Suche auch von Notes aus ausführen und das Suchergebnis im Notes anzeigen kann.

So wie ich das auf den ersten Blick gesehen hab kann man auch in Lucene eigene "Filter" implementieren - also hätte ich bestimmt auch darauf aufbauen können.. aber viel Ersparnis hätte es mir wohl nicht gebracht, da ich wohl die "wichtigen" Filter für PDF, DOC & Co auch selbst hätte bauen müssen. Und die Logik, den Index ins Notes zu bringen, auch.

Gibts eine Liste von unterstützten Dateiformaten für Lucene?

Danke jedenfalls für den Tipp  :)

Marinero Atlántico:

--- Zitat von: JulianBuss am 15.11.04 - 12:16:41 ---da ich wohl die "wichtigen" Filter für PDF, DOC & Co auch selbst hätte bauen müssen.

--- Ende Zitat ---
gibts schon als openSource.

--- Zitat von: JulianBuss am 15.11.04 - 12:16:41 ---Und die Logik, den Index ins Notes zu bringen, auch.

--- Ende Zitat ---
Stimmt. Aber Lucene ist relativ einfach einzubinden. Bei uns aus einer Tomcat Anwendung waren das glaub ich 3 statische Methoden.

--- Zitat von: JulianBuss am 15.11.04 - 12:16:41 ---Gibts eine Liste von unterstützten Dateiformaten für Lucene?

--- Ende Zitat ---
Verstreut hier: http://www.jguru.com/faq/Lucene und http://jakarta.apache.org/lucene/docs/contributions.html
Wenn ich mich recht erinnere wurden bei uns MS-Office Dokumente erstmal durch irgendwelche POI gejagt.

--- Zitat ---Danke jedenfalls für den Tipp  :)

--- Ende Zitat ---
gerngeschehen.

Ein ganz guter Einsteigerartikel ist der hier: http://www.javaranch.com/newsletter/200404/Journal200404.jsp#a1

Eric Hatcher (tolles Ant Buch) schreibt ein Buch für Manning, das angeblich diesen Monat herauskommt. Meine mich aber zu erinnern, er hätte auf der Ranch von Februar 2005 gesprochen.
http://www.manning.com/hatcher2

Gruß Axel

Marinero Atlántico:
Hatchers Buch ist draussen. Ich habs mir direkt als PDF gekauft (sehr guter Autor, legendäres Ant-Buch).
Dagegen anzuprogrammieren dürfte schwierig sein.
Lucene ist B I G. Es gibt jetzt Porting Projekte nach C/++, .NET, Python und Perl.
Diese Woche gibt es in Javaranch eine Buch Promotion mit Hatcher und einem Co-Autor mit nicht zumerkenden Südslavischen Namen.
http://saloon.javaranch.com/cgi-bin/ubb/ultimatebb.cgi?ubb=get_topic&f=64&t=000969

Axel

Navigation

[0] Themen-Index

[#] Nächste Seite

[*] Vorherige Sete

Zur normalen Ansicht wechseln