Das Notes Forum
Domino 9 und frühere Versionen => ND7: Entwicklung => Thema gestartet von: eknori am 13.09.06 - 19:11:45
-
Hat sich hier schon einmal jemand Gedanken darüber gemacht, wie man die Suche in Lotus Notes evtl. ein wenig aufbohren könnte ?
Mir schwebt da so etwas in der Art: "Zeige mir (thematisch) ähniche Dokumente"
Die Volltextsuche liefert teiweise zu viele thematisch nicht zusammengehörige Dokumente; und eine Suche nach exakten Begriffen lässt die Dokumente aus, die den gesuchten Begriff nicht enthalten.
Ich würde das gerne anders lösen. Die Suche nach "Chromatieren" sollte z.B. auch alle die Dokumente anzeigen, die "vergolden", "sandstrahlen" beinhalten, allerdings nur, wenn sie thematisch in den Kontext "Oberflächenveredlung" passen. So wäre ein Dokument, das den Begriff "versilbern" nicht in die Suchergebnisse aufzunehmen, wenn dieser Begriff im Kontext "Das Familiensilber versilbern" vorkommt.
Ebenso sollte die "Goldene Nase" nicht als Ergebnis der Suche erscheinen. Sicherlich handet es sich um eine Veredelung einer Oberfläche, aber nicht im Kontext Metallverarbeitung uoder gar Automotive.
Und wo wir dann schon bei den Fremdsprachen sind, sollten natürlich auch Dokumente in den unterschiedlichen Sprachen angezeigt werden.
So umfasst der Kontext "Automobilhersteler" auch den "createur automobile".
Was haltet ihr von der Idee ? :love:
Oder hat da gar jemand so etwas schon umgesetzt ?? Wo ist der Link zum kostenlosen Download ?? ;D
-
So umfasst der Kontext "Automobilhersteler" auch den "createur automobile".
Also sollen zusätzlich auch bei zwei Schreibfehlern noch Verbindungen hergestellt werden können?
Spass beiseite: Das wäre mal ein Projekt, dass - wenn es entsprechend gut bezahlt wird (!) - mich äusserst reizen würde!
Bernhard
-
IMHO würde sowas unter http://de.wikipedia.org/wiki/Semantic_Web fallen, odrrr?
-
Ich glaube nicht, Martin. Das semantische Web ist noch viel zu formal. Ulrichs Ansinnen reicht ja weit darüber hinaus. Eigentlich müsste sein Wunschsystem dann noch sinnigerweise entscheiden (oder abfragen), ob der geneigte Leser, der "Automobilhersteller" lesen kann, auch dann noch mit "créateur d'automobile" etwas anfangen kann (nicht, dass er in dieser Branche eher japanisch als Fremdsprache belegt hat).
Und wie weit die Maschine (trotz der zahlreichen hervorragenden menschlichen Ideen dahinter) noch dem wirklichen menschlichen Hirn hinterher ist, zeigen ja auch die immer noch mässigen Erfolge der US-Amerikaner, die über die Jahre zig Milliarden in derartige Systeme stecken, und deren Geheim- und Überwachungsdienste trotzdem den Systemen anderer Länder hinterherhinken, die für die Informationsbeschaffung und -auswertung lieber menschliche Hirne einspannen.
Bernhard
-
Moin,
in der Tat ein schönes Gebiet...
Nach meinem Kenntnisstand gibt es diverse Forschungsvorhaben, die teils von der EU Förderungen erhalten. Die Problematik liegt derzeit in der kognitiven Erfassung der Texte. Es reicht eben nicht, einen Index über Begriffe zu bilden, sondern, wie Ulrich schon anführte, Zusammenhänge zu erkennen und auszuwerten.
Soweit ich weiss, gibt es bis dato Zitatdatenbanken, bei denen nach einer "Begriffsklasse" gesucht werden kann... nur muss bisher jemand diese Klassen pflegen und kontrollieren.
Wenn einer von Euch eine intelligente Suchfunktion coden könnte, würde sich das wahrscheinlich besser verkaufen als Heroin im Bahnhofsviertel... ;D
Gruß
blackjack
-
mit RAVEN (KStation falls jemand das mehr sagt) hat IBM vor Jahren mal versucht so etwas auf die Beine zu stellen.
Das was in Hannover kommen soll, dieses Activity Centric Computing nutzt in Teilen Entwicklungen aus dem damaligen Projekt.
Ich hab mir die KStation damals angeschaut und festgestellt, das sie einfach nicht bedienbar ist. Ähnlich wie bei Data Warehouse Systemen brauchst du Experten die eine Taxonomie für die Begriffe herstellen. Das ist komplex und unter Umständen fehleranfällig. Wähle den falschen Ansatz und du hast richtige Probleme. Außerdem wirst du von dem Experten der dir deine Taxonomie hergestellt hat abhängig und selten (und damit teuer) sind diese Burschen auch.
-
http://de.wikipedia.org/wiki/Taxonomie
-
Wenn ich damals bei den Raven Begeisterten (war ich nie) richtig zugehört habe, dann sollte es dort gerade "selbstlernende Funktion" geben. D.h. das Tool baut sich je nach Aktivitäten des Users Taxonomien selber auf. Das geht dann endgültig in den KI-Bereich. In der IBM der 80er war KI (Künstliche Intelligenz) ein Lieblingsbegriff des technischen Stabs und verhaßt bei den VBs (Mittelding zwischen Vertriebler und Key Account Manager).
-
Bernhard, ich hab, im Zuge meiner beruflichen Tätigkeiten, mit einigen sehr schlauen Leuten zum Thema Semantik Web, Taxonomien, etc. plaudern dürfen. Und von dem bißchen, was ich davon verstanden habe, wären Taxonomien, etc. durchaus für Ulrichs Idee geeignet.
Ob sich das mit derzeitigen Theorien und Techniken bereits umsetzten lässt? Ich bezweifle es.