@Marino: was für ein Artikel sollte das sein? Verstehe nicht ganz, was du genau sehen willst. Einen Artikel über was?
@koehlerbv: meiner Meinung nach hat das nichts mit dem Auffinden fehlerhafter Informationen zu tun, aber doch mit dem Auffinden der doppelten Daten, oder?
Nochmal zu meiner Seminararbeit: bei dieser sollen ca. 15-20 Seiten über Redundanzmanagement geschrieben werden und dabei vor allem die vier genannten Redundanzprobleme angesprochen werden. Ich möchte NICHT für jedes dieser Probleme eine 100%ige Lösung erstellen. Das wäre zu umfangreich und eher in einer Diplomarbeit zu realisieren.
Deswegen suche ich nur nach Ansätzen zur Lösung dieser Probleme. Meiner Meinung nach ist das Auffinden von fehlerhaften Informationen aber nicht "mal eben schnell" zu Programmieren. Hier muss doch eine Menge Entwicklungsarbeit hinein gesteckt werden um dem Problem gerecht zu werden.
Meine Frage zum Thema fehlerhafte Informationen: Wie kann ich evtl. fehlerhafte Informationen aufspüren, ohne in Sachen wie Phonetische Ansätze usw. einzutauschen?
Als einzige Lösung ist mir hier eingefallen, dass man drei bis vier Felder zweier Dokumente miteinander vergleicht. Wenn sie sich lediglich in einem unterscheiden, könnte ein Fehler vorliegen. Aber das würde doch definitiv zu lange dauern, wenn man mal von großen DB's ausgeht, oder?
Aber schonmal vielen Dank für eure rege Beteiligung hier. Hilft mir sehr und es macht Spaß :-)...liebe grüße...