Domino 9 und frühere Versionen > ND6: Entwicklung
Bereinigung unsauberer Daten in Feldern
geissbock:
Hallo,
ich bräuchte mal weider ein paar Denkanstösse bzgl. dieser Thematik:
Gegeben Datenbank mit ca. 100000 Doks mit einem Feld Company nach dem eine Ansicht kategorisiert die Dokumente anbietet.
Problem: Daten in diesem Feld sind äusserst unsauber, sprich ein und dieselbe Company ist in zig unterschiedlichen Schreibweisen vertreten (s. Screenshot) und somit werden n Kategorien gebildet. Nun sollen diese Daten bereinigt werden.
Wie kann man das sinnvoll angehen?
Ich dachte an eine Liste der korrekten Namen (hab ich leider auch noch nicht), um diese dann mit den Feldinhalten zu vergleichen und ggf. zu ersetzen.
Aber bisher fehlt mir noch wirklich eine sinnvolle Vorgehensweise, sodaß ich für jeden Hinweis dankbar bin.
Gruß Klaus
Glombi:
Student oder 1-Euro Jobber ;)
Das automatisch zu machen ist nicht einfach, ggf. gibt es ja ähnlich klingende Firmennamen, die aber doch unterschiedlich sind.
Man könnte mit @Soundex arbeiten, um alle ähnlichen Einträge zu bekommen.
Andreas
botschi:
Oder einen Agenten, der eine Inputbox gibt und alle vorher markierten Doks mit dem Wert ändert, den Du oder der Student in die Inputbox schreibt.
Das ist son halbautomatisches Ding ;D
Matthias
DerAndre:
Wenn er eine Liste mit den richtigen Bezeichnungen hat ist es dreiviertelautomatisch
Ich würde die Markieren und über Liste auswählbare Bezeichnung Vorgehensweise nehmen
cko:
Gibt es vielleicht eine Kundennummer? Die wäre ja wohl eindeutig. Wenn ja kurze Info und ich könnte Dir evtl eine Lösung vorschlagen.
Gruß
Carsten
Navigation
[0] Themen-Index
[#] Nächste Seite
Zur normalen Ansicht wechseln