Das Notes Forum

Sonstiges => Infrastruktur => Thema gestartet von: eknori am 16.08.04 - 15:22:58

Titel: XML - Suchen und Ersetzen in Tags
Beitrag von: eknori am 16.08.04 - 15:22:58
Hallo Gemeinde,

kaum aus dem Urlaub zurück, hat mich der Arbeitsalltag schon wieder am Wickel.

Ich habe hier mehrere XML Files mit Grössen so um die 200 MB. Es handelt sich dabei um Kataloge im BMECAT Format. Die Kataloge haben bis zu 250.000 Artikel.

Unteranderem enthält der XML Code zu jedem Artikel auch eine ECLASS Zuordnung.

<REFERENCE_FEATURE_GROUP_ID>27-14-08-17</REFERENCE_FEATURE_GROUP_ID>

Unser System kann aber die Bindestriche im ECLASS Code nicht verarbeiten. Ich suche daher eine Möglichkeit, ein Suchen und Ersetzen innerhalb eines Tags zu realisieren. Kennt jemand ein Tool, was so etwas beherrscht ?

Ulrich
Titel: Re:XML - Suchen und Ersetzen in Tags
Beitrag von: WMotzet am 16.08.04 - 15:39:10
hallo

zu Dos-Zeiten gab´s mal K-Edit
da konnte man über "Show <REFERENCE_FEATURE_GROUP_ID>" einen Select machen und dann über Change die Zeichen in ASCII oder Hex Tauschen oder ersetzen.
Das soll es auch für WIN geben,
war damals super schnell.

MfG
Werner Motzet

PS: Unter http://www.kedit.com/ gibts die Firma Mansfield Software immer noch.
Titel: Re:XML - Suchen und Ersetzen in Tags
Beitrag von: eknori am 16.08.04 - 15:54:44
@Werner

Danke, genau das habe ich gesucht
Titel: Re:XML - Suchen und Ersetzen in Tags
Beitrag von: Marinero Atlántico am 16.08.04 - 16:06:00
... Das sind natürlich nicht kleine Files.
Aber geht das nicht einfach mit Suchen und Ersetzen in irgendeinem Editor?
Ansonsten wohl mit egrep, regular expressions und so ein Zeug. Da bin ich aber auch nicht so fit drin. Wüßte ich jetzt aus dem Stehgreif auch nicht.

Oder. Moment.
Soll das programmatisch geschehen?
Das heisst irgendein automatisierter Mechanismus, der die in mehr oder weniger wiederkehrenden Zeitpunkten inbound xml Dateien gemäss BMECAT (wo das definiert ist, hast du uns nicht gesagt) in ein Format überträgt, dass "euer System" verarbeiten kann.

Dafür empfehle ich xslt.
http://www.zvon.org/xxl/XSLTutorial/Output/contents.html (http://www.zvon.org/xxl/XSLTutorial/Output/contents.html)
(ab Kapitel 22 dürfte es Lösungen für dein Problem geben).
Anderes gutes Beispiel für xslt ist Costello + xslt in google.

Welches xml-basierte System, kann bitte keine Unterstriche in Tag-Namen verarbeiten?


Gruß Axel


Titel: Re:XML - Suchen und Ersetzen in Tags
Beitrag von: eknori am 16.08.04 - 17:16:46
Zitat
Aber geht das nicht einfach mit Suchen und Ersetzen in irgendeinem Editor?

Nein, weil ja der Bindestrich nicht nur in den ECLASS Tags enthalten ist. Hier muß schon ganz gezielt in dem Tag gesucht und ersetzt werden

Zitat
Soll das programmatisch geschehen?
Nein; wir bekommen die Kataloge 1-2 x im Jahr. Das läßt sich dann noch manuell managen. Unser Einkauf hat das bisher nach extern gegeben. Da aber die Kataloge bis auf diesen einen Punk voll unseren Spezifikationen entsprechen, wollen wir das nun ohne externen Dienstleister erledigen. KEDIT ist schon genau das, was ich gesucht habe. Muß nur mal sehen, ob das Teil auch mit den Monsterdateien umgehen kann

Titel: Re:XML - Suchen und Ersetzen in Tags
Beitrag von: eknori am 16.08.04 - 17:18:22
Zitat
Welches xml-basierte System, kann bitte keine Unterstriche in Tag-Namen verarbeiten?
 :o

Da hast du was falsch verstanden; es geht nicht um den Tag-Namen, sondern um den Value zwischen den Tags.
Titel: Re:XML - Suchen und Ersetzen in Tags
Beitrag von: WMotzet am 16.08.04 - 17:23:36
hallo

das Dos-Teil hatte eine Zeilenbegrenzung (wie Excel auf 64xxx) aber die Win-Version soll ohne Begrenzung sein.
Habe leider keinen direkten Kontakt mehr, weil der Freund der direkt mit Mansfield gearbeitet hat, vor 5 Jahren einen Herzinfarkt hatte.

Viel Erfolg
Werner
Titel: Re:XML - Suchen und Ersetzen in Tags
Beitrag von: Marinero Atlántico am 18.08.04 - 11:26:27
Nur zur Info:
Eigentlich ist es kein Problem, das mit einem xslt Stylesheet zu machen.
Xslt hat eine String-Funktion replace(String, String).
Sowas geht: replace("_", "")
Über alle Textnodes zu iterieren ist auch kein Problem.
Mir ist nicht ganz klar, wie xslt-Prozessoren auf große Files reagieren.
Vielleicht probiere ich das mal aus.

Gruß Axel
Titel: Re:XML - Suchen und Ersetzen in Tags
Beitrag von: eknori am 18.08.04 - 13:14:02
Zitat
aber die Win-Version soll ohne Begrenzung sein.

richtig; habe jetzt alle meine Files mir KEDIT überarbeitet. Keinerlei Probleme und rasend schnell.
Titel: Re:XML - Suchen und Ersetzen in Tags
Beitrag von: Marinero Atlántico am 18.08.04 - 17:56:58
richtig; habe jetzt alle meine Files mir KEDIT überarbeitet. Keinerlei Probleme und rasend schnell.

Ich machs trotzdem.
Mir ist es völlig egal, wenn Leute mit irgendwelchen Tools rumtricksen und sich nicht an die neue Weltordnung halten.   8)
[Grummel] [Menno] [Foul]