Autor Thema: das schöne an Java sind inzwischen die vielen openSource Bibliotheken  (Gelesen 3199 mal)

Offline flaite

  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 2.966
    • mein del.icio.us
... für alles mögliche.
Wenn man immer diese formularartigen Business Webanwendungen mit RDBMS Anbindung zu schreiben, kann das auf die Dauer halt auch langweilig werden. Es lassen sich halt mit den heutigen Möglichkeiten auch ganz andere Anwendungen schreiben.
 
Ich beschäftige mich jetzt als Gefallen und zur Übung damit, die Daten eines seit vielen Jahrzehnten existierenden pisa-artigen Vergleichstest chilenischer Schulen namens simce in graphischer Form aufzubereiten. Die Daten gibts für mich nur von der Webseite http://www.simce.cl und werden als html geliefert. Nicht mal xhtml.
In Java gibts aber halt zahlreiche Parser, die das extrahieren aus html Seiten erleichtern. Für meine Zwecke hats jTidyHtml erstmal getan. Wenn ich Zeit und Lust habe, versuche ich vielversprechende Alternativen, aber die jTidy api konnte ich dank google innerhalb von 1 Stunde soweit bedienen, dass es halt tat. JTidy bietet eine DOM-Api an, die aus JavaScript und XML Bibliotheken aus verschiedenen Sprachen bekannt sein dürfte. Das Besondere ist halt das, dass es auch mit html geht. Wenn die von Simce das html an den für den Parser entscheidenden Knoten ändern, weiss der Parser nicht mehr parsen.
Die graphische Darstellung verwendet JFreeGraph. Auch da konnte ich mich in etwa 1 Stunde reinfuchsen. Inklusive der platzsparenden 45 Grad Anordnung der Labels auf der x-Achse und eine Anpassung des Wertebereichs auf der y-Achse.

Zur Zeit lad ich mir das html von Simce noch auf die Festplatte runter.
Die nächsten Aufgaben bestehen darin,
a) mit jakarta http-client den HTTP Post request gegen simce.cl abzusetzen und die Rückgabe empfangen.
b) Die Rückgabe in einer noch auszuwählenden NOSQL Datenbank persistent zu cachen, um simce.cl nicht übermässig zu belasten.  
c) weitere statistische Auswertungen. Simce liefert weitere Daten: Größe des Samples der am Test teilnehmenden Schüler, Soziale Herkunft der Schüler, Schule ländlich oder städtisch, Vergleich zwischen unterschiedlichen Städten und Regionen, etc.

Insgesamt bin ich aber zufrieden, dass das bisher Erreichte innerhalb von 1 Tag möglich ist.
Angehängt ist eine Beispiel Graphik.

Gruß Axel

« Letzte Änderung: 10.04.11 - 09:11:49 von Pitiyankee »
Ich stimm nicht mit allen überein, aber mit vielen und sowieso unterhaltsam -> https://www.youtube.com/channel/UCr9qCdqXLm2SU0BIs6d_68Q

---

Aquí no se respeta ni la ley de la selva.
(Hier respektiert man nicht einmal das Gesetz des Dschungels)

Nicanor Parra, San Fabian, Región del Bio Bio, República de Chile

 

Impressum Atnotes.de  -  Powered by Syslords Solutions  -  Datenschutz