Autor Thema: Text aus PDF lesen und Automatisierung  (Gelesen 2888 mal)

Offline immanuel

  • Senior Mitglied
  • ****
  • Beiträge: 461
  • Geschlecht: Männlich
    • Freshpixel Fotostudio
Text aus PDF lesen und Automatisierung
« am: 10.09.17 - 10:03:14 »
Liebe Notes Entwickler

Ich mörchte mein ERP etwas pimpen und (eingescannte) PDF Rechnungen smart mit Notes wekennen und ablegen.

 Ich möchte also einen Beleg sprechen oder ein scannen und dann mit Lotus Script auf die Formularfelder des PDFs zugreifen oder einfach den gesamten Text liest PDFs.

Kann mir jemand helfen, wie ich mit Lotus Script ein importiertes PDF (in Richtext feld hochgeladen) Text lesen kann? Wie ziehe ich Felder oder OCR Text aus dem PDF raus?

Habe im Netz viel gesucht aber leider nix gefunden.

Hat mur sonst jemand nochn Tipp für Document Management LS klassen oder so?

Vielen Dank und Gruess
Manuel
IBM Certified System Administrator - Lotus Notes and Domino 6/6.5

Offline eknori

  • @Notes Preisträger
  • Moderator
  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 11.730
  • Geschlecht: Männlich
Re: Text aus PDF lesen und Automatisierung
« Antwort #1 am: 10.09.17 - 11:55:37 »
Mit ls kommst du da sicher nicht weit; mit Java geht das recht einfach. https://pdfbox.apache.org Oder ähnliche libs leisten da gute Dienste.
Egal wie tief man die Messlatte für den menschlichen Verstand auch ansetzt: jeden Tag kommt jemand und marschiert erhobenen Hauptes drunter her!

Offline immanuel

  • Senior Mitglied
  • ****
  • Beiträge: 461
  • Geschlecht: Männlich
    • Freshpixel Fotostudio
Re: Text aus PDF lesen und Automatisierung
« Antwort #2 am: 10.09.17 - 15:44:30 »
Vielen Dank!

Ich brauche etwas Hilfe um LS2J programmieren zu können.  In Java bin ich leider nicht sattelfest.
Wie muss ich die Java Dateien einbinden, damit ich über Notes darauf zugreifen kann?

Gruss
Manuel
IBM Certified System Administrator - Lotus Notes and Domino 6/6.5

Offline eknori

  • @Notes Preisträger
  • Moderator
  • Gold Platin u.s.w. member:)
  • *****
  • Beiträge: 11.730
  • Geschlecht: Männlich
Re: Text aus PDF lesen und Automatisierung
« Antwort #3 am: 10.09.17 - 18:24:07 »
Du wirst nicht drum herum kommen, dich zunächst einmal mit den Java libraries zu beschafti&en. Das kann man locker in einer Evlipse Entwicklungsumgebung machen. Das arrachment später aus dem Dokument auszulesen kann man später hinzufügen.
Ls2J ? Wozu? Der Code kann komplett in einem Java Agenten abgebildet werden.
Egal wie tief man die Messlatte für den menschlichen Verstand auch ansetzt: jeden Tag kommt jemand und marschiert erhobenen Hauptes drunter her!

Offline Pyewacket

  • Senior Mitglied
  • ****
  • Beiträge: 310
  • Geschlecht: Männlich
Re: Text aus PDF lesen und Automatisierung
« Antwort #4 am: 13.09.17 - 14:45:16 »
Wenn du ein Dokument einscannst und als PDF speicherst dann hast du ein PDF File als
Container mit einem Bild drin. Damit verwendbarer Text draus wird musst du noch,
falls dein Scan-Programm das nicht selber kann,  per OCR-Programm die Grafik in Text
konvertieren was, abhängig von Font und Auflösung des Scans, mehr oder
weniger brauchbaren Text ergibt.
ATOS.org - Feel the music!

 

Impressum Atnotes.de  -  Powered by Syslords Solutions  -  Datenschutz