Das Notes Forum

Domino 9 und frühere Versionen => ND9: Entwicklung => Thema gestartet von: immanuel am 10.09.17 - 10:03:14

Titel: Text aus PDF lesen und Automatisierung
Beitrag von: immanuel am 10.09.17 - 10:03:14
Liebe Notes Entwickler

Ich mörchte mein ERP etwas pimpen und (eingescannte) PDF Rechnungen smart mit Notes wekennen und ablegen.

 Ich möchte also einen Beleg sprechen oder ein scannen und dann mit Lotus Script auf die Formularfelder des PDFs zugreifen oder einfach den gesamten Text liest PDFs.

Kann mir jemand helfen, wie ich mit Lotus Script ein importiertes PDF (in Richtext feld hochgeladen) Text lesen kann? Wie ziehe ich Felder oder OCR Text aus dem PDF raus?

Habe im Netz viel gesucht aber leider nix gefunden.

Hat mur sonst jemand nochn Tipp für Document Management LS klassen oder so?

Vielen Dank und Gruess
Manuel
Titel: Re: Text aus PDF lesen und Automatisierung
Beitrag von: eknori am 10.09.17 - 11:55:37
Mit ls kommst du da sicher nicht weit; mit Java geht das recht einfach. https://pdfbox.apache.org Oder ähnliche libs leisten da gute Dienste.
Titel: Re: Text aus PDF lesen und Automatisierung
Beitrag von: immanuel am 10.09.17 - 15:44:30
Vielen Dank!

Ich brauche etwas Hilfe um LS2J programmieren zu können.  In Java bin ich leider nicht sattelfest.
Wie muss ich die Java Dateien einbinden, damit ich über Notes darauf zugreifen kann?

Gruss
Manuel
Titel: Re: Text aus PDF lesen und Automatisierung
Beitrag von: eknori am 10.09.17 - 18:24:07
Du wirst nicht drum herum kommen, dich zunächst einmal mit den Java libraries zu beschafti&en. Das kann man locker in einer Evlipse Entwicklungsumgebung machen. Das arrachment später aus dem Dokument auszulesen kann man später hinzufügen.
Ls2J ? Wozu? Der Code kann komplett in einem Java Agenten abgebildet werden.
Titel: Re: Text aus PDF lesen und Automatisierung
Beitrag von: Pyewacket am 13.09.17 - 14:45:16
Wenn du ein Dokument einscannst und als PDF speicherst dann hast du ein PDF File als
Container mit einem Bild drin. Damit verwendbarer Text draus wird musst du noch,
falls dein Scan-Programm das nicht selber kann,  per OCR-Programm die Grafik in Text
konvertieren was, abhängig von Font und Auflösung des Scans, mehr oder
weniger brauchbaren Text ergibt.