RSS Verzeichnis RSS FEED Der Tech-Blog
COMPUTER / COMPUTERTECHNIK / Der Tech-Blog
RSS NEWSFEED INFOS

Feed Titel:
Der Tech-Blog
Feed Beschreibung:
RSS Feed abonnieren:
HTTP://I2dblog.norpa.de/feed/

Ein automatischer Eingangspostverteiler nebst Rechnungsdatenerkenner in unter 100 Zeilen

Ein immer wiederkehrendes Thema ist das automatische Verteilen von Eingangspost. Mit image2data lässt sich ein schneller und effektiver Eingangspostverteiler mit geringem Aufwand erstellen. Das folgende Skript ist nicht für den Produktivbetrieb konzipiert und zeigt beispielhaft einen möglichen Ansatz:image2data durchsucht ein Eingangsverzeichnis nach Dateien mit der Endung ".tif", führt auf die ersten beiden Seiten einer jeden Datei eine Texterkennung aus und durchsucht den gewonnenen Text nach bestimmten Schlüsselwörtern.Die Dokumente im Eingangsverzeichnis können Scans, welche z.B. durch einen Netzwerkscanner dort abgelegt wurden, aber auch manuell oder über die image2data Toolbar dort platzierte Dateien sein. Werden die Wörter "Rechnung" oder "Gutschrift" gefunden, wird das Dokument einer Rechnungsdatenerkennung unterzogen und die ermittelten Rechnungsdaten werden zu dem Scan in einer gleichnamigen ".dat"-Datei gespeichert. Beide Dateien werden dann in den Ordner "Eingangspost Buchhaltung" verschoben. Werden die Begriffe "Kündigung" oder "Beendigung" auf dem Scan gefunden, wird dieser in den Ordner "Eingangspost Kundenbetreuung" verschoben, wird keiner der o.g. Wörter gefunden, so landet der Scan in dem Ordner "Eingangspost Unbekannt". Die folgende Implementierung ist zur Erklärung des Prinzips mit Schwerpunkt auf Transparenz erfolgt. Im Produktivbetrieb werden die Quell- und Zielpfade sowie die Sortierbegriffe aus einer Konfiguration entnommen und viele weitere Szenarien abgebildet. {$I i2dxFiles}{$I i2dxIDEx}{$I i2dcOCRAndExtraction.i2dspt}const MAXPAGECOUNT = 2; RECHNUNGSTAG1 = 'Rechnung'; RECHNUNGSTAG2 = 'Gutschrift'; KUENDIGUNGSTAG1 = 'Kündigung'; KUENDIGUNGSTAG2 = 'Beendigung'; QUELLPFAD = 'Z:\Scan-Eingang\'; ZIELPFADRECHNUNGEN = 'Z:\Eingangspost Buchhaltung\'; ZIELPFADKUENDIGUNGEN = 'Z:\Eingangspost Kundenbetreuung\'; ZIELPFADUNBEKANNT = 'Z:\Eingangspost Unbekannt\'; var i, j, k, l: Integer; sFilePath: String; sFileName: String; sDatFileName: String; sTargetPath: String; sText: String; sInvoiceNumber: String; dInvoiceDate: TDateTime; fAmountNet: Currency; fVATRate: Currency; fAmountVAT: Currency; fAmountGross: Currency; sCountryCode: String; iPageCount: Integer; oFiles: TStringList; oDat: TStringList; begin oFiles := TStringList.Create; try i2dxFilesFindFiles(QUELLPFAD, '*.tif',...

Plugin "XML-Verarbeitung" (i2dxXML)

Dieses Plugin stellt Funktionen zum Parsen, Lesen und Erzeugen von XML-Dateien zur Verfügung. Das folgende Skript iteriert über eine anzugebende XML-Datei und gibt die Knotennamen sowie die -inhalte im Debugfenster aus. // **************************************************************// * sample_i2dxxml.i2dspt *// * *// * Sample script for the i2dxXML (reading and writing of xml *// * files) plugin *// * REQUIRES THE INSTALLED PLUGIN TO COMPILE AND RUN! *// * *// * Press F9 to execute the code or F7/F8 to debug it *// * ...

Plugin "Scanneransteuerung" (i2dxTWAIN)

Häufig liegen Scans noch gar nicht vor, sondern müssen erst erstellt werden. Dies geschieht durch Arbeitsplatz oder Netzwerk-Scanner, die u.a. auch aus einem image2data Skript angesteuert werden können. Das ist i.d.R. einfacher für den Benutzer, der sich dann nicht mit proprietären TWAIN-Oberflächen auseinander zu setzen braucht und keine Dateien umzubenennen oder im Dateisystem hin und her schieben muß, um die Verarbeitung anzustoßen. All diese Parameter und Folgeaktionen können im Skript beschrieben werden und sind damit für den Benutzer nicht änderbar. Das folgende Skript ermittelt alle auf dem System verfügbaren Scanner, liest einen Scan von dem ersten gefundenen ein und speichert das Bild als "c:\test.tif" ab. // **************************************************************// * sample_i2dxtwain.i2dspt *// * *// * Sample script for the i2dxTwain (scanner handling) plugin *// * REQUIRES THE INSTALLED PLUGIN TO COMPILE AND RUN! *// * *// * Press F9...

Plugin "Textextraktion" (i2dxTextExt)

Dieses Plugin wird verwendet, um Volltext aus nahezu allen Dateiformaten zu extrahieren, z.B. aus Microsoft-Office-Dateien (*.doc, *.docx, *.ppt, *.pptx, *.xls, *.xlsx), Open-Office-Dateien (*.odf), Rich-Text-Dateien (*.rtf) oder MBox-Dateien (*.mbox), um hier nur einige zu nennen. Weiterhin können Metadaten aus Bildern, Scans, Filmen und vielen weiteren Dateiformaten extrahiert werden. Für die Extraktion von Text aus PDF-Dateien ist das Plugin hingegen nicht notwendig; dies ist in image2data bereits integriert. Das folgende Skript extrahiert den enthaltenen Text aus einer beliebigen anzugebenden Datei und zeigt ihn im integrierten Textbetrachter an. Anschließend wird der Text aus einer Website extrahiert und angezeigt. // **************************************************************// * sample_i2dxtextex.i2dspt *// * *// * Sample script for the i2dxTextEx (text extraction) plugin *// * REQUIRES THE INSTALLED PLUGIN TO COMPILE AND RUN! *// * *// * Press F9 to execute the code or F7/F8 to debug it ...