Erweiterte OCR-Optionen konfigurieren
Alle in Continia Document Capture importierten PDF-Dateien werden mit den OCR-Einstellungen verarbeitet, die zum Zeitpunkt der Verarbeitung gültig sind. Wenn Sie keine Anpassungen vornehmen, gelten die Standardeinstellungen. Es ist jedoch möglich, einige der erweiterten Einstellungen an Ihre Anforderungen anzupassen. Informationen hierzu finden Sie in den folgenden Abschnitten.
So konfigurieren Sie OCR-Einstellungen
Mit den folgenden Schritten können Sie konfigurieren, wie eingehende Dokumente mit OCR verarbeitet werden:
- Wählen Sie das Symbol , geben Sie Belegkategorien ein, und wählen Sie dann den zugehörigen Link.
- Öffnen Sie die entsprechende Belegkategorie. Um beispielsweise die Kategorie für Einkaufsbelege zu öffnen, wählen Sie die Zeile EINKAUF (nicht den Code EINKAUF), und wählen Sie dann Bearbeiten in der Aktionsleiste.
- Konfigurieren Sie im Inforegister OCR-Verarbeitung die Einstellungen nach Bedarf. Weitere Informationen und Empfehlungen finden Sie unter Tipps und empfohlene Einstellungen weiter unten.
Tipps und empfohlene Einstellungen
Die folgende Tabelle enthält eine Reihe von Tipps und Empfehlungen für jedes der Felder, das Sie mit der obigen Anleitung anpassen können:
Feld | Tipps und Empfehlungen |
---|---|
Bild-Auflösung | In diesem Feld können Sie die DPI-Auflösung festlegen, die Document Capture für die durch die OCR-Verarbeitung erstellten Dokumentenbilddateien verwenden soll. Der eingegebene Wert muss mindestens 150 DPI betragen; bei Werten darunter erhalten Sie einen Fehler. Je höher der eingegebene Wert, desto besser ist die Auflösung. Beachten Sie jedoch, dass sehr hohe Werte zu entsprechend großen Bilddateien führen, deren Laden in der Benutzeroberfläche lange dauert. Aus diesem Grund empfehlen wir die Auswahl von 300 DPI, um eine gute Auflösung und akzeptable Dateigrößen zu gewährleisten. |
TIFF Image Farbmodus | Hier können Sie den Farbmodus der Bilddateien festlegen, in den alle importierten PDF-Dateien konvertiert werden. Sie können zwischen den folgenden Optionen wählen:
|
Max. Anzahl zu verarbeitender Seiten pro Datei | In diesem Feld können Sie festlegen, wie viele Seiten für jede importierte Datei OCR-verarbeitet werden sollen. So können Sie die Importzeit verkürzen und so den Importvorgang optimieren. Die letzten drei Seiten jeder importierten Datei werden immer verarbeitet, da sie normalerweise wichtige Informationen enthalten. Beachten Sie, dass Document Capture den Dokumentenimport insgesamt auf 500 Seiten begrenzt. Dies bedeutet, dass keine Dokumente mit mehr als 500 Seiten in Document Capture importiert werden können, unabhängig davon, welchen Wert Sie in dieses Feld eingeben. |
OCR Sprachen | In diesem Feld können Sie alle Sprachen hinzufügen, deren Zeichensätze von Document Capture bei der OCR-Verarbeitung eingehender Belege erkannt werden sollen. Wir empfehlen, die Anzahl der aktivierten Sprachen auf die beim Dokumentenimport am häufigsten verwendeten Sprachen zu beschränken (im Allgemeinen nur Ihre Landessprache und, falls relevant, Englisch), da die Aktivierung zu vieler Sprachen wahrscheinlich die Gesamtqualität der Texterkennung beeinträchtigt. |
PDF mit eingebetteten XML-Dateien verarbeiten | Mit diesem Schalter können Sie den Import von XML-Dateien aktivieren, die in PDFs eingebettet sind (z. B. ZUGFeRD, Factur-X und XRechnung). Weitere Informationen finden Sie unter Import von PDF-Dateien mit eingebetteten XML-Dateien aktivieren (ZUGFeRD, XRechnung). |
Informationen zu den übrigen anpassbaren Feldern im Inforegister OCR Verarbeitung, die sich alle auf die automatische Aufteilung von Dokumenten beziehen, finden Sie unter Belege automatisch aufteilen.