Bitte verwenden Sie einen anderen Browser

Sie verwenden einen veralteten Browser, der nicht mit den Inhalten unserer Website kompatibel ist. Für ein optimales Anzeigeerlebnis aktualisieren Sie bitte auf Microsoft Edge oder betrachten Sie unsere Website mit einem anderen aktuellen Browser.

Wenn Sie sich dafür entscheiden, diesen Browser weiter zu verwenden, werden Sie nur eingeschränkt Zugriff auf Inhalt und Funktionalität haben.

Capture
Blog

13 Tipps für maximale Produktivität dank reibungsloser kognitiver Dokumentenautomatisierung

Willkommen zum fünften Teil unserer sechsteiligen Serie an Betrachtungen der neuesten Konzepte in den Bereichen Multi-Channel-Dokumentenerfassung und intelligente Zeichenerkennung (OCR). Im Mittelpunkt steht künstliche Intelligenz und wie sie hilft, Dokumente und Daten zu nützlichen Betriebsmitteln zu machen.

In Teil 1 ging es um RPA und ihr Potenzial als Lösung für die Probleme, die in Unternehmen mit manuellen, datenorientierten Aufgaben bestehen, aber auch um ihr bisheriges Unvermögen, die Dokumentenverarbeitung zu automatisieren. Teil 2 handelte dann von kognitiver Dokumentenautomatisierung (Cognitive Document Automation, CDA), die intelligente „Kopfarbeit“, also das Verstehen, um was es bei Dokumenten oder E-Mails geht, welche Informationen enthalten sind und was damit zu tun ist. Und in Teil 3 dieser Serie erläuterten wir, worauf bei einer CDA-Lösung zu achten ist (kleiner Tipp: Mehr als OCR muss sie schon können). In Teil 4 stellte sich die Frage: „Wie bemisst sich der Erfolg von CDA?“

Im fünften Teil dieser Reihe beschäftigen wir uns mit einigen Herausforderungen, denen sich RPA-Kunden gegenübersehen, wenn sie CDA-Lösungen implementieren und versuchen, die Benutzerproduktivität zu maximieren. Zur Auffrischung: Benutzerproduktivität = Genauigkeit + Effizienz (siehe Teil 4).

Trotz all ihrer Vorzüge können CDA-Lösungen immer noch Stolpersteine und Einschränkungen bereithalten. Unten finden Sie einige der häufigsten Herausforderungen, sowie Ratschläge, wie Sie diese erfolgreich umschiffen, bevor Sie mit Ihrer CDA-Lösung auf Erfolgskurs gehen können. Dass die von Ihnen bevorzugte CDA-Lösung diesen Herausforderungen etwas entgegenzusetzen hat, ist zu empfehlen.

13 Tipps zum Umgang mit CDA-Herausforderungen zugunsten maximaler Produktivität:

1. Bildquelle

Die Bildquelle beeinflusst die Qualität des Bilds und damit das Genauigkeitsniveau der Klassifikation und Extraktion. Demzufolge zeichnen sich Faxe in der Regel durch eine geringere Bildqualität aus als per E-Mail versendete, rein digital erstellte PDF-Dateien. Zudem unterscheiden sich die Scanner selbst je nach Hersteller und Modell in der Qualität ihrer Arbeitsergebnisse.

2. Bilddateityp und -auflösung

Einige Bilddateien haben eine bessere Qualität als andere. GIF-Dateien mit 300 dpi sind am weitesten verbreitet, aber häufig haben Unternehmen keinen Einfluss darauf, welche Dateitypen ihnen von außen zugespielt werden. Bilder mit geringerer Auflösung bieten ein niedrigeres Genauigkeitsniveau bei der Klassifikation und Extraktion – 300 dpi ist ideal.

3. Bildqualität

Das Sprichwort „Garbage in, garbage out“ (untauglicher Input produziert untauglichen Output) gilt auch für CDA. Mehrfach gefaxte Bilder, per Mobilgerät aufgenommene Bilder, die verzerrt, gekippt oder unscharf sind, einen ähnlichen Hintergrund haben oder schlecht ausgeleuchtet sind, einfarbige Scans, Dokumente mit Stempeln, Gekritzel und/oder Flecken – all dies kann die Genauigkeit bei der Klassifikation und Extraktion beeinträchtigen. Um höchstmögliche Genauigkeit zu gewährleisten, sollten alle von einer CDA-Lösung beschafften Bilder eine Bildverarbeitung und -optimierung durchlaufen, bevor sie automatisch klassifiziert und extrahiert werden.

4. Dokumentenerkennung

Die Anzahl der Muster und ihre Ähnlichkeit mit der realen Vorlage wirken sich ebenfalls auf die Genauigkeit aus. Allgemein gilt, je mehr Muster die CDA-Lösung maschinell lernt, desto besser. Je nach Dokumententyp können ein paar wenige Muster genügen oder aber Hunderte notwendig sein. Diese Muster sollten in der Verarbeitung die „reale Welt“ so genau wie möglich wiedergeben.

5. Strukturierte Formulare

Strukturierte Formulare weisen generell die höchste Genauigkeit bei der Klassifikation und Extraktion auf und erfordern die geringste Anzahl erlernter Muster. Dennoch hat das Formulardesign einen signifikanten Einfluss auf die Genauigkeit, von der Nähe der Felder zueinander bis zu inhalts- oder buchstabenbezogenen Feldern und Feldschattierungen (falls vorhanden). Falls Ihr Unternehmen Einfluss auf das Formulardesign nehmen kann, kann es dieses gleich für die Automatisierung optimieren.

6. Teilweise strukturierte Dokumente

Teilweise strukturierte Dokumente (wie Rechnungen, Bestellungen, Aufträge und Konnossemente) weisen generell eine geringere Genauigkeit auf als strukturierte Formulare. Unterschiedliche CDA-Lösungen verfolgen verschiedene Ansätze, nach gewünschten Daten zu suchen. Einige sind zuverlässiger als andere bei der Suche von Daten und ihrer erfolgreichen Extraktion. Diese Dokumente haben häufig eingebettete Tabellen (z. B. Rechnungspositionen), mehrere Tabellen oder Tabellen in Tabellen mit möglicherweise geringeren Genauigkeitsraten bei der Extraktion als normale Felder.

7. Unstrukturierte Dokumente

Unstrukturierte Dokumente wie E-Mails (Textkörper), Briefe und Verträge sind am schwierigsten automatisch zu klassifizieren und zu extrahieren. KI-basierte Technologien wie die Verarbeitung natürlicher Sprache (NLP) haben in den letzten Jahren die Genauigkeitsraten bei der Extraktion für diese Arten von Dokumenten verbessert.

8. Drucktyp

Die Art des Drucks auf dem Dokument beeinflusst ebenfalls die Genauigkeit der Extraktion. Im Allgemeinen haben maschinell gedruckte Felder die höchste Genauigkeit, gefolgt von Druckschrift und dann kursiven Feldern. Beim Maschinendruck beeinflussen auch die Schriftart und der Zeichenabstand die Genauigkeitsrate. Ebenso kann sich die Dokumentensprache auf die Genauigkeitsraten auswirken, da die von CDA-Lösungen verwendeten OCR-Systeme je nach Sprache unterschiedliche OCR-Genauigkeit bieten, wobei lateinische Sprachen in der Regel die höchste Genauigkeit gewährleisten.

9. Barcodes und Kontrollkästchen

Barcode-Felder und Kontrollkästchen bieten in der Regel die höchste Extraktionsgenauigkeit auf einem Dokument. Es ist für CDA-Lösungen nicht ungewöhnlich, dass sie beim Extrahieren von Barcode-Werten und Kontrollkästchen/Optionsfeldern über 90 Prozent Genauigkeit erreichen. Allerdings gibt es Dutzende von Barcodes, einschließlich 1D-, 2D- und jetzt auch 3D-Barcodes (2D mit Farbe). Stellen Sie also sicher, dass die CDA-Lösung die gebräuchlichsten unterstützt.

10. Unterschriften

Einer der wichtigsten Gründe dafür, dass in vielen Unternehmen immer noch Papier verwendet wird, liegt an den notwendigen Unterschriften. Die Unterschrift auf Papier muss erfasst, klassifiziert und extrahiert werden. Durch den Übergang zu elektronischen Unterschriften kann das Scannen von Papier entfallen, sodass CDA-Benutzer produktiver werden und mehr Zeit für andere Aufgaben haben. Überlegen Sie sich, ob Sie nur das Vorhandensein einer Unterschrift erkennen wollen oder auch eine Unterschriftsprüfung und eine Betrugserkennung benötigen.

11. Datenbanken

Durch den Einsatz von Datenbanken können sich die Genauigkeitsraten für Klassifizierung und Extraktion bei einer CDA-Lösung bedeutend verbessern. Durch den Abgleich mit ähnlichen Inhalten in Datenbanken lassen sich kleinere OCR-Fehler ignorieren. Das Ergebnis: Menschliche Eingriffe zur Bestätigung/Korrektur unsicherer OCR-Ergebnisse sind seltener erforderlich. Datenbanken können Kundennamen, Kontonummern, ERP-Daten wie Auftragsnummern oder Lieferantennamen sowie branchen- oder sprachenspezifische Wörterbücher usw. enthalten.

12. Regeln

Zur Erhöhung der Extraktionsgenauigkeit eines Feldes können auch Regeln verwendet werden. Zum Beispiel das Prüfen, ob die Zwischensumme zuzüglich der Steuern gleich der Gesamtsumme ist, ist eine einfache Regel, die Fehler herausstellen kann, selbst nachdem ein Mitarbeiter einen dieser Feldwerte korrigiert hat. Formatierungsregeln sind ebenfalls eine einfache Methode, um eine hohe Feldgenauigkeit zu gewährleisten (z. B. sollte eine Sozialversicherungsnummer immer das Format XX XXXXXX Z XXX haben, wobei X eine Ziffer zwischen 0 und 9 und Z ein beliebiger Buchstabe ist). Auch die Kontrolle der Prüfsummen von Feldwerten erhöht die Extraktionsgenauigkeit.

13. Zielsysteme

CDA-Lösungen sind nicht vollständig ohne eine einfache Möglichkeit, Dokumente und Daten an die Systeme, Prozesse und Menschen zu senden, die sie benötigen. Die Benutzerproduktivität sinkt enorm, wenn die Benutzer die Dokumentenbilder und -daten manuell von einem System zum anderen verschieben müssen. Vergessen Sie nicht, dass ein RPA-Roboter den Prozess des Verschiebens und der Aggregation der Daten zwischen Systemen automatisieren kann, falls kein gebrauchsfertiger Konnektor für das Zielsystem verfügbar ist.

Weitere Betrachtungen bei der Evaluierung von CDA-Funktionen finden Sie im Whitepaper „Cognitive Document Automation: It’s Not Just About OCR“ (Kognitive Dokumentenautomatisierung: mehr als nur OCR).

White Paper anzeigen