Willkommen zum fünften Teil unserer sechsteiligen Serie an Betrachtungen der neuesten Konzepte in den Bereichen Multi-Channel-Dokumentenerfassung und intelligente Zeichenerkennung (OCR). Im Mittelpunkt steht künstliche Intelligenz und wie sie hilft, Dokumente und Daten zu nützlichen Betriebsmitteln zu machen.
In Teil 1 ging es um RPA und ihr Potenzial als Lösung für die Probleme, die in Unternehmen mit manuellen, datenorientierten Aufgaben bestehen, aber auch um ihr bisheriges Unvermögen, die Dokumentenverarbeitung zu automatisieren. Teil 2 handelte dann von kognitiver Dokumentenautomatisierung (Cognitive Document Automation, CDA), die intelligente „Kopfarbeit“, also das Verstehen, um was es bei Dokumenten oder E-Mails geht, welche Informationen enthalten sind und was damit zu tun ist. Und in Teil 3 dieser Serie erläuterten wir, worauf bei einer CDA-Lösung zu achten ist (kleiner Tipp: Mehr als OCR muss sie schon können). In Teil 4 stellte sich die Frage: „Wie bemisst sich der Erfolg von CDA?“
Im fünften Teil dieser Reihe beschäftigen wir uns mit einigen Herausforderungen, denen sich RPA-Kunden gegenübersehen, wenn sie CDA-Lösungen implementieren und versuchen, die Benutzerproduktivität zu maximieren. Zur Auffrischung: Benutzerproduktivität = Genauigkeit + Effizienz (siehe Teil 4).
Trotz all ihrer Vorzüge können CDA-Lösungen immer noch Stolpersteine und Einschränkungen bereithalten. Unten finden Sie einige der häufigsten Herausforderungen, sowie Ratschläge, wie Sie diese erfolgreich umschiffen, bevor Sie mit Ihrer CDA-Lösung auf Erfolgskurs gehen können. Dass die von Ihnen bevorzugte CDA-Lösung diesen Herausforderungen etwas entgegenzusetzen hat, ist zu empfehlen.
13 Tipps zum Umgang mit CDA-Herausforderungen zugunsten maximaler Produktivität:
1. Bildquelle
Die Bildquelle beeinflusst die Qualität des Bilds und damit das Genauigkeitsniveau der Klassifikation und Extraktion. Demzufolge zeichnen sich Faxe in der Regel durch eine geringere Bildqualität aus als per E-Mail versendete, rein digital erstellte PDF-Dateien. Zudem unterscheiden sich die Scanner selbst je nach Hersteller und Modell in der Qualität ihrer Arbeitsergebnisse.
2. Bilddateityp und -auflösung
Einige Bilddateien haben eine bessere Qualität als andere. GIF-Dateien mit 300 dpi sind am weitesten verbreitet, aber häufig haben Unternehmen keinen Einfluss darauf, welche Dateitypen ihnen von außen zugespielt werden. Bilder mit geringerer Auflösung bieten ein niedrigeres Genauigkeitsniveau bei der Klassifikation und Extraktion – 300 dpi ist ideal.
3. Bildqualität
Das Sprichwort „Garbage in, garbage out“ (untauglicher Input produziert untauglichen Output) gilt auch für CDA. Mehrfach gefaxte Bilder, per Mobilgerät aufgenommene Bilder, die verzerrt, gekippt oder unscharf sind, einen ähnlichen Hintergrund haben oder schlecht ausgeleuchtet sind, einfarbige Scans, Dokumente mit Stempeln, Gekritzel und/oder Flecken – all dies kann die Genauigkeit bei der Klassifikation und Extraktion beeinträchtigen. Um höchstmögliche Genauigkeit zu gewährleisten, sollten alle von einer CDA-Lösung beschafften Bilder eine Bildverarbeitung und -optimierung durchlaufen, bevor sie automatisch klassifiziert und extrahiert werden.
4. Dokumentenerkennung
Die Anzahl der Muster und ihre Ähnlichkeit mit der realen Vorlage wirken sich ebenfalls auf die Genauigkeit aus. Allgemein gilt, je mehr Muster die CDA-Lösung maschinell lernt, desto besser. Je nach Dokumententyp können ein paar wenige Muster genügen oder aber Hunderte notwendig sein. Diese Muster sollten in der Verarbeitung die „reale Welt“ so genau wie möglich wiedergeben.
5. Strukturierte Formulare
Strukturierte Formulare weisen generell die höchste Genauigkeit bei der Klassifikation und Extraktion auf und erfordern die geringste Anzahl erlernter Muster. Dennoch hat das Formulardesign einen signifikanten Einfluss auf die Genauigkeit, von der Nähe der Felder zueinander bis zu inhalts- oder buchstabenbezogenen Feldern und Feldschattierungen (falls vorhanden). Falls Ihr Unternehmen Einfluss auf das Formulardesign nehmen kann, kann es dieses gleich für die Automatisierung optimieren.
6. Teilweise strukturierte Dokumente
Teilweise strukturierte Dokumente (wie Rechnungen, Bestellungen, Aufträge und Konnossemente) weisen generell eine geringere Genauigkeit auf als strukturierte Formulare. Unterschiedliche CDA-Lösungen verfolgen verschiedene Ansätze, nach gewünschten Daten zu suchen. Einige sind zuverlässiger als andere bei der Suche von Daten und ihrer erfolgreichen Extraktion. Diese Dokumente haben häufig eingebettete Tabellen (z. B. Rechnungspositionen), mehrere Tabellen oder Tabellen in Tabellen mit möglicherweise geringeren Genauigkeitsraten bei der Extraktion als normale Felder.
7. Unstrukturierte Dokumente
Unstrukturierte Dokumente wie E-Mails (Textkörper), Briefe und Verträge sind am schwierigsten automatisch zu klassifizieren und zu extrahieren. KI-basierte Technologien wie die Verarbeitung natürlicher Sprache (NLP) haben in den letzten Jahren die Genauigkeitsraten bei der Extraktion für diese Arten von Dokumenten verbessert.
8. Drucktyp
Die Art des Drucks auf dem Dokument beeinflusst ebenfalls die Genauigkeit der Extraktion. Im Allgemeinen haben maschinell gedruckte Felder die höchste Genauigkeit, gefolgt von Druckschrift und dann kursiven Feldern. Beim Maschinendruck beeinflussen auch die Schriftart und der Zeichenabstand die Genauigkeitsrate. Ebenso kann sich die Dokumentensprache auf die Genauigkeitsraten auswirken, da die von CDA-Lösungen verwendeten OCR-Systeme je nach Sprache unterschiedliche OCR-Genauigkeit bieten, wobei lateinische Sprachen in der Regel die höchste Genauigkeit gewährleisten.
9. Barcodes und Kontrollkästchen
Barcode-Felder und Kontrollkästchen bieten in der Regel die höchste Extraktionsgenauigkeit auf einem Dokument. Es ist für CDA-Lösungen nicht ungewöhnlich, dass sie beim Extrahieren von Barcode-Werten und Kontrollkästchen/Optionsfeldern über 90 Prozent Genauigkeit erreichen. Allerdings gibt es Dutzende von Barcodes, einschließlich 1D-, 2D- und jetzt auch 3D-Barcodes (2D mit Farbe). Stellen Sie also sicher, dass die CDA-Lösung die gebräuchlichsten unterstützt.
10. Unterschriften
Einer der wichtigsten Gründe dafür, dass in vielen Unternehmen immer noch Papier verwendet wird, liegt an den notwendigen Unterschriften. Die Unterschrift auf Papier muss erfasst, klassifiziert und extrahiert werden. Durch den Übergang zu elektronischen Unterschriften kann das Scannen von Papier entfallen, sodass CDA-Benutzer produktiver werden und mehr Zeit für andere Aufgaben haben. Überlegen Sie sich, ob Sie nur das Vorhandensein einer Unterschrift erkennen wollen oder auch eine Unterschriftsprüfung und eine Betrugserkennung benötigen.
11. Datenbanken
Durch den Einsatz von Datenbanken können sich die Genauigkeitsraten für Klassifizierung und Extraktion bei einer CDA-Lösung bedeutend verbessern. Durch den Abgleich mit ähnlichen Inhalten in Datenbanken lassen sich kleinere OCR-Fehler ignorieren. Das Ergebnis: Menschliche Eingriffe zur Bestätigung/Korrektur unsicherer OCR-Ergebnisse sind seltener erforderlich. Datenbanken können Kundennamen, Kontonummern, ERP-Daten wie Auftragsnummern oder Lieferantennamen sowie branchen- oder sprachenspezifische Wörterbücher usw. enthalten.
12. Regeln
Zur Erhöhung der Extraktionsgenauigkeit eines Feldes können auch Regeln verwendet werden. Zum Beispiel das Prüfen, ob die Zwischensumme zuzüglich der Steuern gleich der Gesamtsumme ist, ist eine einfache Regel, die Fehler herausstellen kann, selbst nachdem ein Mitarbeiter einen dieser Feldwerte korrigiert hat. Formatierungsregeln sind ebenfalls eine einfache Methode, um eine hohe Feldgenauigkeit zu gewährleisten (z. B. sollte eine Sozialversicherungsnummer immer das Format XX XXXXXX Z XXX haben, wobei X eine Ziffer zwischen 0 und 9 und Z ein beliebiger Buchstabe ist). Auch die Kontrolle der Prüfsummen von Feldwerten erhöht die Extraktionsgenauigkeit.
13. Zielsysteme
CDA-Lösungen sind nicht vollständig ohne eine einfache Möglichkeit, Dokumente und Daten an die Systeme, Prozesse und Menschen zu senden, die sie benötigen. Die Benutzerproduktivität sinkt enorm, wenn die Benutzer die Dokumentenbilder und -daten manuell von einem System zum anderen verschieben müssen. Vergessen Sie nicht, dass ein RPA-Roboter den Prozess des Verschiebens und der Aggregation der Daten zwischen Systemen automatisieren kann, falls kein gebrauchsfertiger Konnektor für das Zielsystem verfügbar ist.