{"id":17589,"date":"2020-06-11T11:14:42","date_gmt":"2020-06-11T11:14:42","guid":{"rendered":"http:\/\/parashift.io\/?p=3661"},"modified":"2025-11-30T22:40:04","modified_gmt":"2025-11-30T22:40:04","slug":"implikationen-von-ml-basierter-dokumentenextraktion-auf-robotic-process-automation-software","status":"publish","type":"post","link":"https:\/\/parashift.ai\/de\/implikationen-von-ml-basierter-dokumentenextraktion-auf-robotic-process-automation-software\/","title":{"rendered":"Implikationen von ML-basierter Dokumentenextraktion auf Robotic Process Automation Software"},"content":{"rendered":"\n<p>Machine Learning (ML),&nbsp;<a href=\"https:\/\/de.wikipedia.org\/wiki\/Computer_Vision\" rel=\"noreferrer noopener\" target=\"_blank\">Computer Vision<\/a>&nbsp;und Robotic Process Automation (RPA) sind einige der am meisten gehypten W\u00f6rter im Tech Space heutzutage. Warum auch nicht?! Denn der Einfluss, den die dahinterstehenden Technologien bereits heute in den verschiedensten Gesch\u00e4ftsbereichen haben, ist erheblich. Sie f\u00fchren zu rationalisierten Unternehmensabl\u00e4ufen, Kostensenkungen, intelligenten L\u00f6sungen oder Weiterentwicklungen, schnelleren Entscheidungen und diversen weiteren Vorteilen.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Wie kann RPA f\u00fcr Unternehmen n\u00fctzlich sein?<\/h4>\n\n\n\n<p><a href=\"https:\/\/medium.com\/the-mission\/what-is-robotic-process-automation-how-does-it-compare-to-traditional-automation-e2a210e33c3d\" target=\"_blank\" rel=\"noopener\">RPA<\/a>&nbsp;erm\u00f6glicht es Unternehmen, so genannte &#8222;Roboter&#8220; zu konfigurieren, die menschliche Handlungen und Arbeitsabl\u00e4ufe nachahmen k\u00f6nnen. Die Technologie hilft demnach Unternehmen, die allt\u00e4glichen Aufgaben und regelbasierten, statischen, sich wiederholenden Prozesse zu automatisieren. Dies hat mehrere offensichtliche Vorteile:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Die automatisierten Systeme sind viel schneller und sparen dadurch Zeit und Geld<\/li>\n\n\n\n<li>Zeiteinsparungen erm\u00f6glichen es dem Management, diese freigesetzten Ressourcen alternativ f\u00fcr andere h\u00f6herstehende Arbeiten, die Kreativit\u00e4t und andere menschliche F\u00e4higkeiten bedingen, einzusetzen<\/li>\n\n\n\n<li>Prozesse sind weniger fehleranf\u00e4llig als manuelle Arbeit<\/li>\n\n\n\n<li>RPA ist in der Regel leicht skalierbar und eignet sich daher f\u00fcr Organisationen, die mit vielen Daten- und Informations-basierten Prozessen zu tun haben<\/li>\n<\/ul>\n\n\n\n<p>Diese Vorteile haben zu weit verbreitetem Einsatz und Popularit\u00e4t von RPA gef\u00fchrt. Genutzt werden die Systeme beispielsweise, um sich in Anwendungen einzuloggen, Dateien und Ordner zu verschieben, Daten zu kopieren und wieder zu einf\u00fcgen, Berechnungen durchzuf\u00fchren, Websites durchzust\u00f6bern und relevante Daten rauszuziehen sowie Textinhalte aus Dokumenten, PDFs, E-Mails und Formularen zu extrahieren. Neben diesen exemplarischen Use Cases gibt es aber etliche weitere Einsatzm\u00f6glichkeiten, wo RPA pr\u00e4destiniert ist.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Optische Zeichenerkennung (Optical Character Recognition = OCR)<\/h4>\n\n\n\n<p>Es ist ziemlich offensichtlich, dass Dokumentenextraktion und RPA stark voneinander profitiert haben. Dies aufgrund dessen, da mit Hilfe von OCR relevante Informationen aus Dokumenten unterschiedlicher Art wie Rechnungen, Bilanzen, Rechtsdokumenten, Kontoausz\u00fcgen, Steuererkl\u00e4rungen, usw., automatisiert extrahiert werden k\u00f6nnen. OCR Technologien verwenden dazu visuelle Techniken, um ein Bild auf R\u00e4nder, Schriftarten und Zeichen zu scannen. Durch den Gebrauch erg\u00e4nzender Techniken wie zum Beispiel&nbsp;<a href=\"https:\/\/de.wikipedia.org\/wiki\/K%C3%BCnstliches_neuronales_Netz\" rel=\"noreferrer noopener\" target=\"_blank\">neuronale Netzen<\/a>&nbsp;erkennt sie die Zeichen und verwendet dar\u00fcber hinaus linguistische Konzepte der&nbsp;<a href=\"https:\/\/towardsdatascience.com\/introduction-to-natural-language-processing-for-text-df845750fb63\" rel=\"noreferrer noopener\" target=\"_blank\">Natural Language Processing<\/a>&nbsp;(NLP), um W\u00f6rter und Semantik zu erkennen. F\u00fcr RPA relevant sind diese Technologien also, da dadurch weitere Arbeitsschritte in verschiedenen Prozesse ebenso teil- oder vollautomatisiert werden k\u00f6nnen. Und da Automation bei vielen Firmen Top of Mind ist, wird entsprechend viel in diese Richtung investiert, geforscht und gearbeitet.<\/p>\n\n\n\n<p>Ein Beispiel zur Untermauerung der Relevanz: Stellen Sie sich einen Menschen vor, der versucht, diese kleinen Datenst\u00fccke aus Tausenden von Rechnungen zu lesen und sie in die Datenbank zu kopieren. Dies geschieht nicht nur sehr langsam und ist langweilig, sondern in der Regel auch ziemlich fehleranf\u00e4llig. Dank den M\u00f6glichkeiten von OCR sind Aufgaben wie die Dateneingabe gr\u00f6sstenteils automatisiert und pr\u00e4ziser geworden. Anstatt manuell in einem 100-seitigen Dokument nach einem bestimmten Text zu suchen, k\u00f6nnen diese Programme das Dokument innert K\u00fcrze scannen und den Inhalt im Handumdrehen abrufen beziehungsweise ausgeben. Zugegeben, nicht immer fehlerfrei.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">OCR-Herausforderungen f\u00fcr RPA-Entwickler<\/h4>\n\n\n\n<p>Wie jede andere Technologie hat auch OCR seine Probleme und offenbart Anwendern eine gewisse Komplexit\u00e4t. Das h\u00e4ufigste Problem ist die fehlerhafte Zeichenerkennung, die auf mehrere Faktoren zur\u00fcckzuf\u00fchren sein kann:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Schlechte Qualit\u00e4t des Scanners, was zu Flecken und ungleichm\u00e4ssigem Kontrast auf dem Dokument f\u00fchrt<\/li>\n\n\n\n<li>Wiederholtes Scannen eines bereits gescannten Dokuments<\/li>\n\n\n\n<li>Falsche Ausrichtung der Seiten im Dokument<\/li>\n\n\n\n<li>Pr\u00e4senz von Wasserzeichen, Stempeln und handgeschriebenem Text auf dem Dokument<\/li>\n\n\n\n<li>Zerknitterte und\/oder verblasste Dokumente<\/li>\n\n\n\n<li>Spezielle Textformate mit verschiedenen Bl\u00f6cken und Umbr\u00fcchen<\/li>\n<\/ul>\n\n\n\n<p>Wenn das Dokument oder der Scan eines der obigen Merkmale aufweist, k\u00f6nnen wir m\u00f6glicherweise nicht den gew\u00fcnschten Grad an Genauigkeit erreichen. Dies kann beispielsweise zu F\u00e4llen f\u00fchren, in denen die OCR-Engine eine &#8222;5&#8220; als &#8222;S&#8220; oder den Buchstaben &#8222;O&#8220; anstelle der Zahl &#8222;0&#8220; erkennt. Bei Dokumenten, die tabellarische Daten enthalten wie Rechnungen und Bilanzen, wird es schwierig, die Grenzen der Spalten zu erkennen, was zu einer fehlerhaften Zuordnung der Daten f\u00fchren kann.&nbsp;<\/p>\n\n\n\n<p>Wie man sieht, haben solche Situationen negative Auswirkungen und sind Knackpunkte in der Architektur, Entwicklung und dem Betrieb von RPA Anwendungen. Wenn zum Beispiel ein Dezimalpunkt fehlt und $400,00 als $40000 gelesen wird, kann dies gravierende Folgen haben. Dies daher, da normalerweise diverse weitere Schritte auf den Resultaten der Dokumentenextraktion basieren und teilweise \u00fcber l\u00e4ngere Zeit &#8211; das w\u00e4re auf jeden Fall in einer Idealwelt so angedacht &#8211; menschliche Supervision fehlt. Eine Ungenauigkeit in diesem fr\u00fchen Stadium kann daher eine ernsthafte Herausforderung f\u00fcr die nachgeschalteten Prozesse darstellen, die die eingelesenen Daten weiterverarbeiten. Hinzu kommt die Tatsache, dass es in einem Unternehmen Tausende oder gar Millionen solcher Dokumente gibt, die fortlaufend verarbeitet werden m\u00fcssen. Fehler zu Beginn des Prozesses \u00fcbertragen sich auf dem Weg zu den nachgeschalteten Prozessen und werden somit zu Fehlern im Dokumentenmanagement-System (DMS), ERP oder anderen f\u00fchrenden Systemen f\u00fchren. In Kurzform: OCR-basierte RPA Anwendungen sind oftmals weniger Robust und mit dem Bedarf f\u00fcr menschliche Intervention konfrontiert, sprich, verlangsamt. Und dennoch ist es ein unabdingbarer Weg, weil so Daten von verschiedenen Medien kosteng\u00fcnstig in einem System erfasst werden k\u00f6nnen.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Wie k\u00f6nnen diese Herausforderungen \u00fcberwunden werden?<\/h4>\n\n\n\n<p>Sie sehen, an dieser Stelle ist &#8211; zumindest heute noch &#8211; die menschliche Nachbearbeitung unerl\u00e4sslich. Nun haben Sie die M\u00f6glichkeit, entweder selbst interne Prozesse zu entwickeln und einzuf\u00fchren, damit Ihre Mitarbeitenden die extrahierten Metadaten Ihrer OCR auf Fehler \u00fcberpr\u00fcfen und Korrekturen (in diesem Kontext auch Annotation gennant) vornehmen k\u00f6nnen oder Sie suchen nach einem dedizierten Anbieter, der in diesen Belangen aufgrund der Spezialisierung wesentlich effizienter unterwegs ist und entscheiden sich somit, diese Leistungen stattdessen einzukaufen.<\/p>\n\n\n\n<p>Mit Parashift kriegen Sie all dies aus einem Haus. Das heisst, einerseits eine marktf\u00fchrende OCR Software aber zugleich auch effiziente und beliebig skalierbare Annotation der Extraktionsergebnisse. Neben dem dadurch m\u00f6glichen Effizienzgewinn ist also ein weiterer Vorteil, dass Sie abgesehen von stets korrekten Daten auch eine kontinuierliche Verbesserung der Extraktionssoftware realisieren k\u00f6nnen, f\u00fcr welche Sie im Vergleich zu herk\u00f6mmlichen OCR Anbietern keine hochpreisigen Investitionen t\u00e4tigen und Projekte planen m\u00fcssen. Dabei beschr\u00e4nkt sich die Verbesserung der Parashift OCR \u00fcbrigens nicht nur auf die Genauigkeit, sondern auch auf die Unterst\u00fctzung verschiedener Dokumenttypen. Konkret ist Parashift bestrebt, allerlei g\u00e4ngigen Gesch\u00e4ftsdokumente des Alltages so zu standardisieren, dass Sie beispielsweise einfach einen Vertrag hochladen k\u00f6nnen und Sie unmittelbar die wichtigsten Daten daraus in perfekter Qualit\u00e4t zur\u00fcck erhalten. Konfiguration und Training sollen dazu nicht mehr notwendig sein. Um mehr dar\u00fcber zu erfahren, lesen Sie doch diesen Beitrag&nbsp;<a href=\"https:\/\/parashift.ai\/de\/standard-dokumenttypen-und-das-parashift-learning-network\/\" target=\"_blank\" rel=\"noreferrer noopener\">hier<\/a>.<\/p>\n\n\n\n<p>Was die Implementierung, Optimierung und Skalierbarkeit unserer Dokumentenextraktions-L\u00f6sung betrifft, so bietet die Cloud-basierte OCR Software zahlreiche Vorteile. Denn die offene und erweiterbare Plattform erm\u00f6glicht den sofortigen Zugriff auf Funktionalit\u00e4ten und Learnings, die auf einer extrem grossen Anzahl von Dokumenten basieren und bedingen daher keine kostspieligen und langwierigen Projekte, bis Sie mit dem Normalbetrieb starten k\u00f6nnen. Zudem ist die Software aufgrund simplen und gut dokumentierten APIs einfach in allerlei Business Software zu integrieren. So sind Legacy-System-Projekte vergleichsweise immense Geld verschlingende Unterfangen und erst noch nicht wirklich zukunftsf\u00e4hig.<\/p>\n\n\n\n<p>Zusammenfassend l\u00e4sst sich sagen, dass&nbsp;<a href=\"https:\/\/parashift.ai\/de\/die-evolution-der-dokumentenerfassung\/\" target=\"_blank\" rel=\"noreferrer noopener\">OCR Technologien bereits einen langen Weg zur\u00fcckgelegt haben<\/a>, um zunehmend verl\u00e4sslicher in der Lage zu sein, Informationen korrekt aus noch so unstrukturierten Dokumenten zu extrahieren. Doch auch wenn diese L\u00f6sungen dato heute leistungsstark sind und die Kosten um ein Vielfaches reduzieren k\u00f6nnen, bleiben gewisse Herausforderungen bez\u00fcglich Genauigkeit bestehen. In dieser Hinsicht ist ein effizientes menschliches Eingreifen sinnvoll und auch noch notwendig, sodass Fehler vermeiden und die F\u00e4higkeiten der Extraktionsmaschine nachhaltig verbessert werden k\u00f6nnen.<\/p>\n\n\n\n<p>Wie erw\u00e4hnt, kombinieren wir bei Parashift genau diese beiden Dimensionen: Top-notch Machine Learning Technologien und menschliche Nachbearbeitung. Dies, um eine flexible und effiziente L\u00f6sung zu schaffen, die jeder Herausforderung der Dokumentenextraktion gewachsen ist und stets ausgezeichnete Daten liefert. Etwas, das Stand heute sonst kein anderer OCR Provider liefern kann. Probieren Sie es selbst aus!<\/p>\n\n\n\n<div class=\"wp-block-buttons is-content-justification-center is-layout-flex wp-container-core-buttons-is-layout-16018d1d wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button is-style-outline is-style-outline--1\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/parashift.ai\/sign-up\/\" target=\"_blank\" rel=\"noreferrer noopener\">Kostenlos testen<\/a><\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Machine Learning (ML),&nbsp;Computer Vision&nbsp;und Robotic Process Automation (RPA) sind einige der am meisten gehypten W\u00f6rter im Tech Space heutzutage. Warum auch nicht?! Denn der Einfluss, den die dahinterstehenden Technologien bereits heute in den verschiedensten Gesch\u00e4ftsbereichen haben, ist erheblich. Sie f\u00fchren&#8230;<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[121],"tags":[],"class_list":["post-17589","post","type-post","status-publish","format-standard","hentry","category-allgemein-2"],"_links":{"self":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/17589","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/comments?post=17589"}],"version-history":[{"count":2,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/17589\/revisions"}],"predecessor-version":[{"id":30934,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/17589\/revisions\/30934"}],"wp:attachment":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/media?parent=17589"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/categories?post=17589"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/tags?post=17589"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}