{"id":4754,"date":"2021-02-23T05:00:00","date_gmt":"2021-02-23T05:00:00","guid":{"rendered":"http:\/\/parashift.io\/?p=4754"},"modified":"2025-11-30T22:41:30","modified_gmt":"2025-11-30T22:41:30","slug":"die-erste-ocr-dokumentenextraktion-ohne-nachkontrolle","status":"publish","type":"post","link":"https:\/\/parashift.ai\/de\/die-erste-ocr-dokumentenextraktion-ohne-nachkontrolle\/","title":{"rendered":"Die erste OCR Dokumentenextraktion ohne Nachkontrolle"},"content":{"rendered":"\n<p>Kollaborationen gibt es zuhauf. Kein Bock auf Miley Cyrus w\u00e4hrend der Fahrt im Taxi? Dann einfach Uber bestellen und im Fond die eigene Spotify-Playlist geniessen. Oder beim n\u00e4chsten Stadtbummel garantiert auffallen? Ein Kinderspiel mit den abgefahrenen Yeezys von Kanye West und Nike &#8211; nur zwei der zahlreichen Beispiele von Kollaborationen. Die Frage, ob es noch weitere braucht, ist durchaus berechtigt. Die Antwort ist: Eine mag es aber schon noch leiden, zumal diese auch eine etwas andere ist. N\u00e4mlich die Kollaboration zwischen Mensch und Maschine, dem sogenannten Human in the Loop (HITL).<\/p>\n\n\n\n<p><\/p>\n\n\n\n<div class=\"wp-block-buttons is-horizontal is-content-justification-center is-layout-flex wp-container-core-buttons-is-layout-499968f5 wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button is-style-outline is-style-outline--1\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/parashift.ai\/de\/null-nachbearbeitung\/\" target=\"_blank\" rel=\"noreferrer noopener\">Dokumentenextraktion ohne Nachvalidierung<\/a><\/div>\n<\/div>\n\n\n\n<p><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-rein-manuelle-arbeiten-machen-niemanden-glucklich\">Rein manuelle Arbeiten machen niemanden gl\u00fccklich<\/h2>\n\n\n\n<p>Automatisierungen sollen den Menschen im Arbeitsalltag dienen und ihnen manuelle Arbeiten abnehmen. Diese manuellen Arbeiten stehen sehr oft &#8211; zu Recht &#8211; in der Kritik, zeit-, kostenintensiv und fehleranf\u00e4llig zu sein. Das zeigt sich beispielsweise bei der Dokumentenverarbeitung ganz spezifisch: Wenn manuell ausgef\u00fchrt, dann sind diese enorm zeit- und damit kostenintensiv, was gleichzeitig die Chefetage nerv\u00f6s macht und den Mitarbeitern mit m\u00fchsamen und langwierigen Arbeiten kaum Mehrwert geben wird. Zus\u00e4tzlich ist bei langweiligen, sich wiederholenden und damit nur wenig fordernden Arbeiten oft die Fehleranf\u00e4lligkeit h\u00f6her, was dann auch niemanden gl\u00fccklich macht. Doch was und wo genau Automatisierungen vornehmen?<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Parashift: Autonome, genaue, schmerzfreie und voll validierte Dokumentenextraktion<\/p>\n<\/blockquote>\n\n\n\n<p><\/p>\n\n\n\n<!--HubSpot Call-to-Action Code --><span class=\"hs-cta-wrapper\" id=\"hs-cta-wrapper-198a3488-dee9-4745-8736-285acccf397a\"><span class=\"hs-cta-node hs-cta-198a3488-dee9-4745-8736-285acccf397a\" id=\"hs-cta-198a3488-dee9-4745-8736-285acccf397a\"><!--[if lte IE 8]><div id=\"hs-cta-ie-element\"><\/div><![endif]--><a href=\"https:\/\/cta-redirect.hubspot.com\/cta\/redirect\/5804034\/198a3488-dee9-4745-8736-285acccf397a\" target=\"_blank\" rel=\"noopener\"><img fetchpriority=\"high\" decoding=\"async\" class=\"hs-cta-img\" id=\"hs-cta-img-198a3488-dee9-4745-8736-285acccf397a\" style=\"border-width:0px;\" height=\"418\" width=\"800\" src=\"https:\/\/no-cache.hubspot.com\/cta\/default\/5804034\/198a3488-dee9-4745-8736-285acccf397a.png\" alt=\"Parashift On-Demand-Webinare\"><\/a><\/span><script charset=\"utf-8\" src=\"https:\/\/js.hscta.net\/cta\/current.js\"><\/script><script type=\"text\/javascript\"> hbspt.cta.load(5804034, '198a3488-dee9-4745-8736-285acccf397a', {\"region\":\"na1\"}); <\/script><\/span><!-- end HubSpot Call-to-Action Code -->\n\n\n\n<p><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-automatisierungen-bei-der-rechnungsverarbeitung\">Automatisierungen bei der Rechnungsverarbeitung<\/h2>\n\n\n\n<p>Wie bei so vielem, ist nat\u00fcrlich auch hier der Kontext wichtig. Der gesamte <a href=\"https:\/\/parashift.ai\/de\/wie-sie-mit-automatisierter-datenerfassung-ihre-workflow-probleme-angehen\/\" target=\"_blank\" rel=\"noreferrer noopener\">Workflow<\/a> in einem Unternehmen muss betrachtet werden, in diesem Beispiel die Dokumentenverarbeitung und spezifisch die Rechnungsverarbeitung mit den \u00fcblichen Daten wie:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Rechnungsnummer<\/li>\n\n\n\n<li>Lieferant<\/li>\n\n\n\n<li>Zahlungsdatum<\/li>\n\n\n\n<li>Rechnungsbetrag<\/li>\n\n\n\n<li>und so weiter<\/li>\n<\/ul>\n\n\n\n<p>Es braucht demnach Automatisierungen im Bereich des Rechnungseingangs, damit die Rechnungen m\u00f6glichst gar nicht erst in Ber\u00fchrung mit Mitarbeitern kommen.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Human in the Loop &#8211; maschinelle Verarbeitung und menschliche Nachkontrolle<\/p>\n<\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-die-maschine-alias-die-intelligente-ki-basierte-ocr\">Die Maschine alias die intelligente, KI-basierte OCR<\/h2>\n\n\n\n<p>Hier kommt die intelligente, KI-basierte OCR (Optical Character Recognition) zum Zug. Die intelligente, KI-basierte OCR erfasst die eingehenden Rechnungen automatisch, verbessert die Qualit\u00e4t (bei Bedarf inklusive Seitentrennung), klassifiziert die Rechnungen und extrahiert schliesslich alle relevanten Daten daraus automatisch. Was bleibt sind strukturierte Daten, die automatisiert weiterverarbeitet werden k\u00f6nnen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-data-fur-die-maschine-human-in-the-loop-fur-die-nachkontrolle\">Data f\u00fcr die Maschine &#8211; Human in the Loop f\u00fcr die Nachkontrolle<\/h2>\n\n\n\n<p>Jedes KI-System ben\u00f6tigt Menschen in der Schleife. Zumindest bis zu einem gewissen Grad. Die intelligente OCR ist nat\u00fcrlich nur so intelligent, wie dies die gef\u00fctterten Daten zulassen, aus denen die unterschiedlichen Modelle lernen und auf Basis welcher sie ihre Klassifikationen erstellen. Um die Performance der Klassifikationen \u00fcberhaupt validieren zu k\u00f6nnen, braucht die KI einen bereits in der Cloud erfassten Datensatz, auf dem basierend sie<\/p>\n\n\n\n<p>a) eine Ground-Truth zur Verf\u00fcgung hat, um zu wissen, welche Werte korrekt sind beziehungsweise tats\u00e4chlich auf einem Dokument stehen<\/p>\n\n\n\n<p>b) f\u00e4hig ist, Parameter sukzessive so zu w\u00e4hlen, dass Fehler minimiert werden k\u00f6nnen<\/p>\n\n\n\n<p>c) kontinuierlich die M\u00f6glichkeit hat, Parameter neu zu erstellen, um f\u00fcr eine spezifische Metrik optimiert zu werden.<\/p>\n\n\n\n<p>Kann eine Klassifikation nicht vorgenommen oder verbessert werden, beispielsweise aufgrund von fehlenden Datens\u00e4tzen, braucht die KI zus\u00e4tzlichen Kontext. Den bekommt sie vom Human in the Loop. Unkorrekte Daten oder Fehler, die zu Kennzeichnungs\u00e4nderungen f\u00fchren, k\u00f6nnen dank dem Human in the Loop schnell erkannt und korrigiert werden. Mit der menschlichen Nachkontrolle kann die Klassifikation validiert und gegebenenfalls anders gekennzeichnet werden, so dass in Zukunft diese Klassifikationen verbessert und wiederum automatisiert und korrekt getroffen werden k\u00f6nnen.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Der Human in the Loop best\u00e4tigt, verweigert oder kennzeichnet bei Bedarf den Output der Maschine<\/p>\n<\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-null-nachbearbeitung-seitens-der-kunden-notig\">Null Nachbearbeitung seitens der Kunden n\u00f6tig<\/h2>\n\n\n\n<p>Was die intelligente, KI-basierte OCR nicht automatisch erledigt, wird demnach intern durch den <a href=\"https:\/\/parashift.ai\/de\/human-in-the-loop\/\" target=\"_blank\" rel=\"noreferrer noopener\">Human in the Loop<\/a> \u00fcbernommen und voll validiert, damit sich der Kunde zur\u00fccklehnen und den Caf\u00e9 geniessen kann. Oder sich eben um wesentlich wichtigere Dinge wie Kunden und Handelspartnern k\u00fcmmern kann.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-massenhaft-vorteile-durch-human-in-the-loop\">Massenhaft Vorteile durch Human in the Loop<\/h2>\n\n\n\n<p>Die Zusammenarbeit von Maschine und Human in the Loop zur Nachkontrolle bietet also zahlreiche Vorteile:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Schnelle Verarbeitung (bei notwendigen Interaktionen ist der Human in the Loop zur Stelle)<\/li>\n\n\n\n<li>Hohe Kostenreduktion (zuvor manuelle Arbeiten seitens der Mitarbeiter fallen weg)<\/li>\n\n\n\n<li>Keine Dokumenteninteraktion mehr notwendig<\/li>\n\n\n\n<li>Erh\u00f6hung des Straight Through Processing durch korrekte Daten (Abstimmungen, Verbuchungen, Bestellungen usw.)<\/li>\n<\/ul>\n\n\n\n<p>Auch wenn sich \u201aMensch in der Schleife\u2018 auf den ersten Blick schon sehr nach der Maschine Untertan anh\u00f6rt, ist dies (noch) nicht der Fall. F\u00fcr den erfolgreichen Prozess braucht es die Zusammenarbeit beider.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-horizontal is-content-justification-center is-layout-flex wp-container-core-buttons-is-layout-499968f5 wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button is-style-outline is-style-outline--2\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/parashift.ai\/sign-up\/\" target=\"_blank\" rel=\"noreferrer noopener\">Kostenlos testen<\/a><\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Kollaborationen gibt es zuhauf. Kein Bock auf Miley Cyrus w\u00e4hrend der Fahrt im Taxi? Dann einfach Uber bestellen und im Fond die eigene Spotify-Playlist geniessen. Oder beim n\u00e4chsten Stadtbummel garantiert auffallen? Ein Kinderspiel mit den abgefahrenen Yeezys von Kanye West&#8230;<\/p>\n","protected":false},"author":5,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[121],"tags":[],"class_list":["post-4754","post","type-post","status-publish","format-standard","hentry","category-allgemein-2"],"_links":{"self":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/4754","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/comments?post=4754"}],"version-history":[{"count":2,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/4754\/revisions"}],"predecessor-version":[{"id":31003,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/4754\/revisions\/31003"}],"wp:attachment":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/media?parent=4754"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/categories?post=4754"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/tags?post=4754"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}