{"id":17582,"date":"2020-05-19T10:55:25","date_gmt":"2020-05-19T10:55:25","guid":{"rendered":"http:\/\/parashift.io\/?p=3649"},"modified":"2025-11-30T22:39:53","modified_gmt":"2025-11-30T22:39:53","slug":"die-evolution-der-dokumentenerfassung","status":"publish","type":"post","link":"https:\/\/parashift.ai\/de\/die-evolution-der-dokumentenerfassung\/","title":{"rendered":"Die Evolution der Dokumentenerfassung"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Unz\u00e4hlige Dokumente wie etwa Bestellungen, Lieferscheine und Rechnungen werden tagt\u00e4glich ausgestellt. Diese Dokumente m\u00fcssen anschliessend auf irgendeine Art und Weise in IT-Systemen von Unternehmen erfasst werden. Heutzutage bestehen aufgrund der technologischen Entwicklung auch effiziente Methoden, diese maschinenlesbar und in strukturierter Form an nachgelagerte Prozesse weiterzugeben. Bei Parashift nutzen wir dazu haupts\u00e4chlich Machine Learning. Denn diese Art von Technologie erlaubt es uns, die notwendigen menschlichen Eingriffe auf ein Minimum zu reduzieren. Dies bietet zahlreiche Vorteile. Denn damit kann nicht nur Zeit und Geld gespart werden, sondern k\u00f6nnen auch doch eher eint\u00f6nige und m\u00fchsame Aufgaben vermieden werden. Wie Sie sich sicherlich gut vorstellen k\u00f6nnen, sah die Dokumentenerfassung vor nicht allzu langer Zeit aber noch ganz anders aus. Von den ersten Erfindungen bis hin zu den j\u00fcngsten Entwicklungen sollen Sie nachstehend einen Eindruck erhalten, wie sich die moderne Dokumentenverarbeitung \u00fcber die Jahre weiterentwickelt hat.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<!--HubSpot Call-to-Action Code --><span class=\"hs-cta-wrapper\" id=\"hs-cta-wrapper-198a3488-dee9-4745-8736-285acccf397a\"><span class=\"hs-cta-node hs-cta-198a3488-dee9-4745-8736-285acccf397a\" id=\"hs-cta-198a3488-dee9-4745-8736-285acccf397a\"><!--[if lte IE 8]><div id=\"hs-cta-ie-element\"><\/div><![endif]--><a href=\"https:\/\/cta-redirect.hubspot.com\/cta\/redirect\/5804034\/198a3488-dee9-4745-8736-285acccf397a\" target=\"_blank\" rel=\"noopener\"><img fetchpriority=\"high\" decoding=\"async\" class=\"hs-cta-img\" id=\"hs-cta-img-198a3488-dee9-4745-8736-285acccf397a\" style=\"border-width:0px;\" height=\"418\" width=\"800\" src=\"https:\/\/no-cache.hubspot.com\/cta\/default\/5804034\/198a3488-dee9-4745-8736-285acccf397a.png\" alt=\"Parashift On-Demand-Webinare\"><\/a><\/span><script charset=\"utf-8\" src=\"https:\/\/js.hscta.net\/cta\/current.js\"><\/script><script type=\"text\/javascript\"> hbspt.cta.load(5804034, '198a3488-dee9-4745-8736-285acccf397a', {\"region\":\"na1\"}); <\/script><\/span><!-- end HubSpot Call-to-Action Code -->\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Anf\u00e4nge und erste Versuche<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Wissenschaftler haben schon immer davon getr\u00e4umt, die menschlichen F\u00e4higkeiten mithilfe von Maschinen nachzubilden. Dazu geh\u00f6ren unter anderem auch das Lesen und Kategorisieren des Gelesenen. Die Urspr\u00fcnge der optischen Zeichenerkennung (engl. optical character recognition oder auch kurz OCR) gehen auf das Jahr 1870 zur\u00fcck, als&nbsp;<a href=\"https:\/\/de.wikipedia.org\/wiki\/Charles_Carey\" rel=\"noreferrer noopener\" target=\"_blank\">Charles R. Carey<\/a>, ein amerikanischer Erfinder, den Retina-Scanner erfand \u2013 ein Bild\u00fcbertragungssystem, das ein Mosaik von Fotozellen verwendet. Zwei Jahrzehnte sp\u00e4ter gab die Entwicklung eines sukzessiven Bild-Scanners vom deutschen Erfidner Paul Nipkow den entscheidenden Impuls f\u00fcr heutige Fernsehger\u00e4te oder Lesemaschinen und damit f\u00fcr die Schriftzeichenerkennung.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Die ersten OCR-Ger\u00e4te waren aber in erster Linie f\u00fcr blinde und sehbehinderte Personen gedacht, wie etwa das in 1912 entwickelte&nbsp;<a href=\"https:\/\/de.wikipedia.org\/wiki\/Optophone\" rel=\"noreferrer noopener\" target=\"_blank\">Optophone des irischen Erfinders Dr. Edmund Fournier d&#8217;Albe<\/a>. Das Optophone war ein Scanner, der, wenn er \u00fcber eine gedruckte Seite bewegt wird, T\u00f6ne erzeugt, die bestimmten Buchstaben oder Zeichen entsprechen, sodass sie von einer blinden Person interpretiert werden k\u00f6nnen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Erst in den 50er Jahren und mit der Erfindung des Optacon wurden die m\u00f6glichen Anwendungen, die OCR in der Gesch\u00e4ftswelt haben kann, erkannt. Von diesem Zeitpunkt an, lag auch der Fokus der Entwicklung neu auf den Anwendungsm\u00f6glichkeiten von OCR f\u00fcr Unternehmen.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/blog.parashift.io\/hs-fs\/hubfs\/data_entry_evolution.png?width=600&amp;name=data_entry_evolution.png\" alt=\"Optophone von Dr. Edmund Fournier d'Albe\"\/><figcaption class=\"wp-element-caption\">Optophone von Dr. Edmund Fournier d&#8217;Albe<\/figcaption><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Die ersten OCR-Ger\u00e4te<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">1950 schritt die technologische Revolution mit hoher Geschwindigkeit voran, was steigende Datenmengen zur Folge hatte und somit auch die elektronische Datenverarbeitung zunehmend wichtiger wurde. Damals wurden Daten noch durch Lochkarten eingegeben und anf\u00e4nglich von Hand bearbeitet. Die Verarbeitung zunehmender Datenmengen verlangte jedoch nach einer kosteng\u00fcnstigen Alternative zur manuellen Bearbeitung. Zur gleichen Zeit wurde die Technologie f\u00fcr maschinelles Lesen ausreichend reif f\u00fcr kommerzielle Anwendungen. Das resultierte darin, dass OCR-Ger\u00e4te Mitte der 1950er Jahre in die Massenproduktion gingen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Das&nbsp;<a href=\"https:\/\/en.wikipedia.org\/wiki\/Timeline_of_optical_character_recognition\" rel=\"noreferrer noopener\" target=\"_blank\">erste echte OCR-Ger\u00e4t wurde 1954<\/a>&nbsp;bei der amerikanischen Zeitschrift Reader&#8217;s Digest installiert. Mit diesem Ger\u00e4t wurden Verkaufsberichte, die mit der Schreibmaschine verfasst wurden, in Lochkarten konvertiert, die dann wiederum von Computern eingelesen und durchsucht werden konnten. Noch bestand keine M\u00f6glichkeit, nur die relevantesten Daten zu extrahieren und so wurden immer die ganzen Dokumente eingelesen. Zudem waren die Ger\u00e4te doch noch recht sperrig und teuer.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/blog.parashift.io\/hs-fs\/hubfs\/data_entry_evolution_1.png?width=400&amp;name=data_entry_evolution_1.png\" alt=\"Beispiel einer Lochkarte\"\/><figcaption class=\"wp-element-caption\">Beispiel einer Lochkarte<\/figcaption><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Kommerzialisierung und erste Automatisierung<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Die in der Zeit von 1960 bis 1965 erschienenen kommerziellen OCR-Systeme k\u00f6nnen als die erste OCR Generation bezeichnet werden. Diese Generation erm\u00f6glichte es erste wenige Schritte im Prozess der Dokumentenverarbeitung zu automatisieren. Die ersten Ger\u00e4te hatten aber noch eine sehr eingeschr\u00e4nkte Anzahl Symbole und Buchstaben, die eingelesen werden konnten. Und da die Symbole speziell f\u00fcr maschinelles Lesen konzipiert wurden, sahen die ersten Symbole auch noch nicht sehr nat\u00fcrlich aus.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mit der Weiterentwicklung der Ger\u00e4te kamen dann die ersten Multifont-Ger\u00e4te auf, die bis zu zehn verschiedene Schriftarten lesen konnten. Der IBM 1418 Optical Character Reader ist ein repr\u00e4sentatives Modell f\u00fcr diese Generation. Diese Ger\u00e4te funktionierten mit sogenanntem Template Matching, was eben oben genannte Automatisierungen erm\u00f6glichte. Die OCR-Ger\u00e4te konnten nun n\u00e4mlich trainiert werden, nur vordefinierte Ausschnitte der Dokumente einzulesen. Dadurch wurde schon ein grosses St\u00fcck Arbeit durch die OCR-Ger\u00e4te abgenommen, das&nbsp;zuvor von Menschenhand erledigt werden musste.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mitte der 1960er und Anfang der 1970er Jahre erschien dann die 2. OCR-Ger\u00e4te Generation. Diese Systeme waren in der Lage, normale, maschinengedruckte Zeichen zu erkennen und verf\u00fcgten auch \u00fcber F\u00e4higkeiten zur Erkennung von handgeschriebenen Zeichen. Der Zeichensatz bei handgeschriebenen Zeichen beschr\u00e4nkte sich jedoch auf Ziffern und einige wenige Buchstaben und Symbole.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Das ber\u00fchmte und auch erste System dieser Art war der IBM 1287, der 1965 auf der Weltausstellung in New York pr\u00e4sentiert wurde. Weitere technologische Fortschritte konnten bei Toshiba beobachtet werden, die in der gleichen Zeit die erste automatische Briefsortiermaschine f\u00fcr Postleitzahlen auf den Markt gebracht haben. Ebenfalls in der gleichen Zeitperiode gelang es Hitachi erstmals, ein OCR-Ger\u00e4t mit hoher Leistung f\u00fcr niedrige Kosten herzustellen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ein weiterer Meilenstein waren die Fortschritte in der Standardisierung. So wurde 1968 die erste optisch maschinenlesbare Schriftart&nbsp;<a href=\"https:\/\/de.wikipedia.org\/wiki\/OCR-A\" rel=\"noreferrer noopener\" target=\"_blank\">\u00abOCR-A\u00bb<\/a>&nbsp;vom Schweizer Adrian Frutiger entwickelt. Diese Schrift war stark stilisiert und so gestaltet, dass sie die optische Erkennung erleichterte, aber f\u00fcr den Menschen noch lesbar blieb. Ein paar Jahre sp\u00e4ter entwarf Frutiger eine neue Schriftart,&nbsp;<a href=\"https:\/\/de.wikipedia.org\/wiki\/OCR-B\" rel=\"noreferrer noopener\" target=\"_blank\">\u00abOCR-B\u00bb<\/a>, die den Vorg\u00e4nger abl\u00f6ste. Grund f\u00fcr die neue Schrift war die geringe Beliebtheit in Europa und die in der Zwischenzeit gemachten technologischen Fortschritte in der optischen Zeichenerkennung. Diese Schriftart \u00e4hnelt daher im Vergleich zur OCR-A sehr viel st\u00e4rker einer normalen, serifenlosen Druckschrift. Sie wurde dann 1973 von der&nbsp;<a href=\"https:\/\/de.wikipedia.org\/wiki\/Internationale_Organisation_f%C3%BCr_Normung\" rel=\"noreferrer noopener\" target=\"_blank\">International Organization for Standardization<\/a>, kurz ISO, zum weltweiten Standard erkl\u00e4rt. Es wurden einige Versuche unternommen, die beiden Schriften zu einem Standard zusammenzuf\u00fchren, aber stattdessen wurden Ger\u00e4te entwickelt, die beide Standards lesen konnten.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/blog.parashift.io\/hs-fs\/hubfs\/data_entry_evolution_2.png?width=600&amp;name=data_entry_evolution_2.png\" alt=\"ocr-a und ocr-b\"\/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Technologischer Fortschritt und die Kurzweil Reading Machine<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">F\u00fcr die 3.&nbsp;Generation von OCR-Systemen, die Mitte der 1970er Jahre auf den Markt kam, bestand die gr\u00f6sste Herausforderung im Erkennen von Dokumenten mit schlechter Qualit\u00e4t und grossen gedruckten und handgeschriebenen Zeichens\u00e4tzen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Durch signifikante Fortschritte in der Hardware-Technologie konnten niedrigere Kosten und mehr Leistung der Ger\u00e4te erzielt werden. Obwohl immer ausgekl\u00fcgeltere OCR-Maschinen auf den Markt kamen, waren einfache OCR-Ger\u00e4te immer noch vielfach im Einsatz. In der Zeit, bevor die Personal Computer (PCs) und Laserdrucker den Bereich der Textproduktion zu dominieren begannen, war das Tippen eine besondere Nische f\u00fcr OCR. Der einheitliche Druckabstand und die geringe Anzahl von Schriftarten machten einfach gestaltete OCR-Ger\u00e4te sehr n\u00fctzlich. Grobe Entw\u00fcrfe konnten auf gew\u00f6hnlichen Schreibmaschinen erstellt und \u00fcber ein OCR-Ger\u00e4t zur Endbearbeitung in den Computer eingespeist werden. Auf diese Weise konnten Textverarbeitungsprogramme, die zu dieser Zeit eine kostspielige Ressource waren, von mehreren Personen genutzt und somit hohe Anschaffungskosten vermieden werden.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Zu dieser Zeit gelang es dem Forscher&nbsp;<a href=\"https:\/\/de.wikipedia.org\/wiki\/Raymond_Kurzweil\" rel=\"noreferrer noopener\" target=\"_blank\">Raymond Kurzweil<\/a>&nbsp;die erste kommerzielle Lesemaschine, die Druckschrift in gesprochene Worte \u00fcbersetzen kann, auf den Markt zu bringen: Die&nbsp;<a href=\"https:\/\/en.wikipedia.org\/wiki\/Reading_machine\" rel=\"noreferrer noopener\" target=\"_blank\">Kurzweil Reading Machine<\/a>. Ein Meilenstein in der Geschichte. Denn erstmals gab es eine kommerzielle L\u00f6sung, die es Blinden erlaubte zu lesen.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/blog.parashift.io\/hs-fs\/hubfs\/data_entry_evolution_3.png?width=400&amp;name=data_entry_evolution_3.png\" alt=\"Studentin der Perkins School for the Blind ben\u00fctzt die Kurzweil Reading Machine\"\/><figcaption class=\"wp-element-caption\">Studentin der Perkins School for the Blind ben\u00fctzt die Kurzweil Reading Machine<\/figcaption><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Unterscheidung OCR Engine und OCR Software<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Es gibt \u00fcbrigens noch eine sehr wichtige Unterscheidung, wenn wir von OCR sprechen. Denn die Technologie, die die eigentliche Identifizierung der Zeichen vornimmt und die Koordinaten der gefundenen Werte zur\u00fcckspielt, n\u00e4mlich die OCR Engine, ist nicht mit der Technologie zu verwechseln, welche die Bilder beziehungsweise Dokumente in Layouts aufteilt, die Inhalte b\u00fcndelt, diese interpretiert und in strukturierter Form zur\u00fcckgibt. Obwohl es auch einige Engines gibt, die Buchstaben, Spaces, Zahlen und Symbole zu Bl\u00f6cken formieren, ist das im Normalfall Teil der OCR Software. So auch bei Parashift. Die Engines, die wir brauchen fokussieren sich lediglich auf das Erkennen von Text. Dazu werden in der Regel als allererstes Linien eruiert, die dann in einzelne W\u00f6rter oder Zeichen runtergebrochen werden. Einige der Engines bedienen sich W\u00f6rterb\u00fccher, um die Qualit\u00e4t zu verbessern. Alles was nach dem Parsen des Textes folgt, f\u00e4llt unter den Aufgabenbereich der OCR Software. Nun aber wieder zur\u00fcck zum historischen Teil dieses Artikels&#8230;<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">OCR-Software und Machine Learning-basierte OCR<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Obwohl OCR-Ger\u00e4te bereits in den 1950er Jahren kommerziell verf\u00fcgbar wurden, waren bis 1986 weltweit nur einige tausend Systeme verkauft worden. Der Hauptgrund daf\u00fcr waren die Kosten der Ger\u00e4te. Als jedoch die Hardware billiger wurde und OCR-Systeme als Softwarepakete erh\u00e4ltlich wurden, stiegen auch die Verkaufszahlen erheblich.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Fortschritte in der Computertechnologie haben es m\u00f6glich gemacht, den Erkennungsteil der OCR in Softwarepaketen, die auf PCs funktionieren, zu integrieren. OCR-Software hatte jedoch auch Nachteile, insbesondere was die Geschwindigkeit und die Art der gelesenen Zeichens\u00e4tze betrifft. Heutzutage werden w\u00f6chentlich mehrere tausend OCR-Systeme verkauft. Zus\u00e4tzlich sind die Kosten f\u00fcr Omnifont OCR-Ger\u00e4te Jahr f\u00fcr Jahr gesunken, was dazu gef\u00fchrt hat, dass OCR-Ger\u00e4te den Weg in den Mainstream gefunden haben.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Vor wenigen Jahren kamen dann die ersten Versuche, OCR mit Machine Learning zu kombinieren. 2013 wurde die ber\u00fchmte&nbsp;<a href=\"https:\/\/en.wikipedia.org\/wiki\/MNIST_database\" rel=\"noreferrer noopener\" target=\"_blank\">MNIST Datenbank<\/a>&nbsp;(Modified National Institute of Standards and Technology database) begr\u00fcndet. Diese Datenbank besteht aus handgeschriebenen Buchstaben und Zahlen und wird f\u00fcr Trainings im Bereich Machine Learning verwendet. Damit hat die Dokumentenerfassung den Schritt in die neuste digitale Revolution gemacht und der Fokus liegt seit diesem Zeitpunkt auf der kompletten Automatisierung. Und Forschungsteams verzeichnen hier ziemlich vielversprechende Erfolge, wobei auch klar hervorgehoben werden muss, dass wir erst am Anfang stehen und es nach wie vor zahlreiche technische Herausforderungen zu meistern gilt.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Template-basierte OCR vs. Machine Learning-basierte OCR<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Die Template-basierte beziehungsweise Vorlagen-basierte OCR ist zwar schon einiges \u00e4lter als die Machine Learning-basierte OCR, doch die Ergebnisse der Template Recognition sind meist ziemlich gut und konsistent, was bedeutet, dass Grossteile der manuellen Arbeit automatisiert werden kann. Die Automatisierung bedingt aber auch extrem viel vorhergehende Konfiguration f\u00fcr jedes zu extrahierende Feld. Dazu muss vorab der genaue Ort auf dem Dokument, wo die Information zu finden ist und wie es die Information extrahieren soll, definiert werden. Im Gegensatz zur kompletten Automatisierung, die mit Machine Learning-basierten OCR m\u00f6glich ist, kann dies also einen grossen und sehr kostspieligen Nachteil darstellen.&nbsp;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ein bereits angedeuteter weiterer wesentlicher Nachteil der Template-basierten OCR ist, dass vom Template abweichende Dokumentstrukturen nicht funktionieren. Sprich, sobald sich das Dokument ver\u00e4ndert, seien es auch nur geringf\u00fcgige Layout-\u00c4nderungen, muss die Machine wieder neu konfiguriert werden, was \u00e4usserst zeitintensiv ist. Zudem ist das Setup der Templates auch nicht ganz simpel und ben\u00f6tigt meistens externe Fachleute. Deshalb kann das erfolgreiche Management von Templates sehr schnell sehr kostenintensiv und zu einer grossen Herausforderung werden.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Eine L\u00f6sung f\u00fcr diese Probleme bieten eben Machine Learning-basierte OCR-Systeme. Die Machine Learning Algorithmen werden mithilfe von Trainingssets, also Datens\u00e4tzen f\u00fcr Trainingszwecke, trainiert. Anschliessend wird ein Validierungsset verwendet, um die entstandenen Modellstrukturen zu optimieren und gegebenenfalls einige Design-Parameter anzupassen. Schlussendlich wird ein Testset verwendet, um die Performance der Algorithmen zu messen und deren Eignung zur Generalisierung zu pr\u00fcfen. Dabei werden beispielsweise Genauigkeit, Sensitivit\u00e4t oder Schnelligkeit des erzeugten Systems \u00fcberpr\u00fcft. Falls die Resultate nicht zufriedenstellend sind, m\u00fcssen die Algorithmen mit neuen Trainingssets weiter optimiert werden.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Aufgrund der Funktionsweise der Algorithmen von Machine Learning-basierten OCR-L\u00f6sungen ergeben sich wesentliche Vorz\u00fcge&nbsp;gegen\u00fcber Template-basierten OCR-L\u00f6sungen. Sie unterscheiden sich dadurch, dass sie mehr Flexibilit\u00e4t bieten und keine Templates brauchen. Dadurch fallen in Ihrer Unternehmung Aktivit\u00e4ten wie die Wartung, Beratung und Koordination in Bezug auf die Templates weg, was f\u00fcr Sie signifikant geringere Kosten bedeutet. Durch fortlaufendes Training der Algorithmen auf allen Kundendokumenten wird zudem auch die Performance kontinuierlich verbessert, was \u00fcber die Zeit wiederum zu weniger menschlichen Eingriffen und zus\u00e4tzlich tieferen Kosten f\u00fchrt. Und separate Grossprojekte zur Extraktionsverbesserungen, die mit zunehmender Extraktionsqualit\u00e4t schnell exponentiell mehr Kosten generieren, haben Sie auch nicht.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Machine Learning-basierte OCR-L\u00f6sungen bieten also zahlreiche Vorteile gegen\u00fcber Template-basierten OCR-L\u00f6sungen. Nichtsdestotrotz ist noch einmal festzuhalten, dass Templates \u00e4usserst genau sein k\u00f6nnen. Sobald aber verschiedene Layouts und Dokument\u00e4nderungen ins Spiel kommen, sind Machine Learning-basierte OCR-L\u00f6sungen die klaren Gewinner.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Jetzt testen!<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">\u00dcberzeugen Sie sich doch selbst vom Potenzial Machine Learning-getriebener OCR und laden Sie bei uns diverse Testdokumente (ACHTUNG: aktuell verarbeiten wir nur Dokumente des Einkaufs: Angebot, Bestellung, Auftragsbest\u00e4tigung, Lieferschein, Pro-Forma Rechnung, Rechnung, Quittung, Gutschrift und Mahnung) hoch.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">PS. An Werktagen validieren wir \u00fcbrigens zwischen 08:00 und 17:00 Uhr die Extraktionsergebnisse innerhalb von 3 Stunden. Mit Parashift erhalten Sie also herausragende Datenqualit\u00e4t und m\u00fcssen nicht unn\u00f6tig Ressourcen f\u00fcr Aufgaben binden, die nicht direkter Teil Ihr Kernbusiness sind.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-horizontal is-content-justification-center is-layout-flex wp-container-core-buttons-is-layout-7d812b4c wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button is-style-outline is-style-outline--1\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/parashift.ai\/sign-up\/\" target=\"_blank\" rel=\"noreferrer noopener\">Kostenlos testen<\/a><\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Unz\u00e4hlige Dokumente wie etwa Bestellungen, Lieferscheine und Rechnungen werden tagt\u00e4glich ausgestellt. Diese Dokumente m\u00fcssen anschliessend auf irgendeine Art und Weise in IT-Systemen von Unternehmen erfasst werden. Heutzutage bestehen aufgrund der technologischen Entwicklung auch effiziente Methoden, diese maschinenlesbar und in strukturierter&#8230;<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[121],"tags":[],"class_list":["post-17582","post","type-post","status-publish","format-standard","hentry","category-allgemein-2"],"_links":{"self":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/17582","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/comments?post=17582"}],"version-history":[{"count":1,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/17582\/revisions"}],"predecessor-version":[{"id":30103,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/17582\/revisions\/30103"}],"wp:attachment":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/media?parent=17582"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/categories?post=17582"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/tags?post=17582"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}