{"id":17580,"date":"2020-03-12T10:35:47","date_gmt":"2020-03-12T10:35:47","guid":{"rendered":"http:\/\/parashift.io\/?p=3644"},"modified":"2025-11-30T22:39:53","modified_gmt":"2025-11-30T22:39:53","slug":"standard-dokumenttypen-und-das-parashift-learning-network","status":"publish","type":"post","link":"https:\/\/parashift.ai\/de\/standard-dokumenttypen-und-das-parashift-learning-network\/","title":{"rendered":"Standard Dokumenttypen und das Parashift Learning Network"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Der Einsatz von Technologie f\u00fcr die Extraktion wichtiger Daten aus Dokumenten ist nichts Neues. Im Gegenteil. Bereits seit mehreren Jahrzehnten werden verschiedene Technologieans\u00e4tze zu genau diesem Zweck eingesetzt. Was aber bis vor relativ kurzer Zeit alle diese verschiedenen Ans\u00e4tze gemeinsam hatten, war, dass diese Systeme lokal beim Kunden aufgesetzt, konfiguriert, trainiert und dann auch betrieben wurden. Das hat diverse offensichtliche Nachteile. Denn schon allein das Aufsetzen solcher lokal betriebenen Systemen kostet viel Zeit und Geld. Und noch wichtiger&#8230; Jegliche Qualit\u00e4tsverbesserungen oder Erweiterungen abseits des &#8222;Standards&#8220; oder der initialen Konfiguration der Dokumentarten m\u00fcssen zus\u00e4tzlich und spezifisch in Projekten erarbeitet werden. Das heisst, je leistungsst\u00e4rker Ihr System sein soll, desto mehr Ressourcen sind dazu notwendig.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/blog.parashift.io\/hs-fs\/hubfs\/image-20200224-134331.png?width=600&amp;name=image-20200224-134331.png\" alt=\"image-20200224-134331\"\/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Globales Learning Network<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Was wir uns nun bei Parashift vorgenommen haben, ist eben genau an dieser stark limitierenden Infrastruktur anzusetzen und an Stelle davon eine offene einfach weiterentwickelbare Architektur aufzubauen. Diese wird es uns erlauben, die Problematik der Dokumentenverarbeitung, insbesondere der Extraktion, mit Hilfe eines global ausgelegten Learning Networks anzugehen. Die Basis dazu schaffen wir durch eine streng gesch\u00fctzte, hoch verf\u00fcgbare und beliebig skalierbare Cloud-Plattform. Durch das Cloud-Setup bieten wir Ihnen eine universell verf\u00fcgbare Plattform, die einfach in Ihre bestehende Softwarelandschaften und Workflows integriert werden kann und von Beginn weg mit allen vorhandenen Funktionalit\u00e4ten ausgestattet ist, aber gleichzeitig auch kontinuierlich mit verbesserten sowie neuen Funktionalit\u00e4ten aufgewertet wird. Und das alles auch ohne Ihr aktives Zutun und nat\u00fcrlich ohne Ihren produktiven Betrieb dabei zu unterbrechen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Durch diesen Ansatz k\u00f6nnen wir also nicht nur etwa die Ramp-up-Phase bis zum Normalbetrieb signifikant verk\u00fcrzen, sondern wir erh\u00f6hen auch die Variation der verarbeiteten Dokumenten mit jedem neuen Kunden. Dies ist daher so wichtig, da unsere Extraktionsplattform neben klassischen OCR Technologien haupts\u00e4chlich von diversen Machine Learning Technologien Gebrauch macht (<a href=\"https:\/\/parashift.ai\/de\/template-basierte-ocr-versus-machine-learning-basierte-ocr\/\" target=\"_blank\" rel=\"noreferrer noopener\">mehr zum Unterschied zwischen traditionellen OCR Software und Machine Learning-basierter OCR<\/a>). Der Grund f\u00fcr den Einsatz dieser Art von Technologien ist simpel: Durch das Swarm Learning auf allen Dokumenten im Netzwerk helfen sie uns, Korrelationen in grossen Mengen von Datenpunkten zu eruieren und diese Learnings dann mit allen Kunden zu teilen, wobei die eigentlichen Daten, sprich, die sensiblen Dokumentdaten, strengstens gesch\u00fctzt und nicht geteilt werden.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Damit die Machine Learning Cluster \u00fcberhaupt trainiert werden und die daraus gezogenen Learnings die Maschine tats\u00e4chlich nachhaltig verbessern, haben wir spezifisch ausgebildete Teams zur Annotation beziehungsweise Validierung aufgebaut. Diese f\u00fchren effizient gestaltete Nachbearbeitungsprozesse der Klassifikations- und Extraktionsergebnissen durch, sodass einerseits Sie als Kunde viable Extraktionsergebnisse zu attraktiven Preisen beziehen k\u00f6nnen und anderseits eben die Performance der Maschine verbessert werden kann. Dies damit sukzessive weniger menschliche Interaktion ben\u00f6tigt wird und die L\u00f6sung somit noch kosteng\u00fcnstiger angeboten werden kann.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Konkret bedeutet&nbsp;das, die Machine Learning Technologien aggregieren in diesen Nachbearbeitungsprozessen mit menschlicher Unterst\u00fctzung kontextbasierte Zusammenh\u00e4nge, die bei der Klassifikation des Inputs, in diesem Fall der Dokumentart, und der darauffolgenden Extraktion der bei diesem Dokumenttypen relevanten Daten helfen. Gewisse dieser Zusammenh\u00e4nge sind offensichtlich und f\u00fcr uns Menschen total logisch und nachvollziehbar. Andere wiederum sind dies nicht. Und je mehr Variation die Maschine von einer bestimmten Dokumentart verarbeitet hat beziehungsweise je mehr dieser Dokumente jeweils durch qualifizierte menschliche Nachbearbeitung validiert wurden, desto h\u00f6her ist die Wahrscheinlichkeit, dass komplett neue, in dieser Art noch nie gesehenen Layouts und Formate vor selben Art, doch als solche erkannt werden und dann die Maschine auch weiss, von wo welche Daten zu extrahieren sind.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Standard Dokumenttypen<\/h4>\n\n\n\n<p class=\"wp-block-paragraph\">Ziel von uns ist es demnach, in Zusammenarbeit mit unseren Kunden schrittweise einzelne Dokumentarten zu konfigurieren, die wir als sogenannte Standard Dokumenttypen \u00fcber unsere Plattform an alle Kunden zur Verwendung ausspielen k\u00f6nnen. Verarbeiten diese dann Ihre Dokumente des jeweiligen Typs mit uns, bauen wir die Dokumentenvariation in unserem Learning Network aus und k\u00f6nnen die Flexibilit\u00e4t und Robustheit unserer Plattform steigern. Wichtig in dieser initialen Phase eines jeden neuen Standard Dokumenttyps ist jedoch jeweils, dass wir mit Kunden m\u00f6glichst viel \u00fcber unsere Full-Extraction prozessieren, damit die Maschine schnell und in breiter Masse von unseren Validierungs-Teams trainiert werden kann. Somit k\u00f6nnen die notwendigen menschlichen Nachkontrollen schneller reduziert und die rein maschinenbasierte Extraktionsperformance gesteigert werden.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Die Idee dahinter ist, dass wir dadurch&nbsp;langfristig derart leistungsstarke Technologien entwickeln k\u00f6nnen, die nicht nur funktional unschlagbar, sondern auch wirtschaftlich gesehen ein totaler No Brainer sind. Spannend&nbsp;ist dabei, dass mit zunehmender validierten Dokumentenvariet\u00e4t eine weitere Verfielfachung stimuliert wird, da die Qualit\u00e4t und Verl\u00e4sslichkeit der Extraktion immer besser wird und aufgrund dessen mehr Kunden ihre Dokumente \u00fcber Parashift verarbeiten wollen. Diese Monopol bildende Dynamik versuchen wir zu unseren beziehungsweise den Gunsten unserer Kunden zu nutzen und so die eine globale Plattform zur Dokumentenextraktion zu bauen, die irgendwann tats\u00e4chlich im Stande sein wird, ein beliebiges Dokument, das hochgeladen wird, innert wenigen Sekunden und fast kostenlos autonom zu verarbeiten.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/blog.parashift.io\/hs-fs\/hubfs\/100docs_socialsDE.png?width=800&amp;name=100docs_socialsDE.png\" alt=\"100docs_socialsDE\"\/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Roadmap f\u00fcr Standard Dokumententypen<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Bei der Definition und der Planung neuer Standard Dokumenttypen&nbsp;richten wir uns voll und ganz nach unseren Kunden und Interessenten. Je h\u00f6her die gesamte Nachfrage&nbsp;f\u00fcr eine bestimmte Dokumentenart, desto h\u00f6her stufen wir die Relevanz f\u00fcr deren Umsetzung ein. Aus den bisherigen Gespr\u00e4chen mit Kunden und Interessenten hat sich daher die oben illustrierte Ansammlung von Dokumenten aus diversen Branchen und Bereichen ergeben, die wir durchs Jahr 2020 und dar\u00fcber hinaus live schalten wollen. Sollten sich aufgrund neuer Kundenbeziehungen und Requirements weitere interessante Opportunit\u00e4ten anbieten, wird die Roadmap fortlaufend entsprechend&nbsp;erg\u00e4nzt.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Aktuelle Standard Dokumententypen<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Aufgrund der vermehrten Bed\u00fcrfnisse unserer Kunden haben wir in einem ersten Schritt eine Purchase to Pay&nbsp;Suite entwickelt, welche ab anfangs April mit allen g\u00e4ngigen Dokumentarten (d.h. Angebot, Bestellung, Auftragsbest\u00e4tigung, Lieferschein, Pro-Forma Rechnung, Rechnung\/Quittung, Gutschrift und Mahnung) vorkonfiguriert und vortrainiert kommt. Nach der einfachen Integration der via REST API k\u00f6nnen Sie daher direkt mit der Verarbeitung loslegen und erhalten erfrischend schnell und super g\u00fcnstig voll validierte Extraktionsergebnisse in Ihre jeweiligen IT Systeme.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Damit ergeben sich exemplarisch die folgenden Use Cases:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Automatische Erfassung der oben aufgez\u00e4hlten Dokumentarten<\/li>\n\n\n\n<li>Automatischer Rechnungsabgleich gegen Bestelldaten oder Vertr\u00e4ge entweder auf Gesamtbetrag oder auch detailliert auf die Einzelpositionen<\/li>\n\n\n\n<li>Dunkelverbuchung von Rechnungen dank Bestellabgleich und allen Daten f\u00fcr vollumfassende Buchungsdaten beziehungsweise Vorschl\u00e4ge<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Wenn Sie mehr dar\u00fcber erfahren wollen oder Sie direkt Ihren Use Case mit uns besprechen wollen, lassen Sie uns doch in den kommenden Tagen einmal sprechen. Thilo Rossa, Head Business Development, hilft Ihnen gerne bei der Entwicklung einer passenden L\u00f6sung.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-content-justification-center is-layout-flex wp-container-core-buttons-is-layout-fe48e5de wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button is-style-outline is-style-outline--1\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/parashift.ai\/sign-up\/\" target=\"_blank\" rel=\"noreferrer noopener\">Kostenlos testen<\/a><\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Der Einsatz von Technologie f\u00fcr die Extraktion wichtiger Daten aus Dokumenten ist nichts Neues. Im Gegenteil. Bereits seit mehreren Jahrzehnten werden verschiedene Technologieans\u00e4tze zu genau diesem Zweck eingesetzt. Was aber bis vor relativ kurzer Zeit alle diese verschiedenen Ans\u00e4tze gemeinsam&#8230;<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[33],"tags":[],"class_list":["post-17580","post","type-post","status-publish","format-standard","hentry","category-unternehmen-2"],"_links":{"self":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/17580","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/comments?post=17580"}],"version-history":[{"count":2,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/17580\/revisions"}],"predecessor-version":[{"id":30927,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/17580\/revisions\/30927"}],"wp:attachment":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/media?parent=17580"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/categories?post=17580"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/tags?post=17580"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}