{"id":30902,"date":"2025-08-29T12:52:20","date_gmt":"2025-08-29T12:52:20","guid":{"rendered":"https:\/\/parashift.io\/?p=27915"},"modified":"2026-02-06T12:50:10","modified_gmt":"2026-02-06T12:50:10","slug":"generative-vs-diskriminierende-ki-modelle","status":"publish","type":"post","link":"https:\/\/parashift.ai\/de\/generative-vs-diskriminierende-ki-modelle\/","title":{"rendered":"Generative vs. diskriminierende KI-Modelle"},"content":{"rendered":"\n<p class=\"has-black-color has-text-color has-link-color wp-elements-667011be5da207ba226453ee41083bd5\"><em>Dieser Artikel wurde von unserem ML-Team verfasst.<\/em><\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-38855e32f8ca3d119546e0fd5dacf609\">Dies ist der Beginn einer mehrteiligen Blog-Miniserie, in der wir einen Einblick geben, wie wir bei <a href=\"https:\/\/parashift.ai\/de\/intelligente-dokumentenverarbeitung\/\" target=\"_blank\" rel=\"noreferrer noopener\">Parashift ML\/KI<\/a> einsetzen, um Probleme im Bereich der intelligenten Dokumentenverarbeitung (kurz IDP f\u00fcr Englisch intelligent document processing) zu l\u00f6sen.\u00a0<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-a59e9735899dcd2e93be926a7f8654fa\">Die ersten beiden Teile bieten eine kurze Einf\u00fchrung in allgemeine Schl\u00fcsselthemen und Konzepte der KI, ohne dass der Fokus speziell auf Parashift liegt. Wir beginnen mit der Diskussion \u00fcber den Unterschied zwischen diskriminierenden und generativen Modellen. Im dritten Teil gehen wir auf unsere aktuellen Bem\u00fchungen ein, LLM-Antworten in den Dokumenten zu verankern. Der Begriff \u201eVerankerung\u201c beschreibt hier die F\u00e4higkeit, die Antwort eines LLM mit expliziten Tokens im Dokument zu verkn\u00fcpfen. Der vierte Teil beleuchtet weitere Anwendungsbeispiele beider Methoden in unserem Produkt, und der letzte Teil gibt schlie\u00dflich einen Ausblick darauf, wohin wir uns als N\u00e4chstes entwickeln m\u00f6chten.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h4 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-9bbf227015a435f244ea0a9a9d3f1620\" id=\"h-diskriminierende-ki-modelle-vs-generative-ki\">Diskriminierende KI-Modelle vs. Generative KI<\/h4>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-0b32b18bdb48c60170d5d057967fa131\">Zun\u00e4chst betrachten wir zwei verschiedene Arten von KI-Modellen und beginnen mit einer Einf\u00fchrung, um die konzeptionellen Unterschiede hervorzuheben. Wie wir sehen werden, beeinflussen diese Unterschiede, wie und wo wir die Modelle in der Praxis einsetzen.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 36px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h5 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-df71fabbd6cd85803e55d307488a3df6\" id=\"h-diskriminierende-ki-modelle-nbsp\"><strong>Diskriminierende KI-Modelle&nbsp;<\/strong><\/h5>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-98d786ae2e6f3df35ba84abd28d8cbeb\">Diese Modelle lernen, wie man \u201eDinge\u201c unterscheidet. Stellen Sie sich diese Modelle als \u201eLabel-Maschinen\u201c vor: Sie zeigen dem Modell ein Objekt, und es weist ihm ein bestimmtes Label sowie eine Zahl zu. Das Label bestimmt, als was das Objekt klassifiziert wurde, und die Zahl reflektiert das Vertrauen in diese Klassifizierung. Ein g\u00e4ngiges Beispiel ist ein Bildklassifizierer, der Tiere identifiziert. Wenn dieses Modell zum Beispiel auf 100 verschiedenen Tierarten trainiert wurde, kann es am Ende nichts weiter, als Bilder betrachten und das bestpassende Label zuweisen. Es kann keine neuen Labels erzeugen, sondern ist auf die Labels beschr\u00e4nkt (und dadurch beeinflusst), die es w\u00e4hrend des Trainings gesehen hat.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-71466a026035a4af281160a9ba025998\">Viele IDP-Aufgaben lassen sich so formulieren, dass ein diskriminierendes Modell trainiert werden kann, um sie zu l\u00f6sen. Der Ansatz l\u00e4uft dann immer darauf hinaus, einem Objekt ein Label zuzuweisen. Die Anwendungsf\u00e4lle unterscheiden sich darin, welche Labels vergeben werden und auf welche \u201eDinge\u201c sie angewendet werden. In den folgenden Beispielen erh\u00f6hen wir schrittweise die Granularit\u00e4t dieser Label-Zuweisungen und zeigen, wie unterschiedliche Aufgaben damit gel\u00f6st werden k\u00f6nnen.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 29px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h6 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-dc47aebaed2bfdea62ac90af1ad651d2\" id=\"h-dokumentenklassifizierung-ein-label-pro-dokument-nbsp\"><strong>Dokumentenklassifizierung (ein Label pro Dokument)&nbsp;<\/strong><\/h6>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-47ca793280bc04d543fac589c942d0d1\">Der einfachste Anwendungsfall: W\u00e4hrend des Trainings werden dem Modell Dokumente (und ihre Labels) verschiedener Dokumententypen gezeigt, damit es lernt, diese zu unterscheiden. Die Labels entsprechen allen Dokumenttypen, die wir unterscheiden m\u00fcssen (z.\u202fB. \u201eRechnung\u201c, \u201eReisepass\u201c, \u201eFitnessstudio-Mitgliedskarte\u201c usw.). Obwohl die Aufgabe klar definiert ist, gibt es viel kreativen Spielraum, wie das Modell trainiert wird \u2013 z.\u202fB. anhand visueller Merkmale, textlicher Merkmale oder einer Kombination von beiden.&nbsp;<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/pdc-classification-1024x580.png\" alt=\"Dokumentenklassifizierung in der Parashift-Plattform\" class=\"wp-image-27878\"\/><\/figure>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h6 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-a7dfc14aa01f3153e1fd42b911749759\" id=\"h-trennung-von-seitensstapeln-ein-label-pro-seite-nbsp\"><strong>Trennung von Seitensstapeln (ein Label pro Seite)&nbsp;<\/strong><\/h6>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-986c7a75faf90732c0a0b6cd0e82e716\">Nun starten wir mit einer geordneten Seitensstapel, die Aufgabe es ist zu erkennen, welche Seiten zusammengeh\u00f6ren, um ein eigenst\u00e4ndiges Dokument zu bilden. Dies ist besonders n\u00fctzlich, wenn physische Post eingescannt wird, und als ein einziges gro\u00dfes PDF, das alle Dokumente umfasst erstellt wird.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-d0c7e01063704eb61cd321fa059fb2a5\">Wir entschieden uns f\u00fcr einen Ansatz, bei dem das Modell zwei Labels vorhersagt: \u201eerste Seite\u201c oder \u201eletzte Seite\u201c. Auf Grundlage dieser Vorhersagen l\u00e4sst sich ableiten, wo der Seitensstapel in einzelne Dokumente aufgeteilt werden soll. Unten sehen Sie ein schematisches Beispiel eines Seitenstapels mit 6 Seiten, die zu 3 Dokumenten f\u00fchrt.&nbsp;<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/Parashift_Page-Separation-1024x406.png\" alt=\"Seitentrennung in der Parashift-Plattform\" class=\"wp-image-27880\"\/><\/figure>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h6 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-49640c76587fd4f4d64ef51e6d7beeda\" id=\"h-informationsextraktion-ein-label-pro-token-nbsp\"><strong>Informationsextraktion (ein Label pro Token)&nbsp;<\/strong><\/h6>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-2abed3fc0a6d5d8b938dadd4aafd94a4\">Betrachten wir nun, wie diskriminierende Modelle zur Extraktion von Informationen wie Absender-Adressen, Zahlbetr\u00e4gen oder Lieferterminen eingesetzt werden k\u00f6nnen. Aus der Perspektive eines Klassifikationsmodells m\u00fcssen wir ein System aufbauen, das nur bestimmten Teilen des Dokuments Labels zuweist.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-d0151d5bd1bb7be01e5a15f2035242b3\">Beispiel: Das Modell kann dem Text \u201eParashift AG\u201c das Label \u201eFirmenname\u201c zuordnen. Ein weiterer Schritt ist das Training eines Modells zur Vorhersage, welche Tokens zusammengeh\u00f6ren (sogenannte Link-Prediction). Das Modell entscheidet also, ob \u201eParashift AG\u201c eine Einheit ist oder zwei separate, wie \u201eParashift\u201c und \u201eAG\u201c ist.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h6 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-bf8f5402d8b3beb7ae53368ae242c6d1\" id=\"h-embeddings-und-tokenisierung-nbsp\"><strong>Embeddings und Tokenisierung&nbsp;<\/strong><\/h6>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-d6f3448fe714a5c3a4afa8e082094d11\">Wir wissen nun, wie sich IDP-Aufgaben f\u00fcr diskriminierende Modelle konzeptionell formulieren lassen. Zwei weitere Konzepte sind f\u00fcr ein besseres Verst\u00e4ndnis grundlegend:\u202f<strong>Embeddings<\/strong>\u202fund\u202f<strong>Tokenisierung<\/strong>.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-7c4eb4a425dbc599eec1c3adbb7ce1fb\">Da die Aufgabe darin besteht, \u201eDingen Labels zuzuweisen\u201c, ben\u00f6tigen wir eine M\u00f6glichkeit, die \u201eDinge\u201c sinnvoll darzustellen \u2013 sei es ein Dokument, eine Seite oder einzelne Tokens innerhalb eines Dokuments. Hier kommen nun Embeddings ins Spiel.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-9320a3d265e786b132b67a71cb06fb9a\">&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 31px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-fc95b985b92e9a526ac0a0f3f581f64b\"><strong>Embeddings<\/strong><\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-be61ed799ff245f9f0d96e1a0ada6880\">KI-Modelle arbeiten nicht direkt mit Bildern, Audio, Dokumenten, Text oder Tokens, wie wir Menschen sie verstehen. Sie verarbeiten ausschlie\u00dflich Zahlen. Die Umwandlung realer Objekte in eine \u201eListe von Zahlen\u201c nennt man\u202f<strong>Embedding <\/strong>oder\u202f<strong>Vektorisierung<\/strong>. Wichtig ist, dass diese Zahlen eine sinnvolle Repr\u00e4sentation f\u00fcr das zu l\u00f6sende Problem liefern.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 31px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-e62fcb4bb51b9d906ba58bd9b832ec46\"><strong>RGB als Beispiel<\/strong><\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-56d744339ea33b0d09d602a5fad06f11\">Dieser Abschnitt ist nicht auf IDP bezogen, sondern veranschaulicht allgemein, wie Informationen in Zahlen \u00fcbersetzt werden k\u00f6nnen. Ein Pixel auf Ihrem Bildschirm l\u00e4sst sich durch drei RGB-Werte darstellen (R = Rot, G = Gr\u00fcn, B = Blau). Dies kann als eine Art Embedding betrachtet werden: [R, G, B]. F\u00fcr unser Beispiel normalisieren wir die Werte auf den Wertebereich 0\u20131.&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Rot \u2192 [1, 0, 0]&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Gr\u00fcn \u2192 [0, 1, 0]&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Blau \u2192 [0, 0, 1]&nbsp;<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 24px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-2998e37ad999c7ccdb332f736b81c967\">Beliebige Farben lassen sich nun als Kombination dieser drei Zahlen darstellen, z.\u202fB. Gelb = Rot + Gr\u00fcn \u2192 [1, 1, 0]. Moderne LLMs wie ChatGPT, Claude oder LLaMA verwenden deutlich gr\u00f6\u00dfere Embeddings, oft mehrere tausend Zahlen pro Token und nicht nur 3 wie in unserem Beispiel.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\" style=\"flex-basis: 25%;\">\u00a0<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\" style=\"flex-basis:50%\">\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/RGB_no-bg-1024x1024.png\" alt=\"\" class=\"wp-image-27911\"\/><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\" style=\"flex-basis: 25%;\">\u00a0<\/div>\n<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-15561f68bab5fe6b301aebd205b38bea\">Nehmen wir an, wir h\u00e4tten&nbsp;ein Token-Embedding-Modell, das f\u00fcr jedes Token nur drei Zahlen zur Darstellung der Bedeutung verwenden darf \u2013 dies aus dem Grund, dass wir wie gesehen 3 Zahlen einfach als Farben visualisieren k\u00f6nnen. Im fiktiven Beispiel unten sehen wir, dass Adressen einen r\u00f6tlichen Ton haben, Zahlen gr\u00fcn erscheinen und Datumsangaben blau gef\u00e4rbt sind.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-020f6185afbe89dd61603227886baaf1\">Bei genauerer Betrachtung gibt es aber auch Ausnahmen: Hausnummern und Postleitzahlen erscheinen n\u00e4mlich orange. Das heisst, dass das Modell\u202f<strong>dynamische Embeddings <\/strong>generiert, die sich je nach Kontext \u00e4ndern. Als Kontext gelten in diesem Fall die benachbarten Tokens. Im Gegensatz dazu sind\u202f<strong>statische Embeddings <\/strong>feste Lookups: Zum Beispiel das Token \u201e9155\u201c h\u00e4tte immer dieselbe Repr\u00e4sentation, unabh\u00e4ngig vom Kontext.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-435fdb8a7de33d33b51e724fcc40742b\">Bei Parashift kombinieren wir dynamische und statische Embeddings, um LLM-Antworten in Dokumenten zu verankern.\u202f<em>Verankerung <\/em>bedeutet hier: Wir identifizieren die genauen Tokens, die eine Antwort bilden \u2013 mit einer Aufl\u00f6sung bis auf Token-Ebene, nicht nur auf Absatz- oder Zeilen-Ebene. Statische Embeddings sto\u00dfen an ihre Grenzen, wenn sie Homonyme unterscheiden sollen wie z.\u202fB. das Wort \u201eBank\u201c in unterschiedlichen Kontexten.&nbsp;<\/p>\n\n\n\n<p>Ich setze mich auf die Bank.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-401b039a9eb0ea3bc014403d225dea7d\">Ich gehe in die Bank.&nbsp;<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/invoices-1024x695.png\" alt=\"KI-Extraktion auf der Parashift-Plattform\" class=\"wp-image-27884\"\/><\/figure>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p><strong>Tokenisierung<\/strong><\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-b5f311aa9ec39ea8b83b6fbf19c4a88a\">Ein weiterer entscheidender Schritt ist die Aufteilung eines Dokuments in kleinere Einheiten: Abs\u00e4tze, Zeilen, W\u00f6rter oder Tokens. Diese Einheiten k\u00f6nnen dann mit Labels versehen werden.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-e945094d6c95865fef88bb85dd537413\">Ein Token ist meist ein kurzes Wort oder ein Teilwort. Die optimale Methode zur Tokenisierung gibt es in diesem Sinne nicht. Am untenstehenden <a href=\"https:\/\/huggingface.co\/spaces\/Xenova\/the-tokenizer-playground\" target=\"_blank\" rel=\"noopener\">Beispiel<\/a> sehen wir, wie der GPT4 Tokenizer einen Satz in Tokens zerst\u00fcckelt, diese sind als farbige Rechtecke dargestellt. Nach der Tokenisierung k\u00f6nnen wir jedem Token Labels zuweisen, z.\u202fB. Absendername, Absenderstra\u00dfe, Absenderhausnummer \u2013 dies bildet die Grundlage f\u00fcr die Informationsextraktion.&nbsp;<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/giraffe-tokens.png\" alt=\"\" class=\"wp-image-27887\"\/><\/figure>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-749c3460040b03b3903011526b476b53\">Zum Schluss k\u00f6nnen ein weiteres Modell trainieren, das diese Embeddings nutzt, um Tokens Labels zuzuweisen. F\u00fcr \u201eAdressen\u201c oder \u201eDaten\u201c funktioniert das in unserem Beispiel sehr gut. Andere Informationen werden schwieriger, wenn die Embeddings die Tokens nicht ausreichend differenzieren kann (viele Tokens sind einfach grau).&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-7ad13f2ff9f6d16be1f8f52e9bdbd230\">Dies verdeutlicht die\u202f<strong>Notwendigkeit generischer Einbettungen<\/strong>, die eine Vielzahl m\u00f6glicher nachgelagerter Aufgaben abdecken k\u00f6nnen, und gleichzeitig gen\u00fcgend Informationen liefern, um die nachfolgenden Klassifikationsmodelle zu unterst\u00fctzen.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h4 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-bd4e1a5e8a6a4dd6272bb6dbcd856b90\" id=\"h-zusammenfassung-diskriminierender-modelle-nbsp\">Zusammenfassung diskriminierender Modelle&nbsp;<\/h4>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-57648e360abad960f67405c30b673eff\"><strong>Vorteile:<\/strong>&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-63e552d814a39c3690ede92d1387c312\">Vorhersagen f\u00fcr jedes Token erm\u00f6glichen eine exakte Identifikation der entsprechenden Inhalte direkt im Dokument.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-3101893fa04a0214157a459098e022cd\">Jede Vorhersage kommt mit einem Konfidenzwert, der die Zuverl\u00e4ssigkeit der Klassifizierung angibt.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-1c887003a237b2ef16fb2f23ba042c19\">Modelle sind vergleichsweise klein (einige Millionen bis wenige hundert Millionen Parameter) und k\u00f6nnen auf einer einzigen GPU in Minuten bis Stunden trainiert werden.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-4a61ed0f2fa4d2191e8026f800470407\">Kleine Modelle sind schnell: Dokumente mit wenigen Seiten werden in Millisekunden verarbeitet.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-879e7d1e5f544c505a6e728917b70965\">Datenschutz: Die Modelle geben keine sensiblen Trainingsdaten preis. Sie f\u00fcgen lediglich Labels hinzu.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-56effd292213744b96d4d0c192043924\">Embedding-Modelle erledigen den Gro\u00dfteil der \u201eschweren Arbeit\u201c, und die Embeddings k\u00f6nnen dann f\u00fcr mehrere verschiedene Aufgaben wiederverwendet werden.&nbsp;<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 36px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-d41a4ff85f3c6c88cf643aeb41352d6c\"><strong>Nachteile:<\/strong>&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-88c86c302dfebd189bdcee5a73ff285e\">Sie k\u00f6nnen ihre Antworten nicht auf neue, ungesehene Aufgaben verallgemeinern. Neue Aufgaben erfordern erweitertes Training oder ein neues Modell. (In folgenden Teilen der Serie werden wir aber Anstrengungen dazu anschauen wie eine gewisse Generalisierung trotzdem zu bewerkstelligen sein k\u00f6nnte)&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-c4906454acae5f720dfe0f4705d3f461\">Labelbasierte Klassifikation ist weniger flexibel als generative Ans\u00e4tze. Viele Aufgaben lassen sich nicht rein diskriminierend l\u00f6sen. Zum beispiel das Verfassen von Zusammenfngen etc.&nbsp;<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 36px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p><\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 36px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-e1f2de4758fef153b7db69d37aea7b11\">Dies ist erst der Beginn eines Austauschs. Wenn Sie erfahren m\u00f6chten, wie Parashift Sie auf Ihrem Weg zur Automatisierung unterst\u00fctzen kann, z\u00f6gern Sie nicht<em>,<\/em> <strong><a href=\"https:\/\/parashift.ai\/de\/kontakt\/\"><em>uns zu kontaktieren<\/em><\/a><\/strong>.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-content-justification-center is-layout-flex wp-container-core-buttons-is-layout-16018d1d wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button is-style-outline is-style-outline--1\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/parashift.ai\/de\/demo-buchen\/\">Parashift kostenlos testen<\/a><\/div>\n<\/div>\n\n\n\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>KI ist nicht gleich KI. Die Modelle im Hintergrund entscheiden, ob Ihre Dokumentenautomatisierung Zeit spart \u2013 oder neue Kopfschmerzen bereitet. Unser ML-Team hat dazu einen Artikel verfasst, der genau das erkl\u00e4rt.<\/p>\n","protected":false},"author":5,"featured_media":27885,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[128],"tags":[],"class_list":["post-30902","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-parashift-platform-2"],"_links":{"self":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/30902","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/comments?post=30902"}],"version-history":[{"count":2,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/30902\/revisions"}],"predecessor-version":[{"id":34666,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/30902\/revisions\/34666"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/"}],"wp:attachment":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/media?parent=30902"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/categories?post=30902"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/tags?post=30902"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}