{"id":30902,"date":"2025-08-29T12:52:20","date_gmt":"2025-08-29T12:52:20","guid":{"rendered":"https:\/\/parashift.io\/?p=27915"},"modified":"2026-02-06T12:50:10","modified_gmt":"2026-02-06T12:50:10","slug":"generative-vs-diskriminierende-ki-modelle","status":"publish","type":"post","link":"https:\/\/parashift.ai\/de\/generative-vs-diskriminierende-ki-modelle\/","title":{"rendered":"Generative vs. diskriminierende KI-Modelle"},"content":{"rendered":"\n<p class=\"has-black-color has-text-color has-link-color wp-elements-667011be5da207ba226453ee41083bd5 wp-block-paragraph\"><em>Dieser Artikel wurde von unserem ML-Team verfasst.<\/em><\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-38855e32f8ca3d119546e0fd5dacf609 wp-block-paragraph\">Dies ist der Beginn einer mehrteiligen Blog-Miniserie, in der wir einen Einblick geben, wie wir bei <a href=\"https:\/\/parashift.ai\/de\/intelligente-dokumentenverarbeitung\/\" target=\"_blank\" rel=\"noreferrer noopener\">Parashift ML\/KI<\/a> einsetzen, um Probleme im Bereich der intelligenten Dokumentenverarbeitung (kurz IDP f\u00fcr Englisch intelligent document processing) zu l\u00f6sen.\u00a0<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-a59e9735899dcd2e93be926a7f8654fa wp-block-paragraph\">Die ersten beiden Teile bieten eine kurze Einf\u00fchrung in allgemeine Schl\u00fcsselthemen und Konzepte der KI, ohne dass der Fokus speziell auf Parashift liegt. Wir beginnen mit der Diskussion \u00fcber den Unterschied zwischen diskriminierenden und generativen Modellen. Im dritten Teil gehen wir auf unsere aktuellen Bem\u00fchungen ein, LLM-Antworten in den Dokumenten zu verankern. Der Begriff \u201eVerankerung\u201c beschreibt hier die F\u00e4higkeit, die Antwort eines LLM mit expliziten Tokens im Dokument zu verkn\u00fcpfen. Der vierte Teil beleuchtet weitere Anwendungsbeispiele beider Methoden in unserem Produkt, und der letzte Teil gibt schlie\u00dflich einen Ausblick darauf, wohin wir uns als N\u00e4chstes entwickeln m\u00f6chten.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h4 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-9bbf227015a435f244ea0a9a9d3f1620\" id=\"h-diskriminierende-ki-modelle-vs-generative-ki\">Diskriminierende KI-Modelle vs. Generative KI<\/h4>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-0b32b18bdb48c60170d5d057967fa131 wp-block-paragraph\">Zun\u00e4chst betrachten wir zwei verschiedene Arten von KI-Modellen und beginnen mit einer Einf\u00fchrung, um die konzeptionellen Unterschiede hervorzuheben. Wie wir sehen werden, beeinflussen diese Unterschiede, wie und wo wir die Modelle in der Praxis einsetzen.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 36px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h5 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-df71fabbd6cd85803e55d307488a3df6\" id=\"h-diskriminierende-ki-modelle-nbsp\"><strong>Diskriminierende KI-Modelle&nbsp;<\/strong><\/h5>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-98d786ae2e6f3df35ba84abd28d8cbeb wp-block-paragraph\">Diese Modelle lernen, wie man \u201eDinge\u201c unterscheidet. Stellen Sie sich diese Modelle als \u201eLabel-Maschinen\u201c vor: Sie zeigen dem Modell ein Objekt, und es weist ihm ein bestimmtes Label sowie eine Zahl zu. Das Label bestimmt, als was das Objekt klassifiziert wurde, und die Zahl reflektiert das Vertrauen in diese Klassifizierung. Ein g\u00e4ngiges Beispiel ist ein Bildklassifizierer, der Tiere identifiziert. Wenn dieses Modell zum Beispiel auf 100 verschiedenen Tierarten trainiert wurde, kann es am Ende nichts weiter, als Bilder betrachten und das bestpassende Label zuweisen. Es kann keine neuen Labels erzeugen, sondern ist auf die Labels beschr\u00e4nkt (und dadurch beeinflusst), die es w\u00e4hrend des Trainings gesehen hat.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-71466a026035a4af281160a9ba025998 wp-block-paragraph\">Viele IDP-Aufgaben lassen sich so formulieren, dass ein diskriminierendes Modell trainiert werden kann, um sie zu l\u00f6sen. Der Ansatz l\u00e4uft dann immer darauf hinaus, einem Objekt ein Label zuzuweisen. Die Anwendungsf\u00e4lle unterscheiden sich darin, welche Labels vergeben werden und auf welche \u201eDinge\u201c sie angewendet werden. In den folgenden Beispielen erh\u00f6hen wir schrittweise die Granularit\u00e4t dieser Label-Zuweisungen und zeigen, wie unterschiedliche Aufgaben damit gel\u00f6st werden k\u00f6nnen.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 29px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h6 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-dc47aebaed2bfdea62ac90af1ad651d2\" id=\"h-dokumentenklassifizierung-ein-label-pro-dokument-nbsp\"><strong>Dokumentenklassifizierung (ein Label pro Dokument)&nbsp;<\/strong><\/h6>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-47ca793280bc04d543fac589c942d0d1 wp-block-paragraph\">Der einfachste Anwendungsfall: W\u00e4hrend des Trainings werden dem Modell Dokumente (und ihre Labels) verschiedener Dokumententypen gezeigt, damit es lernt, diese zu unterscheiden. Die Labels entsprechen allen Dokumenttypen, die wir unterscheiden m\u00fcssen (z.\u202fB. \u201eRechnung\u201c, \u201eReisepass\u201c, \u201eFitnessstudio-Mitgliedskarte\u201c usw.). Obwohl die Aufgabe klar definiert ist, gibt es viel kreativen Spielraum, wie das Modell trainiert wird \u2013 z.\u202fB. anhand visueller Merkmale, textlicher Merkmale oder einer Kombination von beiden.&nbsp;<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/pdc-classification-1024x580.png\" alt=\"Dokumentenklassifizierung in der Parashift-Plattform\" class=\"wp-image-27878\"\/><\/figure>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h6 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-a7dfc14aa01f3153e1fd42b911749759\" id=\"h-trennung-von-seitensstapeln-ein-label-pro-seite-nbsp\"><strong>Trennung von Seitensstapeln (ein Label pro Seite)&nbsp;<\/strong><\/h6>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-986c7a75faf90732c0a0b6cd0e82e716 wp-block-paragraph\">Nun starten wir mit einer geordneten Seitensstapel, die Aufgabe es ist zu erkennen, welche Seiten zusammengeh\u00f6ren, um ein eigenst\u00e4ndiges Dokument zu bilden. Dies ist besonders n\u00fctzlich, wenn physische Post eingescannt wird, und als ein einziges gro\u00dfes PDF, das alle Dokumente umfasst erstellt wird.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-d0c7e01063704eb61cd321fa059fb2a5 wp-block-paragraph\">Wir entschieden uns f\u00fcr einen Ansatz, bei dem das Modell zwei Labels vorhersagt: \u201eerste Seite\u201c oder \u201eletzte Seite\u201c. Auf Grundlage dieser Vorhersagen l\u00e4sst sich ableiten, wo der Seitensstapel in einzelne Dokumente aufgeteilt werden soll. Unten sehen Sie ein schematisches Beispiel eines Seitenstapels mit 6 Seiten, die zu 3 Dokumenten f\u00fchrt.&nbsp;<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/Parashift_Page-Separation-1024x406.png\" alt=\"Seitentrennung in der Parashift-Plattform\" class=\"wp-image-27880\"\/><\/figure>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h6 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-49640c76587fd4f4d64ef51e6d7beeda\" id=\"h-informationsextraktion-ein-label-pro-token-nbsp\"><strong>Informationsextraktion (ein Label pro Token)&nbsp;<\/strong><\/h6>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-2abed3fc0a6d5d8b938dadd4aafd94a4 wp-block-paragraph\">Betrachten wir nun, wie diskriminierende Modelle zur Extraktion von Informationen wie Absender-Adressen, Zahlbetr\u00e4gen oder Lieferterminen eingesetzt werden k\u00f6nnen. Aus der Perspektive eines Klassifikationsmodells m\u00fcssen wir ein System aufbauen, das nur bestimmten Teilen des Dokuments Labels zuweist.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-d0151d5bd1bb7be01e5a15f2035242b3 wp-block-paragraph\">Beispiel: Das Modell kann dem Text \u201eParashift AG\u201c das Label \u201eFirmenname\u201c zuordnen. Ein weiterer Schritt ist das Training eines Modells zur Vorhersage, welche Tokens zusammengeh\u00f6ren (sogenannte Link-Prediction). Das Modell entscheidet also, ob \u201eParashift AG\u201c eine Einheit ist oder zwei separate, wie \u201eParashift\u201c und \u201eAG\u201c ist.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h6 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-bf8f5402d8b3beb7ae53368ae242c6d1\" id=\"h-embeddings-und-tokenisierung-nbsp\"><strong>Embeddings und Tokenisierung&nbsp;<\/strong><\/h6>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-d6f3448fe714a5c3a4afa8e082094d11 wp-block-paragraph\">Wir wissen nun, wie sich IDP-Aufgaben f\u00fcr diskriminierende Modelle konzeptionell formulieren lassen. Zwei weitere Konzepte sind f\u00fcr ein besseres Verst\u00e4ndnis grundlegend:\u202f<strong>Embeddings<\/strong>\u202fund\u202f<strong>Tokenisierung<\/strong>.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-7c4eb4a425dbc599eec1c3adbb7ce1fb wp-block-paragraph\">Da die Aufgabe darin besteht, \u201eDingen Labels zuzuweisen\u201c, ben\u00f6tigen wir eine M\u00f6glichkeit, die \u201eDinge\u201c sinnvoll darzustellen \u2013 sei es ein Dokument, eine Seite oder einzelne Tokens innerhalb eines Dokuments. Hier kommen nun Embeddings ins Spiel.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-9320a3d265e786b132b67a71cb06fb9a wp-block-paragraph\">&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 31px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-fc95b985b92e9a526ac0a0f3f581f64b wp-block-paragraph\"><strong>Embeddings<\/strong><\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-be61ed799ff245f9f0d96e1a0ada6880 wp-block-paragraph\">KI-Modelle arbeiten nicht direkt mit Bildern, Audio, Dokumenten, Text oder Tokens, wie wir Menschen sie verstehen. Sie verarbeiten ausschlie\u00dflich Zahlen. Die Umwandlung realer Objekte in eine \u201eListe von Zahlen\u201c nennt man\u202f<strong>Embedding <\/strong>oder\u202f<strong>Vektorisierung<\/strong>. Wichtig ist, dass diese Zahlen eine sinnvolle Repr\u00e4sentation f\u00fcr das zu l\u00f6sende Problem liefern.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 31px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-e62fcb4bb51b9d906ba58bd9b832ec46 wp-block-paragraph\"><strong>RGB als Beispiel<\/strong><\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-56d744339ea33b0d09d602a5fad06f11 wp-block-paragraph\">Dieser Abschnitt ist nicht auf IDP bezogen, sondern veranschaulicht allgemein, wie Informationen in Zahlen \u00fcbersetzt werden k\u00f6nnen. Ein Pixel auf Ihrem Bildschirm l\u00e4sst sich durch drei RGB-Werte darstellen (R = Rot, G = Gr\u00fcn, B = Blau). Dies kann als eine Art Embedding betrachtet werden: [R, G, B]. F\u00fcr unser Beispiel normalisieren wir die Werte auf den Wertebereich 0\u20131.&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Rot \u2192 [1, 0, 0]&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Gr\u00fcn \u2192 [0, 1, 0]&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Blau \u2192 [0, 0, 1]&nbsp;<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 24px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-2998e37ad999c7ccdb332f736b81c967 wp-block-paragraph\">Beliebige Farben lassen sich nun als Kombination dieser drei Zahlen darstellen, z.\u202fB. Gelb = Rot + Gr\u00fcn \u2192 [1, 1, 0]. Moderne LLMs wie ChatGPT, Claude oder LLaMA verwenden deutlich gr\u00f6\u00dfere Embeddings, oft mehrere tausend Zahlen pro Token und nicht nur 3 wie in unserem Beispiel.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-8f761849 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\" style=\"flex-basis: 25%;\">\u00a0<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\" style=\"flex-basis:50%\">\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/RGB_no-bg-1024x1024.png\" alt=\"\" class=\"wp-image-27911\"\/><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\" style=\"flex-basis: 25%;\">\u00a0<\/div>\n<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-15561f68bab5fe6b301aebd205b38bea wp-block-paragraph\">Nehmen wir an, wir h\u00e4tten&nbsp;ein Token-Embedding-Modell, das f\u00fcr jedes Token nur drei Zahlen zur Darstellung der Bedeutung verwenden darf \u2013 dies aus dem Grund, dass wir wie gesehen 3 Zahlen einfach als Farben visualisieren k\u00f6nnen. Im fiktiven Beispiel unten sehen wir, dass Adressen einen r\u00f6tlichen Ton haben, Zahlen gr\u00fcn erscheinen und Datumsangaben blau gef\u00e4rbt sind.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-020f6185afbe89dd61603227886baaf1 wp-block-paragraph\">Bei genauerer Betrachtung gibt es aber auch Ausnahmen: Hausnummern und Postleitzahlen erscheinen n\u00e4mlich orange. Das heisst, dass das Modell\u202f<strong>dynamische Embeddings <\/strong>generiert, die sich je nach Kontext \u00e4ndern. Als Kontext gelten in diesem Fall die benachbarten Tokens. Im Gegensatz dazu sind\u202f<strong>statische Embeddings <\/strong>feste Lookups: Zum Beispiel das Token \u201e9155\u201c h\u00e4tte immer dieselbe Repr\u00e4sentation, unabh\u00e4ngig vom Kontext.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-435fdb8a7de33d33b51e724fcc40742b wp-block-paragraph\">Bei Parashift kombinieren wir dynamische und statische Embeddings, um LLM-Antworten in Dokumenten zu verankern.\u202f<em>Verankerung <\/em>bedeutet hier: Wir identifizieren die genauen Tokens, die eine Antwort bilden \u2013 mit einer Aufl\u00f6sung bis auf Token-Ebene, nicht nur auf Absatz- oder Zeilen-Ebene. Statische Embeddings sto\u00dfen an ihre Grenzen, wenn sie Homonyme unterscheiden sollen wie z.\u202fB. das Wort \u201eBank\u201c in unterschiedlichen Kontexten.&nbsp;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ich setze mich auf die Bank.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-401b039a9eb0ea3bc014403d225dea7d wp-block-paragraph\">Ich gehe in die Bank.&nbsp;<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/invoices-1024x695.png\" alt=\"KI-Extraktion auf der Parashift-Plattform\" class=\"wp-image-27884\"\/><\/figure>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Tokenisierung<\/strong><\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-b5f311aa9ec39ea8b83b6fbf19c4a88a wp-block-paragraph\">Ein weiterer entscheidender Schritt ist die Aufteilung eines Dokuments in kleinere Einheiten: Abs\u00e4tze, Zeilen, W\u00f6rter oder Tokens. Diese Einheiten k\u00f6nnen dann mit Labels versehen werden.&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-e945094d6c95865fef88bb85dd537413 wp-block-paragraph\">Ein Token ist meist ein kurzes Wort oder ein Teilwort. Die optimale Methode zur Tokenisierung gibt es in diesem Sinne nicht. Am untenstehenden <a href=\"https:\/\/huggingface.co\/spaces\/Xenova\/the-tokenizer-playground\" target=\"_blank\" rel=\"noopener\">Beispiel<\/a> sehen wir, wie der GPT4 Tokenizer einen Satz in Tokens zerst\u00fcckelt, diese sind als farbige Rechtecke dargestellt. Nach der Tokenisierung k\u00f6nnen wir jedem Token Labels zuweisen, z.\u202fB. Absendername, Absenderstra\u00dfe, Absenderhausnummer \u2013 dies bildet die Grundlage f\u00fcr die Informationsextraktion.&nbsp;<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" src=\"https:\/\/parashift.ai\/wp-content\/uploads\/2025\/08\/giraffe-tokens.png\" alt=\"\" class=\"wp-image-27887\"\/><\/figure>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-749c3460040b03b3903011526b476b53 wp-block-paragraph\">Zum Schluss k\u00f6nnen ein weiteres Modell trainieren, das diese Embeddings nutzt, um Tokens Labels zuzuweisen. F\u00fcr \u201eAdressen\u201c oder \u201eDaten\u201c funktioniert das in unserem Beispiel sehr gut. Andere Informationen werden schwieriger, wenn die Embeddings die Tokens nicht ausreichend differenzieren kann (viele Tokens sind einfach grau).&nbsp;<\/p>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-7ad13f2ff9f6d16be1f8f52e9bdbd230 wp-block-paragraph\">Dies verdeutlicht die\u202f<strong>Notwendigkeit generischer Einbettungen<\/strong>, die eine Vielzahl m\u00f6glicher nachgelagerter Aufgaben abdecken k\u00f6nnen, und gleichzeitig gen\u00fcgend Informationen liefern, um die nachfolgenden Klassifikationsmodelle zu unterst\u00fctzen.&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 49px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<h4 class=\"wp-block-heading has-black-color has-text-color has-link-color wp-elements-bd4e1a5e8a6a4dd6272bb6dbcd856b90\" id=\"h-zusammenfassung-diskriminierender-modelle-nbsp\">Zusammenfassung diskriminierender Modelle&nbsp;<\/h4>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-57648e360abad960f67405c30b673eff wp-block-paragraph\"><strong>Vorteile:<\/strong>&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-63e552d814a39c3690ede92d1387c312\">Vorhersagen f\u00fcr jedes Token erm\u00f6glichen eine exakte Identifikation der entsprechenden Inhalte direkt im Dokument.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-3101893fa04a0214157a459098e022cd\">Jede Vorhersage kommt mit einem Konfidenzwert, der die Zuverl\u00e4ssigkeit der Klassifizierung angibt.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-1c887003a237b2ef16fb2f23ba042c19\">Modelle sind vergleichsweise klein (einige Millionen bis wenige hundert Millionen Parameter) und k\u00f6nnen auf einer einzigen GPU in Minuten bis Stunden trainiert werden.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-4a61ed0f2fa4d2191e8026f800470407\">Kleine Modelle sind schnell: Dokumente mit wenigen Seiten werden in Millisekunden verarbeitet.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-879e7d1e5f544c505a6e728917b70965\">Datenschutz: Die Modelle geben keine sensiblen Trainingsdaten preis. Sie f\u00fcgen lediglich Labels hinzu.&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-56effd292213744b96d4d0c192043924\">Embedding-Modelle erledigen den Gro\u00dfteil der \u201eschweren Arbeit\u201c, und die Embeddings k\u00f6nnen dann f\u00fcr mehrere verschiedene Aufgaben wiederverwendet werden.&nbsp;<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 36px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-d41a4ff85f3c6c88cf643aeb41352d6c wp-block-paragraph\"><strong>Nachteile:<\/strong>&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-88c86c302dfebd189bdcee5a73ff285e\">Sie k\u00f6nnen ihre Antworten nicht auf neue, ungesehene Aufgaben verallgemeinern. Neue Aufgaben erfordern erweitertes Training oder ein neues Modell. (In folgenden Teilen der Serie werden wir aber Anstrengungen dazu anschauen wie eine gewisse Generalisierung trotzdem zu bewerkstelligen sein k\u00f6nnte)&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-black-color has-text-color has-link-color wp-elements-c4906454acae5f720dfe0f4705d3f461\">Labelbasierte Klassifikation ist weniger flexibel als generative Ans\u00e4tze. Viele Aufgaben lassen sich nicht rein diskriminierend l\u00f6sen. Zum beispiel das Verfassen von Zusammenfngen etc.&nbsp;<\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 36px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<div class=\"wp-block-spacer\" style=\"height: 36px;\" aria-hidden=\"true\">\u00a0<\/div>\n\n\n\n<p class=\"has-black-color has-text-color has-link-color wp-elements-e1f2de4758fef153b7db69d37aea7b11 wp-block-paragraph\">Dies ist erst der Beginn eines Austauschs. Wenn Sie erfahren m\u00f6chten, wie Parashift Sie auf Ihrem Weg zur Automatisierung unterst\u00fctzen kann, z\u00f6gern Sie nicht<em>,<\/em> <strong><a href=\"https:\/\/parashift.ai\/de\/kontakt\/\"><em>uns zu kontaktieren<\/em><\/a><\/strong>.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-content-justification-center is-layout-flex wp-container-core-buttons-is-layout-fe48e5de wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button is-style-outline is-style-outline--1\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/parashift.ai\/de\/demo-buchen\/\">Parashift kostenlos testen<\/a><\/div>\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>KI ist nicht gleich KI. Die Modelle im Hintergrund entscheiden, ob Ihre Dokumentenautomatisierung Zeit spart \u2013 oder neue Kopfschmerzen bereitet. Unser ML-Team hat dazu einen Artikel verfasst, der genau das erkl\u00e4rt.<\/p>\n","protected":false},"author":5,"featured_media":27885,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[128],"tags":[],"class_list":["post-30902","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-parashift-platform-2"],"_links":{"self":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/30902","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/comments?post=30902"}],"version-history":[{"count":2,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/30902\/revisions"}],"predecessor-version":[{"id":34666,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/posts\/30902\/revisions\/34666"}],"wp:attachment":[{"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/media?parent=30902"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/categories?post=30902"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/parashift.ai\/de\/wp-json\/wp\/v2\/tags?post=30902"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}