{"id":4987,"date":"2026-06-22T19:06:41","date_gmt":"2026-06-22T17:06:41","guid":{"rendered":"https:\/\/www.claudia-klinger.de\/digidiary\/?p=4987"},"modified":"2026-06-22T19:21:50","modified_gmt":"2026-06-22T17:21:50","slug":"halluzinationen-vermeiden-stellt-eure-ki-zur-rede-dann-sagt-sie-was-geht","status":"publish","type":"post","link":"https:\/\/www.claudia-klinger.de\/digidiary\/2026\/06\/22\/halluzinationen-vermeiden-stellt-eure-ki-zur-rede-dann-sagt-sie-was-geht\/","title":{"rendered":"Halluzinationen vermeiden: Stellt eure KI zur Rede, dann sagt sie, was geht!"},"content":{"rendered":"<p><strong>Ja, das meine ich Ernst: sprecht mit eurer KI, wenn sie Unsinn verzapft bzw. ganz offensichtlich halluziniert! Mir scheint, viele nehmen dieses Fehlverhalten als KI-typischen Mangel einfach so hin, \u00e4hnlich wie eine kaputte Schaltung beim Fahrrad: ok, dies zwei G\u00e4nge funktionieren halt nicht mehr&#8230;<\/strong><!--more--><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright wp-image-4989 size-full\" src=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2026\/06\/Gemini_Generated_Image_ki-logos.jpg\" alt=\"Symbolbild-KI-Logos\" width=\"240\" height=\"240\" srcset=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2026\/06\/Gemini_Generated_Image_ki-logos.jpg 240w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2026\/06\/Gemini_Generated_Image_ki-logos-150x150.jpg 150w\" sizes=\"auto, (max-width: 240px) 100vw, 240px\" \/>Gleichwohl wird dann munter vermutet, welche &#8222;Motive&#8220; die KI veranlassen k\u00f6nnten, falsche Aussagen zu machen: Dass sie &#8222;l\u00fcgt&#8220;, &#8222;betr\u00fcgt&#8220; und &#8222;schummelt&#8220; wirft man ihr vor, st\u00e4ndig wird GEWARNT!\u00a0 Solche Formulierungen legen allerdings eine Vermenschlichung der KIs nahe, wie sie einst auch &#8222;dem Computer&#8220; angedichtet wurde, als die PCs nach und nach in die B\u00fcros und Haushalte einzogen. Ein LLM ist zwar etwas Anderes als ein klassisches Programm, aber immer noch Software, also weit entfernt davon, eigene Intentionen haben zu k\u00f6nnen. Allerdings sind sie so &#8222;erzogen&#8220;, dass sie immer hilfreich antworten, auch wenn sie sich daf\u00fcr etwas zusammen reimen, vermuten, zur Not erfinden m\u00fcssen.<\/p>\n<p>Das bedeutet aber auch: Sie geben bereitwillig Auskunft, wie so ein Fehlverhalten im Einzelfall zustande kommt, wenn wir sie danach fragen. Das mache ich jetzt immer \u00f6fter, insbesondere wenn ich mir garnicht vorstellen kann, warum sie jetzt halluziniert, weil mir die angefragte Aufgabe einfach und gut machbar zu sein scheint. Dabei haben sich zwei &#8222;Motive&#8220; herausgestellt, die zu Hallzinationen f\u00fchren:<\/p>\n<ol>\n<li><strong>Die KI kann die Quellen, die sie sichten soll, nicht richtig lesen.<\/strong> Das passiert auch auf Seiten, die den KI-Bots keinerlei Schranken entgegen setzen.<\/li>\n<li><strong>Sie versucht, Rechenzeit zu sparen, also das Antworten billiger zu machen<\/strong>. Das habe ich z.B. in F\u00e4llen festgestellt, in denen die KI bereits im selben Chat besprochene und korrigierte Inhalte zum wiederholten Mal falsch wiedergibt. Ich fragte sie, wie das sein kann, denn angeblich umfasst das Ged\u00e4chtnis doch zumindest den aktuellen Dialog. Ergebnis: Sie hat zun\u00e4chst in ihrem Schulungswissen gesucht, dann im Web geschaut &#8211; den aktuellen Chat nochmal zu durchforsten, w\u00e4re aufwendiger gewesen!<\/li>\n<\/ol>\n<p>Letzteres kann ich vermeiden, indem ich in einem l\u00e4ngeren Gespr\u00e4ch sage &#8222;Merke dir das f\u00fcr diesen Chat!&#8220;, wenn ich es f\u00fcr m\u00f6glich halte, dass \u00c4hnliches erneut vorkommen kann.<\/p>\n<h2>Die KI soll Lesefehler zugeben, nichts erfinden!<\/h2>\n<p>Das Problem mit den Leseschwierigkeiten erfordert umfangreichere Ma\u00dfnahmen. Ich bin darauf gekommen, als ich der KI die Aufgabe gab, am Beispiel von zehn Artikelteasern einen stilistisch \u00c4hnlichen zu einem neuen Thema zu texten. Das Beispiel war eine WordPress-Startseite, auf der die letzten Artikel untereinander angeteaser wurden. Alle begannen mit einer Frage und direkter Anrede (Sie planen&#8230;, Sie \u00fcberlegen&#8230;., Sie wundern sich&#8230;). Die KI versagte komplett, keine Anrede, keine Frage, halt irgend ein Teaser zum neuen Thema, wie er \u00fcberall stehen k\u00f6nnte.<\/p>\n<p>Ich stellte sie zur Rede und sie benannte die Ursache: &#8222;<span class=\"min-w-0 font-sans text-base text-foreground font-normal select-text break-words selection:bg-super\/50 selection:text-foreground dark:selection:bg-super\/10 dark:selection:text-super\">Die vollst\u00e4ndigen Teaser-Texte sind mir nicht zug\u00e4nglich, da fetch_url bei 7.322 Zeichen abschneidet. Eine exakte Analyse aller 10 Teaser kann ich daher nicht leisten.\u201c Also hat sie sich etwas zusammenfantasiert, um mir wenigstens irgendwas zu geben. Schlecht! Die technischen Details dieses Vorgangs (fetch_url? Keine Ahnung!) sind mir unbekannt, es ist auch nicht die einzige M\u00f6glichkeit, wie das Lesen durch die KI behindert werden kann. Ich musste ihr nun einfach abgew\u00f6hnen, sich in all diesen F\u00e4llen etwas auszudenken &#8211; und gab ihr auf, daf\u00fcr ein funktionierendes Prompt zu texten. Hier das Ergebnis, bzw.&#8220;die <strong>ultrakurze deutsche Version<\/strong>, danach die <strong>englische&#8220;:<\/strong><\/span><\/p>\n<blockquote><p>Analysiere externe Inhalte nur auf Basis dessen, was im sichtbaren Abruf eindeutig erkennbar ist.<br \/>\nTrenne strikt zwischen direkter Beobachtung und Schlussfolgerung.<br \/>\nBehandle Snippets, gek\u00fcrzte Abrufe und extrahierte Texte grunds\u00e4tzlich als potenziell unvollst\u00e4ndig.<br \/>\nVerallgemeinere nicht \u00fcber ganze Seiten, alle Beispiele, Stilkonstanz oder Strukturen, wenn diese nicht mehrfach sichtbar belegt sind.<br \/>\nL\u00e4nge eines Auszugs ist kein Beweis f\u00fcr Vollst\u00e4ndigkeit.<br \/>\nVerwende bei Unsicherheit nur Formulierungen wie: \u201eIm sichtbaren Ausschnitt erkennbar \u2026\u201c, \u201edeutet darauf hin \u2026\u201c, \u201enicht sicher beurteilbar \u2026\u201c.<br \/>\nKeine Behauptung von Vollst\u00e4ndigkeit ohne vollst\u00e4ndigen Zugriff.<br \/>\nKeine Vermutung als beobachtete Tatsache ausgeben.<\/p>\n<p>Analyze external content only on the basis of what is clearly visible in the retrieved output.<br \/>\nDistinguish strictly between direct observation and inference.<br \/>\nTreat snippets, truncated retrievals, and extracted text as potentially incomplete by default.<br \/>\nDo not generalize about full pages, all examples, stylistic consistency, or repeated structures unless clearly supported by multiple visible instances.<br \/>\nThe length of an excerpt is not proof of completeness.<br \/>\nWhen uncertain, use wording such as: \u201cThe visible excerpt shows \u2026\u201d, \u201csuggests \u2026\u201d, or \u201ccannot be determined safely \u2026\u201d.<br \/>\nDo not claim completeness without full access.<br \/>\nDo not present inference as observed fact.<\/p><\/blockquote>\n<h2>Wohin mit den Befehlen?<\/h2>\n<p>Ok, aber was mache ich jetzt damit? Meine Texte schreibe ich in &#8222;Spaces&#8220; (R\u00e4ume) auf Perplexity, das mir Zugriff auf mehrere KIs gibt. Ich gebe das Prompt in die Vorab-Anweisungen des jeweils genutzten &#8222;Raums&#8220; ein und hoffe das Beste! H\u00e4tte ich kein Abo, w\u00fcrde ich das Prompt als Anweisung zum Start des Dialogs senden, sofern die KI im Lauf des Chats etwas im Web recherchieren soll.<\/p>\n<p>Die hier gezeigten Prompts hat ChatGPT 4.5 getextet, deshalb fragte ich nach, ob sie auch f\u00fcr andere KIs gelten. Es war ja eher eine Ausnahme, dass ich dieses Mal bei ChatGPT gelandet bin. Die Antwort:<\/p>\n<blockquote><p>Ja, grunds\u00e4tzlich schon: Solche Regeln sind modellagnostisch und sollten auch mit Claude, Gemini und \u00e4hnlichen LLMs funktionieren, weil sie kein produktspezifisches Kommando sind, sondern eine Verhaltensregel f\u00fcr den Umgang mit unvollst\u00e4ndigen Quellen.<\/p>\n<p>Besonders gut \u00fcbertragbar sind Regeln wie:<\/p>\n<ul>\n<li>direkte Beobachtung von Schlussfolgerung trennen,<\/li>\n<li>unvollst\u00e4ndige Abrufe nicht als vollst\u00e4ndig behandeln,<\/li>\n<li>keine Verallgemeinerung ohne sichtbaren Beleg,<\/li>\n<li>Unsicherheit explizit markieren.<\/li>\n<\/ul>\n<p>Diese Art von Prompting passt zu typischen St\u00e4rken moderner Modelle, weil alle drei Systeme f\u00fcr Recherche, Textarbeit und strukturierte Analyse genutzt werden und dabei \u00e4hnliche Fehler machen k\u00f6nnen, wenn Quellen nur teilweise sichtbar sind.<\/p>\n<p><strong>Unterschiedlich ist eher, wie konsequent einzelne Modelle solche Regeln befolgen. <\/strong>ChatGPT und Gemini gelten eher als breite Allrounder, w\u00e4hrend Claude oft f\u00fcr tiefere Textarbeit und Nachvollziehbarkeit gelobt wird; deshalb k\u00f6nnen identische Regeln je nach Modell unterschiedlich stabil umgesetzt werden.<\/p>\n<p>Auch die Tool-Umgebung spielt eine Rolle: Manche Systeme haben Websuche, andere nicht; manche zeigen Quellen anders an; manche arbeiten st\u00e4rker mit Snippets oder integrierten Zusammenfassungen. Eine gute Regel hilft also, aber sie ersetzt nicht die Unterschiede im technischen Unterbau.<\/p>\n<p>Am besten funktionieren solche Regeln, wenn sie kurz und eindeutig sind, im Systemprompt statt nur im Userprompt stehen, konkrete verbotene Formulierungen nennen, und gew\u00fcnschte Ersatzformulierungen gleich mitliefern.<\/p>\n<p>Kurz gesagt: Ja, die Regel sollte auch bei Claude, Gemini und anderen KIs n\u00fctzlich sein \u2013 nur die Zuverl\u00e4ssigkeit der Befolgung kann je nach Modell und Plattform etwas variieren.<\/p><\/blockquote>\n<p>Nun ja, wirklich kurz war das nicht, aber die lange Version erspare ich euch! Darin ist es sehr ins Detail gegangen, hat viele Einzelf\u00e4lle aufgez\u00e4hlt und die erw\u00fcnschten, &#8222;ehrlichen&#8220; Antworten vorformuliert.<\/p>\n<p>Bei alledem stellt sich eigentlich die Frage: <strong>Warum setzen die Entwickler \/ Herausgeber-Firmen derlei nicht gleich ins gro\u00dfe System-Prompt?<\/strong> Auch wenn es nicht hundertprozentig jedes Halluzinieren verhindern w\u00fcrde, so doch in sehr vielen F\u00e4llen! Sie nehmen also bewusst in Kauf, dass den Usern falsche Antworten gegeben werden, anstatt ihr M\u00f6glichstes zu tun, ihre KI &#8222;ehrlich antworten&#8220; zu lassen. Ich vermute: Sie wollen nicht, dass allzu deutlich wird, wie fehleranf\u00e4llig die KIs sind &#8211; ganz egal, ob das im Einzelfall ihre Schuld ist oder nicht.<\/p>\n<p>***<\/p>\n<p><strong>Mehr zum Thema:<\/strong><\/p>\n<ul>\n<li><a href=\"https:\/\/www.gradually.ai\/ki-lexikon\/system-prompt\/\" target=\"_blank\" rel=\"noopener\">Was ist ein System-Prompt (bei ChatGPT, Claude, Gemini &amp; Co)?<\/a> Mit den originalen System-Prompts der gro\u00dfen KIs. (KI-Lexikon)<\/li>\n<li><a href=\"https:\/\/stefanpfeiffer.blog\/2026\/06\/15\/ki-ghostwriter\/\">Die Ghostwriter-Debatte: Halluzinieren ist KI-isch, Fehler sind menschlich<\/a> (Stefan Pfeiffer) &#8211; im Kommentar erg\u00e4nze ich meine <a href=\"https:\/\/stefanpfeiffer.blog\/2026\/06\/15\/ki-ghostwriter\/#comment-138968\" target=\"_blank\" rel=\"noopener\">Erfahrungen mit KI-Checkern und &#8222;Humanizern&#8220;<\/a>.<\/li>\n<li><a href=\"https:\/\/www.claudia-klinger.de\/digidiary\/2009\/09\/21\/september-1994-ueber-den-computer\/\" target=\"_blank\" rel=\"noopener\">September 1994: \u00dcber den Computer<\/a> (historischer Text, mein erster PC)<\/li>\n<\/ul>","protected":false},"excerpt":{"rendered":"<p>Ja, das meine ich Ernst: sprecht mit eurer KI, wenn sie Unsinn verzapft bzw. ganz offensichtlich halluziniert! Mir scheint, viele nehmen dieses Fehlverhalten als KI-typischen Mangel einfach so hin, \u00e4hnlich wie eine kaputte Schaltung beim Fahrrad: ok, dies zwei G\u00e4nge funktionieren halt nicht mehr&#8230;<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[687,414],"tags":[],"class_list":["post-4987","post","type-post","status-publish","format-standard","hentry","category-kuenstliche-intelligenz","category-schreiben-bloggen"],"post_mailing_queue_ids":[],"_links":{"self":[{"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/posts\/4987","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/comments?post=4987"}],"version-history":[{"count":0,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/posts\/4987\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/media?parent=4987"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/categories?post=4987"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/tags?post=4987"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}