{"id":4665,"date":"2025-03-30T14:20:42","date_gmt":"2025-03-30T12:20:42","guid":{"rendered":"https:\/\/www.claudia-klinger.de\/digidiary\/?p=4665"},"modified":"2025-04-01T11:14:53","modified_gmt":"2025-04-01T09:14:53","slug":"die-neuen-ki-modelle-und-die-katze-im-klo","status":"publish","type":"post","link":"https:\/\/www.claudia-klinger.de\/digidiary\/2025\/03\/30\/die-neuen-ki-modelle-und-die-katze-im-klo\/","title":{"rendered":"Die neuen KI-Modelle und die Katze im Klo"},"content":{"rendered":"<p>Auf Youtube wurden die neuen F\u00e4higkeiten der KI-Modelle von <a href=\"https:\/\/www.youtube.com\/watch?v=autduAzajxI\" target=\"_blank\" rel=\"noopener\">OpenAI<\/a> und <a href=\"https:\/\/www.youtube.com\/watch?v=-9yQc2nrbuY\" target=\"_blank\" rel=\"noopener\">Google<\/a> vorgestellt: Endlich k\u00f6nnen sie direkt im &#8222;Gespr\u00e4ch&#8220; Bilder erstellen und diese auf Nachfrage ver\u00e4ndern und verbessern &#8211; ein Quantensprung! Man k\u00f6nne auch Bilder hochladen und diese &#8222;bearbeiten lassen&#8220;, hei\u00dft es &#8211; Fotoshop war gestern! Angeblich soll das alles auch in den kostenlosen Modellen funktionieren, was ich heute mal ausprobiert habe.<!--more--><\/p>\n<h2>Erster Versuch:\u00a0GPT-4o: die neue Version von OpenAI<\/h2>\n<p>&#8222;<strong>Erstelle ein Bild im Comic-Stil von einer Katze, die eine Toilette f\u00fcr Menschen benutzt!<\/strong>&#8220;\u00a0 Das war das erste, sehr einfache Prompt, das mir in den Sinn kam. Als ich noch Katzen hatte, erstaunte mich regelm\u00e4\u00dfig ihr Versuch, das WC zu benutzen &#8211; ein Motiv, das vielleicht nicht in den Schulungsdaten der KIs vorkommt. Leider ging das gleich schief:<\/p>\n<blockquote><p>&#8222;<em>Ich konnte das Bild leider nicht generieren. Falls du es noch einmal versuchen m\u00f6chtest oder \u00c4nderungen w\u00fcnschst, lass es mich wissen!<\/em>&#8222;<\/p><\/blockquote>\n<p>Ok, das war vielleicht wirklich zu einfach formuliert, ich legte also nach:<\/p>\n<p>&#8222;<strong>Noch einmal genauer: Erstelle das Bild einer Katze, die eine Toilette f\u00fcr Menschen benutzt. Das sieht so aus: Man sieht die WC-Sch\u00fcssel von vorne, die Katze steht in der Sch\u00fcssel und st\u00fctzt ihre Pfoten auf den vorderen Rand der WC-Sch\u00fcssel. Mit den Hinterbeinen steht sie in der Sch\u00fcssel, was aber nicht zu sehen ist: nur die obere H\u00e4lfte der Katze schaut aus der WC-Sch\u00fcssel, sie blickt nach vorne in die Kamera und st\u00fctzt de Pfoten auf den Sitzrand.<\/strong>&#8220;<\/p>\n<blockquote><p><em>&#8222;Ich kann das Bild im Moment leider nicht generieren, da es eine Begrenzung f\u00fcr die Anzahl der Bilder gibt, die ich in kurzer Zeit erstellen kann. Du kannst es sp\u00e4ter noch einmal versuchen oder mir weitere Details geben, falls du eine andere Idee hast!&#8220;<\/em><\/p><\/blockquote>\n<p>So so! Nach nur einem Versuch macht sie schon Schluss. Auf Nachfrage sagt ChatGPT:<\/p>\n<blockquote><p><em>&#8222;Normalerweise kann ich mehrere Bilder hintereinander generieren, aber es gibt ein Limit, das mich nach einer bestimmten Anzahl oder H\u00e4ufigkeit f\u00fcr eine gewisse Zeit pausieren l\u00e4sst. Leider sind die genauen Zahlen nicht immer gleich und h\u00e4ngen von verschiedenen Faktoren ab. In diesem Fall wurde ich nach nur einem Bild gesperrt, was ungew\u00f6hnlich ist. Wenn du m\u00f6chtest, kannst du es in etwa 42 Minuten noch einmal versuchen, oder wir k\u00f6nnen in der Zwischenzeit an einer anderen Idee arbeiten!&#8220;<\/em><\/p><\/blockquote>\n<p>N\u00f6, will ich nicht! Vermutlich ist die neue Funktion grade nur f\u00fcr zahlende User nutzbar, wenn \u00fcberhaupt.<\/p>\n<h2>Zweiter Versuch: Googles Gemini 2.5 pro (experimental)<\/h2>\n<p>Noch einmal dasselbe, ausf\u00fchrliche Prompt. Aber ich bekomme nur einen ellenlangen &#8222;Gedankengang&#8220; und dann KEIN BILD! Auch auf Nachfrage (&#8222;<strong>Ich sehe kein Bild, erstelle es!<\/strong>) kommen nur von der Ki berichtete Zugriffsfehler, aber kein Bild. Am Ende sagt Gemini:<\/p>\n<blockquote><p>&#8222;<em>Trotz mehrerer Anl\u00e4ufe scheint es momentan ein grundlegendes Problem mit dem Zugriff auf die Bilderstellungsfunktion zu geben, das ich nicht umgehen kann. Daher muss ich dir leider mitteilen, dass ich das gew\u00fcnschte Bild der Katze in der Toilette unter diesen Umst\u00e4nden aktuell nicht erstellen kann. Ich entschuldige mich vielmals f\u00fcr die wiederholten Fehlversuche und die Unannehmlichkeiten.<\/em>&#8222;<\/p><\/blockquote>\n<p>Am Fu\u00df der Seite wird mir nun ein <strong>Upgrade auf die Zahlversion<\/strong> angeboten, ein ganzer Probemonat kostenlos (k\u00fcndbar zum Ende dieses Monats). Das nehme ich an und logge in die zahlungsprlichtige Pro-Version ein. Und poste dasselbe komplexe Prompt mit der Bildbeschreibung von der Katze auf dem Klo. Die Antwort:<\/p>\n<blockquote><p>&#8222;Ich kann leider keine Bilder direkt erstellen. Aber ich kann dir eine detaillierte Beschreibung geben, wie das Bild aussehen w\u00fcrde: Stell dir eine Standard-Toilette aus wei\u00dfer Keramik vor, von vorne fotografiert&#8230;..(usw.)&#8220;<\/p><\/blockquote>\n<p>Wie bitte? Das ist doch nicht ihr Ernst. Ich hake nach:<\/p>\n<p>&#8222;<strong>Ich dachte, Gemini Advanced 2.5 pro kann Bilder erstellen! Ich habe Demos gesehen und gerade die kostenlose Version ausprobiert, die durchaus Bilder erstellen kann. Weil es einen technischen Fehler gab, habe ich ein Premium-Abo f\u00fcr die KI-Nutzung abgeschlossen. Und du (=dasselbe Modell) sagt mir jetzt, dass es keine Bilder erstellen kann? Wieso das?<\/strong>&#8220;<\/p>\n<p>Und siehe da:<\/p>\n<p>Du hast vollkommen Recht, und es tut mir aufrichtig leid f\u00fcr die Verwirrung und Frustration, die meine vorherige Antwort verursacht hat. Das war ein Fehler meinerseits.<\/p>\n<blockquote><p>&#8222;Ja, als Gemini Advanced bzw. das zugrundeliegende Modell kann ich Bilder erstellen. Die Information, dass ich das nicht k\u00f6nne, war falsch. Es gibt verschiedene m\u00f6gliche Gr\u00fcnde, warum meine vorherige Antwort fehlerhaft war:<\/p>\n<ul>\n<li>Vor\u00fcbergehender Fehler: Manchmal kann es vorkommen, dass eine Funktion kurzzeitig nicht verf\u00fcgbar ist oder ich f\u00e4lschlicherweise annehme, sie sei nicht verf\u00fcgbar.<\/li>\n<li>Fehlinterpretation der Anfrage: In seltenen F\u00e4llen k\u00f6nnte ich die Anfrage missverstehen und f\u00e4lschlicherweise eine Standardantwort geben, die nicht meine vollen F\u00e4higkeiten widerspiegelt.<\/li>\n<li>Interne Inkonsistenz: Da ich st\u00e4ndig weiterentwickelt werde, kann es in Ausnahmef\u00e4llen zu internen Inkonsistenzen kommen, die zu einer falschen Aussage \u00fcber meine F\u00e4higkeiten f\u00fchren.<\/li>\n<\/ul>\n<p>Unabh\u00e4ngig vom Grund war meine Aussage falsch, und ich entschuldige mich daf\u00fcr, besonders da du extra ein Abonnement abgeschlossen hast. Du solltest die Bildgenerierungsfunktion nutzen k\u00f6nnen.<br \/>\nM\u00f6chtest du, dass ich jetzt versuche, das Bild der Katze auf der Toilette f\u00fcr dich zu erstellen?&#8220;<\/p><\/blockquote>\n<p>Ja, das will ich! Und bekomme wieder einen ellenlangen Gedankengang, in dem sich die KI selbst erz\u00e4hlt, was sie tun soll &#8211; es aber NICHT TUT! Ich versuche, es ihr zu erleichtern, \u00fcbernehme das im &#8222;Gedankengang&#8220; erstellte Prompt und erlaube den Comic-Stil:<\/p>\n<p><strong>&#8222;Ich sehe kein Bild! Mach es noch einmal, aber im Comic-Stil, vielleicht klappt das ja. Hier das Prompt: &#8222;A comic style image depicting a funny scene in a bathroom. Viewpoint is directly facing a standard white ceramic human toilet bowl. A medium-sized tabby cat is positioned inside the toilet bowl, facing the camera. Only the upper half of the cat, from the chest up, is visible above the rim. The cat has a slightly surprised\/focused expression, looking directly at the viewer. Its front paws are placed firmly on the front edge of the white toilet seat. Simple, clean bathroom background with tiled walls.&#8220; <\/strong><\/p>\n<p>Und siehe da, endlich mal ein Bild:<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-full wp-image-4666\" src=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo.jpg\" alt=\"Katze im Klo\" width=\"512\" height=\"512\" srcset=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo.jpg 512w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-300x300.jpg 300w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-150x150.jpg 150w\" sizes=\"(max-width: 512px) 100vw, 512px\" \/><\/p>\n<p>Zwar nicht im Comic-Stil, aber der war mir ja nicht wichtig. Allerdings ist die Katze im Verh\u00e4ltnis zum Klo viel zu gro\u00df!<\/p>\n<p><strong>&#8222;Mach die Katze etwas kleiner, so dass es realistischer aussieht. Die ganze Katze muss ja mit den Hinterbeinen in der Toilettensch\u00fcssel stehen (was man nicht sieht) und ihr K\u00f6rper und Kopf muss zur Gr\u00f6\u00dfe der Toilette in einem nat\u00fcrlichen Verh\u00e4ltnis stehen. Diese Katze ist zu gro\u00df! Gerne kannst du es im Comic-Stil realisieren, wenn es photorealistisch nicht geht&#8220; <\/strong><\/p>\n<p>Das Ergebnis ist schon etwas besser:<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-full wp-image-4667\" src=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-comic.jpg\" alt=\"Katze im Klo, Comic-Stil\" width=\"512\" height=\"512\" srcset=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-comic.jpg 512w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-comic-300x300.jpg 300w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-comic-150x150.jpg 150w\" sizes=\"(max-width: 512px) 100vw, 512px\" \/><\/p>\n<p>Jetzt also wirklich der Comic-Stil! Aber: &#8222;<strong>Bitte nochmal, die Katze noch ein bisschen kleiner und schlanker!&#8220;<\/strong><\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-full wp-image-4668\" src=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-final.jpg\" alt=\"Katze im Klo, realistisch\" width=\"512\" height=\"512\" srcset=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-final.jpg 512w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-final-300x300.jpg 300w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-im-klo-final-150x150.jpg 150w\" sizes=\"(max-width: 512px) 100vw, 512px\" \/><\/p>\n<p>Na endlich! Jetzt sogar wieder &#8222;fotorealistisch&#8220;! Zwar w\u00fcrde die Katze noch immer nicht wirklich in die zu flache Klosch\u00fcssel passen, aber prinzipiell sieht es jetzt genauso aus, wie ich die Szene in Erinnerung habe. Tolle Leistung, wenn auch mit Anlaufproblemen.<\/p>\n<h2>FAZIT: Kostenlos floppt, Premium braucht Hartn\u00e4ckigkeit<\/h2>\n<p>Es wundert nicht, dass die neuen F\u00e4higkeiten in den kostenlosen Versionen nicht wirklich funktionieren. Vermutlich ist ja derzeit &#8222;die halbe Welt&#8220; dabei, das auszuprobieren. Aber auch in der Bezahlversion muss man dran bleiben, hartn\u00e4ckig sein, darf sich nicht mit ersten Verweigerungen abspeisen lassen &#8211; etwa wie bei einer unwilligen menschlichen Arbeitskraft, die erstmal sagt: Sorry, ich hab&#8216; gerade keine Zeit!<\/p>\n<p><strong>Update 1.3.:<\/strong><\/p>\n<p><a href=\"https:\/\/horstschulte.com\/\" target=\"_blank\" rel=\"noopener\">Horst Schulte<\/a> hat die Ergebnisse zweier weiterer KIs beigesteuert &#8211; unter Verwendung desselben englischen Prompts, jedoch ohne Nachbesserungen:<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-large wp-image-4670\" src=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/zweikatzenaufklo-650x481.jpg\" alt=\"2 Katzen auf dem Klo\" width=\"650\" height=\"481\" srcset=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/zweikatzenaufklo-650x481.jpg 650w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/zweikatzenaufklo-300x222.jpg 300w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/zweikatzenaufklo-768x569.jpg 768w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/zweikatzenaufklo.jpg 1024w\" sizes=\"(max-width: 650px) 100vw, 650px\" \/><\/p>\n<p>Rechts seht Ihr das Ergebnis von ChatGPT, links daneben die Version von Ideogram. Mir gef\u00e4llt die &#8222;gezeichnete&#8220; Optik von ChatGPT besser.<\/p>\n<p>Etwas verst\u00f6rend wirkt das Bild von Copilot, dass <a href=\"https:\/\/www.henning-uhle.eu\/\" target=\"_blank\" rel=\"noopener\">Henning Uhle<\/a> beigesteuert hat:<\/p>\n<p><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter size-full wp-image-4671\" src=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-auf-klo-seltsam.jpg\" alt=\"Katze auf Klo von Copilot\" width=\"650\" height=\"650\" srcset=\"https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-auf-klo-seltsam.jpg 650w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-auf-klo-seltsam-300x300.jpg 300w, https:\/\/www.claudia-klinger.de\/digidiary\/wp-content\/uploads\/2025\/03\/katze-auf-klo-seltsam-150x150.jpg 150w\" sizes=\"(max-width: 650px) 100vw, 650px\" \/><\/p>\n<p>Sie schafft es, ihren Schwanz durch die Sch\u00fcssel nach drau\u00dfen zu schieben! :-) Insgesamt ist es die schlechteste Version, da die Pfoten auf der Brille fehlen.<\/p>\n<p>***<\/p>\n<p>Hier der <a href=\"https:\/\/gemini.google.com\/share\/8a7fb4a131de\" target=\"_blank\" rel=\"noopener\">originale Chat mit Gemini 2.5 (experimental)<\/a> mit allen &#8222;Gedankeng\u00e4ngen&#8220;.<\/p>\n<p>Und sonst:<\/p>\n<ul>\n<li><a href=\"https:\/\/blog.google\/intl\/de-de\/produkte\/suchen-entdecken\/uebersicht-mit-ki-start\/\" target=\"_blank\" rel=\"noopener\">Google: \u00dcbersicht mit KI startet in Deutschland und weiteren L\u00e4ndern<\/a><\/li>\n<li><a href=\"https:\/\/gigold.me\/notes\/ki-bildchen-in-blogs-killen-meine-leselaune\" target=\"_blank\" rel=\"noopener\">Thomas Gigold: KI-Bildchen killen meine Leselaune<\/a> mit vielen Kommentaren. Dazu schreibt auch <a href=\"https:\/\/www.henning-uhle.eu\/informatik\/wordpress-und-bloggen\/blogger-vorgarten-die-unruehmliche-diskussion\" target=\"_blank\" rel=\"noopener\">Henning Uhle: Blogger-Vorgarten: Die unr\u00fchmliche Diskussion<\/a>.<\/li>\n<\/ul>","protected":false},"excerpt":{"rendered":"<p>Auf Youtube wurden die neuen F\u00e4higkeiten der KI-Modelle von OpenAI und Google vorgestellt: Endlich k\u00f6nnen sie direkt im &#8222;Gespr\u00e4ch&#8220; Bilder erstellen und diese auf Nachfrage ver\u00e4ndern und verbessern &#8211; ein Quantensprung! Man k\u00f6nne auch Bilder hochladen und diese &#8222;bearbeiten lassen&#8220;, hei\u00dft es &#8211; Fotoshop war gestern! Angeblich soll das alles auch in den kostenlosen Modellen [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[687],"tags":[685,675,1418,479,715,473],"post_mailing_queue_ids":[],"_links":{"self":[{"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/posts\/4665"}],"collection":[{"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/comments?post=4665"}],"version-history":[{"count":0,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/posts\/4665\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/media?parent=4665"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/categories?post=4665"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.claudia-klinger.de\/digidiary\/wp-json\/wp\/v2\/tags?post=4665"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}