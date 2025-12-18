OpenAI hat Mitte Dezember 2025 mit GPT Image 1.5 ein neues KI-Bildmodell vorgestellt.

Es ersetzt in ChatGPT faktisch das bisherige GPT Image 1 (seit März 2025 in GPT-4o verfügbar) und liefert deutlich bessere Ergebnisse.

Nach Angaben des Unternehmens liegt der Fokus auf präziserer Bildbearbeitung, höherer Geschwindigkeit und stabilerer Textdarstellung in Bildern – insbesondere bei iterativen Arbeitsprozessen.

Einordnung: Was kann der neue KI-Bildgenerator in ChatGPT?

Die Bildgenerierung hat sich in ChatGPT von einer Nebenfunktion zu einem eigenständigen Arbeitsbereich entwickelt.

Mit GPT Image 1.5 geht OpenAI bekannte Schwächen früherer Modelle an: ungenaue Teiländerungen, instabile Beschriftungen (besonders bei nicht-englischsprachigen Texten gab es in Image 1 immer wieder „Vertipper“) und langsame Reaktionszeiten bei Korrekturen.

Das Ergebnis ist ein Werkzeug, das weniger auf spektakuläre Einzelbilder setzt, sondern auf kontrollierte Anpassungen im laufenden Arbeitsprozess.

Gerade in Planungsbüros spielt diese Form der Bildbearbeitung eine Rolle, etwa bei Abstimmungen, internen Reviews oder in der Kommunikation mit Fachplanenden.

Was genau ist „GPT Image 1.5“?

GPT Image 1.5 ist das neue Flaggschiff-Bildmodell von OpenAI. Der API-Name lautet gpt-image-1.5 (den braucht man aber nur, wenn man das Tool aus eigenen Skripten oder Anwendungen heraus anspricht).

Die meisten Nutzer:innen gehen einfach auf ChatGPT, klicken über das „Plus“-Icon vor dem Prompt-Eingabefeld die Bildgenerierung an und los geht’s!

Eingaben können Text-Prompts, Bilder oder Kombinationen aus beidem sein – so wie ihn meinem Büro-Beispiel auf dieser Seite. Ausgegeben werden hochauflösende Bilder, die direkt aus ChatGPT oder über die API erzeugt und bearbeitet werden.

In ChatGPT ersetzt das Modell praktisch das bisherige Bildmodell und ist vollständig in die neue Oberfläche „ChatGPT Images“ (in 🇩🇪: „Bilder“, in der linken Seitenleiste) integriert.

Höhere Geschwindigkeit bei der KI-Bildbearbeitung

OpenAI gibt an, dass GPT Image 1.5 Bilder bis zu viermal schneller erzeugt als das Vorgängermodell.

Besonders bei Bearbeitungsschritten und Varianten soll sich das bemerkbar machen – etwa wenn mehrere Bildfassungen kurzfristig für eine Besprechung vorbereitet werden müssen.

Präzisere Anweisungsbefolgung bei Edits

Ein Schwerpunkt des KI-Tools liegt auf gezielten Änderungen bestehender Bilder. GPT Image 1.5 soll Anweisungen wie das Verändern von Lichtstimmungen, Farben oder Materialien präziser umsetzen, ohne das gesamte Bild neu zu interpretieren.

Für Planungsbüros ist das insbesondere bei Umbau- und Sanierungsszenarien relevant. Ein Beispiel: Bestandsfotos lassen sich leicht anpassen, etwa durch den Austausch von Fassadenmaterialien, Fenstern oder Verschattungselementen, während Gebäudestruktur und Perspektive erhalten bleiben.

Masken und lokale Bearbeitung

Das Modell unterstützt feinere Masken-Bearbeitung. Einzelne Bildbereiche lassen sich markieren und gezielt verändern, während andere Bereiche unverändert bleiben. Objekte können lokal ergänzt oder entfernt, Stile partiell angepasst werden.

Diese Funktion eignet sich unter anderem für die visuelle Abstimmung mit Fachplanenden. Technische Änderungen oder Konfliktpunkte lassen sich direkt im Bild darstellen, ohne neue Visualisierungen vollständig neu aufzubauen.

Atmosphärische Szenen in frühen Entwurfsphasen

GPT Image 1.5 lässt sich auch für die Entwicklung und Variation atmosphärischer Szenen einsetzen. Aus Skizzen oder einfachen Renderings entstehen konsistente Stimmungsbilder, die Raumwirkung, Maßstäblichkeit oder Nutzung illustrieren.

Solche Bilder ersetzen keine Entwurfsarbeit, unterstützen aber Diskussionen in frühen Phasen – etwa bei internen Entwurfsrunden oder in Gesprächen mit Auftraggebern.

Textbasierte Bildkorrekturen im laufenden Prozess

Ein praktischer Aspekt ist die verbesserte Umsetzung kurzer textlicher Anweisungen. Änderungen wie „mehr Tageslicht“, „ruhiger Hintergrund“ oder „kältere Lichtfarbe“ lassen sich schneller und konsistenter umsetzen als bei früheren Versionen.

Das beschleunigt Abstimmungen, wenn Bilder direkt im Gespräch angepasst werden sollen, ohne längere Render- oder Bearbeitungszyklen.

Deutlich bessere Texte im Bild

Ein weiterer Schwerpunkt liegt auf der Darstellung von Schrift. Beschriftungen auf Plänen, Diagrammen, Schildern oder Präsentationsgrafiken sollen laut Anbieter stabiler, lesbarer und konsistenter gerendert werden.

Für Planungsbüros ist das vor allem bei der Erstellung beschrifteter Grafiken relevant, etwa für Präsentationen, Wettbewerbsbeiträge oder die eigene Website, bei denen Bild und Text zuverlässig zusammenspielen müssen.

