ComfyUI ist ein Werkzeug für die KI-gestützte Bildgenerierung, das nicht auf einer einzelnen Eingabemaske basiert, sondern auf klar definierten Abläufen.

Diese Abläufe in ComfyUI werden Workflows genannt. Für Architektur- und Planungsbüros liegt der Mehrwert des Tools weniger im freien Experimentieren als in der Möglichkeit, Bilder reproduzierbar zu erzeugen, Varianten systematisch zu vergleichen sowie dazu, Ergebnisse im Team weiterzuverwenden.

Und: Templates (also vorgefertigte, anpassbare Workflows) spielen dabei eine zentrale Rolle. Sie bilden typische Prozesse zur Bildgenerierung bereits ab. Sie sehen kompliziert aus, sind aber sofort einsatzbereit und senken die Einstiegshürde deutlich.

Workflow, Template, Custom Nodes – was braucht man wofür?

Ein Workflow ist in ComfyUI eine festgelegte Abfolge von Arbeitsschritten oder Funktionsbausteinen. Jeder Schritt übernimmt eine klar definierte Aufgabe. Zusammen bilden sie einen nachvollziehbaren Prozess vom Ausgangsbild bis zum Ergebnis.

Ein Template ist ein vorbereiteter Workflow auf verschiedenen Funktionsbausteinen (den sog. Nodes, englisch für „Knoten“). Es dient als Startpunkt und enthält bereits bewährte Abläufe, etwa für Bildgenerierung, Struktur-Erhalt oder Detailverbesserung.

Custom Nodes sind zusätzliche Funktionsbausteine von Drittanbietern. Sie erweitern die Möglichkeiten, erhöhen aber auch die Komplexität. Offizielle Templates kommen in der Regel ohne solche Zusatzmodule aus.

Software, Cloud und der Unterschied zu Browser-Diensten

Wenn von ComfyUI die Rede ist, ist damit ursprünglich eine herunterladbare Software gemeint.

Diese klassische Variante bildet bis heute die technische Grundlage. Inzwischen existieren jedoch zwei Betriebsarten, die demselben Prinzip folgen.

1. Das klassische ComfyUI

Diese Form steht im Mittelpunkt dieses Beitrags.

ComfyUI wird als Software auf der eigenen Hardware installiert.

Der Betrieb erfolgt lokal auf dem eigenen Rechner oder auf einem eigenen (virtuellen) Server.

Workflows sind vollständig einsehbar, speicherbar und versionierbar.

Bildmodelle werden lokal vorgehalten oder gezielt via API angebunden, siehe unten.

Diese Variante bietet maximale Kontrolle und Transparenz. Sie eignet sich besonders für Büros, die reproduzierbare Abläufe benötigen.

Die Desktop-Software selbst ist kostenfrei nutzbar.

Lädt man sich dazu KI-Bildmodelle auf die eigene Hardware herunter, die unter Open Source- oder ähnlichen Lizenzen verfügbar sind, fallen (außer den Kosten für den Betrieb der eigenen Rechner oder Server) ebenfalls keine Kosten an.

Wichtig: Bei lokal ausgeführter KI-Bildgenerierung hängt die Leistungsfähigkeit stark von der eigenen Hardware ab. Entscheidend sind vor allem eine leistungsfähige Grafikkarte (GPU), ausreichend Grafikspeicher sowie genügend Arbeitsspeicher. Ohne entsprechende Ausstattung verlängern sich Rechenzeiten spürbar, komplexe Workflows oder hohe Bildauflösungen werden schnell zur Geduldsprobe.

Viele Architekturbüros nutzen deshalb lokale Berechnungen vor allem für Tests, kleinere Varianten oder aus Gründen der Datenhoheit.

Deutlich schneller als auf lokaler Hardware arbeiten in der Regel Bildmodelle, die über eine API (Programmier-Schnittstelle) auf den Servern der Anbieter ausgeführt werden.

Dort steht spezialisierte Hochleistungs-Hardware zur Verfügung, sodass auch aufwendige Berechnungen in kurzer Zeit Ergebnisse liefern – unabhängig davon, wie leistungsfähig der eigene Rechner ist.

Die Rechenleistung für die KI-Bildgenerierung lassen sich die Anbieter der Modelle bezahlen. Das ist nicht ganz billig (ganz grob kalkuliert ca. 0,10 bis 0,30 EUR pro Bild), lässt sich aber z. B. über die Bezahlfunktion von ComfyUI relativ bequem einrichten und überblicken.

2. (Relativ) neu: ComfyUI in der Cloud

Parallel dazu gibt es seit Kurzem ein Cloud-Angebot, bei dem ComfyUI ohne lokale Installation genutzt wird.

Rechenleistung wird extern bereitgestellt.

Einrichtung und Wartung entfallen weitgehend.

Workflows funktionieren grundsätzlich identisch zur lokalen Version.

Der entscheidende Unterschied liegt nicht im Bedienkonzept, sondern im Ort der Ausführung.

Und da „Comfy Cloud“ grundsätzlich Rechenleistung über die Cloud bereitstellt, muss diese natürlich bezahlt werden. Die Abonnements kosten ca. 20 US$ oder mehr pro Monat (Stand: Dezember 2025).

Gemeinsames Prinzip

Unabhängig davon, ob lokal oder in der Cloud gilt:

ComfyUI selbst ist keine KI, sondern eine Arbeitsoberfläche.

Die Software steuert KI-Bildmodelle. (Darüber hinaus können auch Videos oder einfache 3D-Modelle erstellt werden.)

Workflows definieren in ComfyUI, wie Bilder entstehen.

Die KI-Bildmodelle definieren, womit die Bilder berechnet werden.

Abgrenzung zu Browser-Diensten Browser-basierte KI-Dienste wie Midjourney oder OpenAIs GPT Image 1.5 arbeiten mit festen, vorgegebenen Abläufen. Zwischenschritte bleiben unsichtbar, Ergebnisse sind schwer reproduzierbar. ComfyUI verfolgt einen anderen Ansatz. Auf einer Arbeitsfläche, dem sog. Canvas, können beliebige Arbeitsschritte miteinander kombiniert werden. Der Prozess ist transparent, kontrollierbar und wiederholbar.

Wo man Templates und fertige Workflows für ComfyUI findet

Eigene Workflows in ComfyUI zu entwickeln, ist schwer.

Besonders am Anfang wirkt die Canvas-Oberfläche mit den vielen Nodes eher unübersichtlich. Auch die diversen Einstellungsmöglichkeiten der Funktionsbausteine sind nicht unbedingt selbsterklärend.

Doch es gibt eine einfache Lösung, ohne Frust zu den ersten brauchbaren Ergebnissen in ComfyUI zu kommen:

Der integrierte Template-Browser

ComfyUI bietet eine eigene Template-Bibliothek direkt in der Oberfläche der Software. Für Einsteiger:innen ist das der sinnvollste Startpunkt und bietet viele Vorteile:

kein aufwändiges Nachbauen von Workflows erforderlich

kontrollierter Einstieg, weniger Abhängigkeiten

Modelle werden beim Laden geprüft – fehlende Bildmodelle können dann per Klick bequem heruntergeladen werden.

Community-Plattformen

Plattformen wie OpenArt oder CivitAI bieten eine große Auswahl an spezialisierten Workflows für ComfyUI. Der Einrichtungsaufwand ist höher, da häufig Zusatzmodule erforderlich sind. Für gezielte Aufgaben sinnvoll, nicht als erster Einstieg.

CivitAI gilt als vergleichsweise architektur-affin, da dort überdurchschnittlich viele Workflows, Modelle und Beispielbilder aus den Bereichen Architekturvisualisierung und Interior Design geteilt werden – häufig mit Fokus auf realistische Materialien, Lichtstimmungen und perspektivische Kontrolle.

Zusammengefasst:

ComfyUI ist kein schneller Ersatz für Browser-Dienste zur KI-Bildgenerierung, sondern ein Werkzeug für strukturierte und kontrollierte Bildproduktion. Aber: Templates erleichtern den Einstieg und helfen, typische Abläufe zu verstehen.

Für Architektur- und Planungsbüros liegt der Mehrwert dort, wo Varianten nachvollziehbar entstehen und Ergebnisse reproduzierbar bleiben.

