Mit dem sogenannten Agentenmodus hat OpenAI die Funktionsweise von ChatGPT deutlich erweitert. Die neue Version auf Basis von GPT-4o kann nicht nur Texte generieren, sondern auch externe Websites durchsuchen, Dateien analysieren und eigenständig Aufgaben übernehmen.

Für Architekturbüros ergeben sich daraus vielfältige Anwendungsmöglichkeiten – etwa bei der Recherche von Bauprodukten, der Überwachung von Ausschreibungs­datenbanken oder der Auswertung technischer Dokumente.

Der Agentenmodus: Mehr als nur Text-Chat

Während ChatGPT bislang vor allem zur Beantwortung von Fragen oder zur Texterstellung genutzt wurde, ermöglicht der neue Agentenmodus deutlich erweiterte Funktionen.

Nutzer:innen mit Zugang zu GPT-4o und aktivierten Tools können die KI gezielt für Recherche- und Analyseaufgaben einsetzen – etwa beim Durchsuchen von Websites wie ted.europa.eu oder den Architektenkammern der Bundesländer. Auch das Lesen und Interpretieren von PDF-Dateien, Tabellen oder technischen Datenblättern ist möglich.

Beispielanwendungen für den Büroalltag

In der Praxis lässt sich der Agentenmodus in unterschiedlichen Bereichen einsetzen. Dazu zählen unter anderem:

die tägliche Recherche von Ausschreibungen im Hochbau oder der Stadtplanung,

im Hochbau oder der Stadtplanung, die Zusammenstellung technischer Kennwerte von Bauprodukten ,

, die automatisierte Auflistung von Fortbildungsveranstaltungen bei Kammern und Fachinstitutionen

bei Kammern und Fachinstitutionen sowie die strukturierte Auswertung von Gesetzestexten, Verordnungen oder Förderprogrammen.

Je nach Fragestellung erstellt der KI-Assistent übersichtliche Tabellen, Textzusammenfassungen oder exportierbare Dateien im gewünschten Format.

Prompt-Beispiel zur Suche nach Förderprogrammen bei Bafa und KfW

Suche auf https://www.kfw.de und https://www.bafa.de nach aktuellen Förderprogrammen für Neubauten, Sanierungen oder klimaneutrale Baustandards im Nichtwohnungsbau. Gib Name, Zielgruppe, Förderhöhe und Link an.

Wichtig: Wenn Sie den Agentenmodus nutzen möchten, müssen Sie unten links im Prompt-Fenster bei den Funktionen den Punkt „Agentenmodus“ auswählen – siehe blaue Angabe im Screenshot oben.

Dann geht es los. Der Chatbot öffnet in einem virtuellen System ein eigenes Browser-Fenster und bearbeitet seine Aufgabe. Die einzelnen „Arbeitsschritte“ werden über eine Art Sprechblase laufend beschrieben, siehe Screenshot unten.

Das selbstbestimmte Vorgehen unterscheidet den „Agenten“ vom normalen Chatbot

Der Agent legt sich eine Umsetzungsstrategie für seine Mission zurecht, eröffnet Browser-Tabs und klickt Cookie-Banner weg, er nutzt eigenständig Suchformulare auf den von ihm besuchten Websites.

Diese „selbstbestimmte“ Vorgehensweise unterscheidet übrigens den „Agenten“ von normalen Chatbot – und sie geht auch noch weiter als die seit Anfang 2025 verfügbaren Deep Reserach-Methode vieler Chatbots.

Nach einigen Minuten selbständiger Tätigkeit des Agenten gibt ChatGPT das Ergebnis aus: Ein umfangreicher Report bestehend aus einer vierspaltigen Tabelle (im Screenshot unten angeschnitten, die Tabelle kann nach rechts gescrollt werden), dazu einige Hinweise unterhalb der Tabelle.

Was taugt das Ergebnis der „Agenten-Tätigkeit“ in unserem Beispiel?

Ich habe den erstellten Report nicht im Detail überprüft. Und natürlich gilt auch hier, wie immer bei der Arbeit mit KI: Ein Chatbot leistet eine Zuarbeit, die stets fachkundig überprüft und ggf. korrigiert und überarbeitet werden muss.

Aber auf den ersten Blick sieht das sehr vernünftig aus. Wenn Sie selbst mal schauen möchten: Hier der Link zu dem von mir veröffentlichte Ergebnis des obigen Agenten-Recherche-Beispiels auf chatgpt.com.

Was denken Sie? Ich bin gespannt auf Ihr Urteil zum neuen Agentenmodus von ChatGPT. Kommentieren Sie gerne unter diesem Artikel, auf LinkedIn oder Instagram.

Zugang, Voraussetzungen und Unterschiede zur Standardversion

Der Agentenmodus steht ausschließlich in der kostenpflichtigen Version ChatGPT Plus zur Verfügung. Mit einem aktiven Abonnement (20 US$ pro Monat) erhalten Sie u. a. Zugriff auf GPT-4o mit verschiedenen Tools, erkennbar an Symbolen wie „Browser“, „Dateien“ oder „Deep Research“.

Erst diese Werkzeuge ohne Limitierungen ermöglichen es dem Sprachmodell, externe Quellen zu durchsuchen und Aufgaben eigenständig zu bearbeiten – ein klarer Mehrwert gegenüber der kostenlosen Basisversion.

Hinweis für Einsteiger:innen Die kostenlose Version von ChatGPT basiert auf GPT-3.5 oder GPT-4o-mini und erlaubt vor allem einfache Textdialoge. Websuche und Dateianalyse sind nur eingeschränkt verfügbar.

Für den Agentenmodus benötigen Sie ein ChatGPT-Plus-Abo und die Auswahl von GPT-4o im oberen Bereich des Chatfensters. Nur in dieser Konfiguration stehen Ihnen Funktionen wie Websuche und Dateianalyse in vollem Umfang (ohne Limitierungen) und eben seit ca. Mitte Juli 2025 der Agentenmodus zur Verfügung. Übrigens: Wenn Sie sich für grundlegende Arbeitsweisen und das Zusammenspiel von Sprachmodell, Chatbot, Prompts etc. interessieren, empfehle ich Ihnen meinen KI-Grundlagen-Artikel hier im Magazin.

Fazit: Effizientere Prozesse durch KI im Planungsbüro

Der neue Agentenmodus von ChatGPT bietet Architektur- und Ingenieurbüros eine praxisnahe Möglichkeit, wiederkehrende Aufgaben zu automatisieren und Informationen gezielter zu recherchieren.

Durch die Kombination aus Textverständnis, Webzugriff und strukturierter Ausgabe können sowohl interne Abläufe als auch Kundenprojekte effizient unterstützt werden. Wer bereits mit ChatGPT arbeitet, sollte die erweiterten Funktionen von GPT-4o mit Agentenmodus unbedingt testen – der Produktivitätsgewinn ist spürbar.

