Der Architekt gibt ab – wie ich gelernt habe, meinen KI-Agenten zu vertrauen
Die Geschichte: Es war ein Dienstagabend. Auf dem zweiten Monitor das Protokoll eines langen Kundentermins – NIS-2, Risikobewertung, die übliche Compliance-Litanei. Auf dem Hauptmonitor: ein halbfertiges Python-Script. Genau die Art Aufgabe, die man nach über dreißig Jahren Entwicklungserfahrung im Schlaf erledigt – und genau deshalb am meisten nervt. Weil man es kann, aber nicht mehr will.
Ich hatte Google Antigravity seit drei Tagen installiert. Bisher hatte ich es hauptsächlich beobachtet, so wie man einen neuen Mitarbeiter erst mal beobachtet, bevor man ihm etwas Wichtiges übergibt. Heute Abend gab ich ab.
„Ich kenne diese Situation"
Wer von der Anwendungsentwicklung und dem Datawarehouse kommt – jahrelang Applikationsarchitektur, ETL-Prozesse, Datenmodelle, komplexe Transformationslogik – der hat ein bestimmtes Verhältnis zu Code. Code ist kein Selbstzweck. Code ist das Werkzeug, das eine fachliche Idee in Realität überführt.
Das prägt, wie ich mit KI-Tools umgehe. GitHub Copilot? Nett, aber im Grunde ein sehr guter Autocomplete. Cursor? Besser – aber ich war noch immer derjenige, der jeden Schritt dirigierte. Es fühlte sich an wie ein sehr aufmerksamer Junior-Entwickler: Man erklärt alles zweimal, und am Ende überprüft man jeden Commit.
💬Antigravity ist anders. Und das merkt man nicht sofort, sondern erst dann, wenn man es zum ersten Mal wirklich loslässt.
Der erste echte Test
Ich öffne den Agent Manager – in Antigravity das eigentliche Herzstück, nicht der Editor. Wer das erste Mal damit konfrontiert wird, erwartet eine IDE. Stattdessen: eine Art Mission Control. Links die Inbox mit laufenden und abgeschlossenen Aufgaben, in der Mitte ein Eingabefeld, rechts der Workspace.
Ich schreibe:
Ich habe Wazuh-Alertdaten als JSON-Export. Erstelle ein Python-Script, das diese Daten einliest, nach Severity gruppiert, die Top-10-Regeln der letzten 7 Tage identifiziert und einen strukturierten HTML-Report ausgibt. Das Script soll als Cronjob laufen und fehlerresistent sein.
Kein Pseudocode. Keine technischen Vorgaben. Einfach das, was ich brauche – so wie ich es einem fähigen Kollegen beschreiben würde.
Was der Agent tut – und wie er es zeigt
Antigravity wechselt in den Planning-Modus. Der Agent erstellt zunächst ein Artifact – einen strukturierten Aufgabenplan, den ich lesen, kommentieren und freigeben kann, bevor auch nur eine Zeile Code geschrieben wird.
✓ 1. JSON-Struktur analysieren und Schema ableiten
✓ 2. Datenlade-Funktion mit Fehlerbehandlung
✓ 3. Filterlogik für 7-Tage-Fenster
✓ 4. Aggregation nach Severity + Top-10-Regeln
✓ 5. HTML-Template mit CSS (responsive, druckbar)
✓ 6. Cronjob-Kompatibilität (Logging, Exit-Codes)
✓ 7. Testlauf mit Beispieldaten
✓ 8. Ergebnis im Browser validieren
Ich nicke innerlich. Das ist genau, was ich gemeint habe – und ein Punkt mehr, den ich selbst vielleicht vergessen hätte (druckbares CSS, Punkt 5). Ich schreibe einen Kommentar direkt ins Artifact: „Report soll auch per E-Mail versendbar sein – SMTP-Config als Umgebungsvariable." Der Agent aktualisiert den Plan. Dann: Freigabe.
Mehrere Dinge gleichzeitig – der eigentliche Paradigmenwechsel
Während dieser Agent am Report-Script arbeitet, starte ich im gleichen Manager View eine zweite Aufgabe:
Im gleichen Projekt: Erstelle eine README.md mit Installationsanleitung, Konfigurationsoptionen und Beispielaufruf.
Zwei Agenten. Zwei parallele Workstreams. Ich schaue zu, wie die Inbox sich füllt – Status-Updates, Zwischenergebnisse, Genehmigungsanfragen.
💡Das vertrauteste KI-Gefühl, das ich je hatte. Für jemanden, der jahrelang Entwicklungsteams geführt hat: Es fühlt sich an wie das Delegieren an ein kleines Team – nicht wie das Bedienen eines Tools.
Der Browser-Agent: der Teil, der wirklich überrascht
Das Python-Script ist nach etwa vier Minuten fertig. Der Agent hat es im Terminal ausgeführt, Fehler eigenständig korrigiert (ein fehlender Import, eine falsche Datumsformatierung) und dann den generierten HTML-Report im integrierten Browser geöffnet.
Nicht nur geöffnet. Validiert.
Der Browser-Agent navigiert durch den Report, prüft ob alle Sections gerendert werden, ob die Tabellen korrekt befüllt sind, ob die Severity-Farben stimmen. Er macht einen Screenshot und hängt ihn als Artifact an. Ich sehe das Ergebnis, bevor ich den Editor überhaupt öffne.
🔑Das ist der entscheidende Moment. Nicht weil Antigravity schneller Code schreibt – sondern weil es den kompletten Entwicklungszyklus schließt: vom Requirement über Implementation und Test bis zur visuellen Verifikation. Ohne Kontextwechsel.
Was Antigravity unter der Haube macht
🏗️ Technische BasisStark modifizierter Fork von Visual Studio Code. Alle VS-Code-Extensions laufen weiter, Tastenkürzel bleiben vertraut.💻 PlattformenmacOS (Apple Silicon + Intel), Windows, Linux. Download ~150–200 MB. RAM: min. 8 GB, empf. 16 GB.🔤 Programmiersprachen. Alles was VS Code kennt: Python, JS/TS, Java, Go, Rust, C++, PHP, Kotlin, Swift und mehr.🔑 Voraussetzungen: Persönliches Google-Konto (Gmail). Workspace-Accounts für Unternehmen folgen. Aktuell: kostenlose Public Preview.
Wählbare KI-Modelle:
Gemini 3 ProKomplexes Reasoning, bis 1 Mio. Token KontextGemini 3 FlashSchneller, für Routine-TasksClaude Sonnet / Opus 4.5Stark in Analyse und strukturiertem DenkenGPT-OSSOpen-Source-Variante von OpenAI
Die Frage, die ich mir stellen musste
Was verändert das wirklich? Nicht: Was kann das Tool? Sondern: Was bedeutet das für die Art, wie wir arbeiten?
Meine Antwort nach einigen Wochen
Das Tool verändert, auf welcher Abstraktionsebene ein Entwickler arbeitet. Bisher: Zeile für Zeile, mit KI als intelligentem Autocomplete. Mit Antigravity: Feature für Feature, mit KI als autonomem Ausführenden.
Das ist keine quantitative Verbesserung. Das ist ein qualitativer Sprung – vergleichbar mit dem Übergang von manueller Programmierung zu Frameworks, von Server-Administration zu Cloud-Orchestrierung.
Wer das versteht, arbeitet anders. Wer darauf wartet, dass es sich „von selbst erklärt" – wartet zu lang.
Die strategische Frage: Wann lohnt es sich – und wann nicht?
✅Lohnt sich, wenn: die Aufgabe klar definiert ist, aber die Umsetzung repetitiv wäre. Wenn parallele Tasks möglich sind. Wenn Browser-Tests Teil des Workflows sind. Wenn Prototypen schnell validiert werden müssen.
⚠️Lohnt sich nicht, wenn: die Herausforderung die Problemdefinition ist, nicht die Implementierung. Wenn Architekturentscheidungen langfristige Konsequenzen haben. Wenn hochsensible Daten die Unternehmensgrenze nicht verlassen dürfen. Wenn das Team noch kein sauberes Requirements-Engineering betreibt – Autonomie verstärkt dann das Chaos.
Agentic Coding amplifies what's already there. Ein gut dokumentiertes Projekt wird erheblich schneller. Ein schlecht dokumentiertes Projekt wird schneller schlecht.
Wer als CIO oder IT-Leiter über den Einsatz nachdenkt, sollte zuerst drei Fragen stellen:
- Wie gut sind unsere Anforderungen formuliert?
- Wie sauber ist unsere Codebasis dokumentiert?
- Wie reif ist unser Review-Prozess?
Die Antworten bestimmen, ob agentic Development ein Beschleuniger oder ein Risiko wird.
30 Jahre Erfahrung – Antigravity oder Claude Code?
Jede Welle hatte ihren Hype – und jedes Mal hat sich gezeigt: Das beste Tool ist das, das zum eigenen Denkstil passt, nicht das mit den meisten Features. Kein Sieger, stattdessen eine Entscheidungsmatrix:
| Kriterium | Google Antigravity | Claude Code |
|---|---|---|
| Philosophie | Agent-first – KI führt aus, du orchestrierst | Developer-first – du führst, KI assistiert präzise |
| Interface | Visuell, GUI, Manager View | Terminal-first, kein neues UI |
| Parallele Agenten | ✓ Mehrere gleichzeitig | ✗ Sequenziell |
| Browser-Automatisierung | ✓ Integriert | ✗ Nicht vorhanden |
| Kontrolle & Sicherheit | Konfigurierbar (Review-Modus empfohlen) | Explizite Freigabe vor jeder Änderung |
| Code-Qualität (Rework) | Gemini 3 Pro – stark, noch wenig Langzeitdaten | ~30% weniger Rework als Cursor laut Analysen |
| Preis | Kostenlos (Public Preview) | Ab ~20 $/Monat (Pro) |
| Enterprise-Reife | Preview, Workspace-Accounts ausstehend | Etabliert, Microsoft-Teams nutzen es produktiv |
| Ideal für | Feature-Entwicklung, UI-Prototyping, Parallelaufgaben | Komplexe Architektur, Refactoring, Produktivumgebungen |
⚠️Sicherheitshinweis: Im Vollautonomie-Modus gab es frühe Berichte über unbeabsichtigt destruktive Terminalbefehle. Review-driven Development als Standard ist Pflicht. Claude Code verlangt explizite Freigabe vor Dateiänderungen – keine Schwäche, sondern bewusste Design-Entscheidung.
Die interessante Pointe: Antigravity unterstützt Claude-Modelle nativ – wer Claude Sonnet oder Opus 4.5 innerhalb von Antigravity wählt, kombiniert Googles Multi-Agenten-Architektur mit Anthropics Modellqualität. Der Haken: dafür braucht man einen Claude API-Key.
Und dann ist da noch n8n
Wer n8n als Automatisierungsrückgrat betreibt, hat einen dritten Spieler im Raum: Über das n8n-MCP-Protokoll kann Claude Code direkt n8n-Workflows generieren, validieren und deployen – mit Zugriff auf alle 1.200+ n8n-Nodes, ohne einen einzigen Node manuell zu konfigurieren. Antigravity hat ebenfalls eine n8n-MCP-Integration – aber Claude Code ist hier tiefer eingebettet. Das ist der Hebel, der beide Tools auf eine andere Ebene hebt: nicht als Coding-Assistent, sondern als Automatisierungs-Architekt.
Ein ehrliches Wort zum Schluss
Antigravity ist kein perfektes Tool. Rate Limits existieren. Workspace-Accounts für Unternehmen stehen noch aus.
⚠️Datenschutz-Hinweis: Code wird an Google-Server übertragen. Wer mit sensiblem IP oder Kundendaten arbeitet, sollte die Datenschutzrichtlinien prüfen – und im Zweifel sensible Passagen nicht per Agent bearbeiten lassen.
Aber: Es ist das erste KI-Entwicklungstool seit langer Zeit, das mich nicht dazu bringt, über das Tool nachzudenken – sondern über das Problem, das ich lösen will.
Und das, am Ende des Tages, ist die einzige Metrik, die zählt.
🚀Selbst ausprobieren antigravity.google – kostenlos, nur Google-Konto erforderlich, 8 GB RAM Minimum Herunterladen →
Gerd Kopp - gerd@gerds-it.de - Februar 2026