Cloudflare kündigt an: Project Think ist die nächste Generation der AI-Agenten-Plattform
Cloudflare stellt Project Think vor: Eine neue Agents SDK mit Durable Execution, Sub-Agents und Sandboxed Code Execution für langlaufende KI-Agenten.
Cloudflare hat heute Project Think vorgestellt – die nächste Generation der Agents SDK. Damit wird eine Plattform für AI-Agenten angekündigt, die über die klassischen Serverless-Funktionen hinausgeht: langlaufende, durable Ausführung, isolierte Sub-Agents und Sandboxed Code Execution sind die Kernbausteine.
Das Problem: Ephemere Agenten
Die aktuellen AI-Agenten laufen meist nur so lange, wie eine Session aktiv ist – und verschwinden danach. Das ist laut Cloudflare ein fundamentales Problem:
„Ein Coding-Agent, der stirbt, wenn dein Laptop in den Schlafmodus geht, ist ein Tool. Ein Agent, der persistiert – der bei Bedarf aufwacht, nach Unterbrechungen weiterarbeitet und den Zustand ohne lokale Laufzeit trägt – das beginnt wie Infrastruktur auszusehen.“
Die Kernbausteine von Project Think
Project Think liefert mehrere neue Primitiven für die Agents SDK:
- Durable Execution mit Fibers: Crash-Recovery, Checkpointing, automatisches Keepalive für langlaufende Aufgaben
- Sub-Agents: Isolierte Kind-Agenten mit eigenem SQLite und typisiertem RPC
- Persistent Sessions: Baumstrukturierte Nachrichten, Forking, Kompaktion, Full-Text-Suche
- Sandboxed Code Execution: Dynamic Workers, Codemode, Runtime-NPM-Resolution
- Execution Ladder: Workspace, Isolate, NPM, Browser, Sandbox
Durable Execution
Ein einzelner Agent-Loop kann Minuten oder Stunden dauern. Wenn währenddessen das Ausführungsumfeld verschwindet (Deploy, Restart, Ressourcenlimits), geht der Zustand verloren. Fibers lösen das: Jede Ausführung wird vor dem Start in SQLite registriert und kann jederzeit über ctx.stash() gecheckpointet werden. Bei einem Restart wird der letzte Stand automatisch wiederhergestellt.
Sub-Agents und Facets
Ein Agent sollte nicht alles selbst tun. Sub-Agents sind als eigenständige Durable Objects realisiert, die über Facets mit dem Eltern-Agenten colokalisiert sind. Jeder Sub-Agent hat sein eigenes isoliertes SQLite und kann über typisierte RPCs angesprochen werden – kompilierungsseitig abgesichert.
Persistente Sessions
Die neue Session-API speichert Konversationen als Baumstruktur mit parent_id pro Nachricht. Das ermöglicht:
- Forking: Alternative Ansätze erkunden, ohne den Originalpfad zu verlieren
- Nicht-destruktive Kompaktion: Ältere Nachrichten zusammenfassen statt löschen
- Full-Text-Suche über die gesamte Konversationshistorie
Sandboxed Code Execution und Execution Ladder
Statt einzelner Tool-Calls generiert der LLM ein komplettes Programm, das in einer isolierten Dynamic Worker ausgeführt wird. Laut Cloudflare-Quote wird dabei die Token-Nutzung im Vergleich zu sequenziellen Tool-Calls drastisch reduziert (z.B. von 1,17 Millionen Tokens auf rund 1.000). Die Execution Ladder definiert dabei aufsteigend mehr Fähigkeiten:
| Tier | Umgebung | Fähigkeiten |
|---|---|---|
| 0 | Workspace | Virtuelles Dateisystem (SQLite + R2) |
| 1 | Dynamic Worker | JS-Code in isoliertem Sandbox, kein Netzwerk |
| 2 | Mit NPM | Automatische Paket-Resolution via Worker-Bundler |
| 3 | Headless Browser | Navigation, Klicks, Screenshots |
| 4 | Vollständiger Sandbox | OS-Zugriff mit git, compilers, etc. |
Skalierung und Wirtschaftlichkeit
Das Skalierungsmodell von Cloudflare verschiebt die Kostenstruktur grundlegend:
- Kosten im Leerlauf: Zero bei hibernierten Durable Objects
- Scaling: Automatisch, pro Agent
- State: Eingebautes SQLite statt externer Datenbank
Statt einer teuren Always-On-Instanz pro Nutzer können Agenten nur dann berechnet werden, wenn sie tatsächlich arbeiten. Cloudflare nennt als Beispiel: Für 10.000 Agenten, die jeweils nur einen kleinen Teil der Zeit aktiv sind, fallen nur Kosten für die tatsächlich ausgeführten an, während der Rest hiberniert.
Praxisbeispiel: Multi-Agent Research
Ein Beispiel aus dem Blogpost zeigt, wie Sub-Agents zusammenarbeiten:
export class Orchestrator extends Agent {
async handleTask(task: string) {
const researcher = await this.subAgent(ResearchAgent, "research");
const reviewer = await this.subAgent(ReviewAgent, "review");
const [research, review] = await Promise.all([
researcher.search(task),
reviewer.analyze(task)
]);
return this.synthesize(research, review);
}
}
Jeder Sub-Agent hat seine eigene isolierte Datenbank und Ausführungsumgebung, bleibt aber über RPC eng mit dem Orchestrierungs-Agenten verbunden.
Einordnung und Bedeutung
Project Think versucht, die Infrastruktur-Lücke zu schließen, die durch die Popularität von Coding-Agents wie Claude Code, OpenClaw und Codex entstanden ist. Diese Tools beweisen, dass Code das universelle Medium für Aktionen ist – aber sie laufen meist auf dem Laptop oder in teuren VPS-Umgebungen.
Cloudflare bietet mit Durable Objects bereits seit Jahren eine Plattform für langlaufende Zustände. Project Think baut darauf auf und richtet sich explizit an Agenten-Architekturen, wo jede Aufgabe einen eigenen Agenten erfordert. Die Plattform ändert die Kostenrechnung grundlegend: Statt “einer Container-Instanz pro Agent” gilt nun “Zero-Cost im Leerlauf, bezahlt nur bei Aktivität”. Für Entwickler bedeutet das, dass langlaufende Multi-Agent-Systeme wirtschaftlich betrieben werden können.
Quellenangaben
Quellen
Das könnte dich auch interessieren
Nexu – Open-Source-Desktop-Client für OpenClaw mit One-Click-Messaging-Integrationen
Nexu ist ein kostenloser Desktop-Client, der OpenClaw-Agenten per Klick mit WeChat, Feishu, Slack und Discord verbindet – ohne komplexe Konfiguration.
ClawTeam: OpenClaw‑Swarm für Multi‑Agent‑Koordination
Fork von ClawTeam mit OpenClaw-Integration – Multi-Agent-Swarms mit Session-Isolation, automatischer Exec-Approval-Konfiguration.
OpenClaw Dashboard Guide: Monitoring, Kosten-Tracking und Agenten-Sichtbarkeit
Dashboard-Lösungen für OpenClaw-Operatoren: Token-Verbrauch, API-Kosten und Agenten-Aktivitäten tracken mit ClawGuard, ClawControl und OpenClaw.watch.