Cloudflare kündigt an: Project Think ist die nächste Generation der AI-Agenten-Plattform

Cloudflare hat heute Project Think vorgestellt – die nächste Generation der Agents SDK. Damit wird eine Plattform für AI-Agenten angekündigt, die über die klassischen Serverless-Funktionen hinausgeht: langlaufende, durable Ausführung, isolierte Sub-Agents und Sandboxed Code Execution sind die Kernbausteine.

Das Problem: Ephemere Agenten

Die aktuellen AI-Agenten laufen meist nur so lange, wie eine Session aktiv ist – und verschwinden danach. Das ist laut Cloudflare ein fundamentales Problem:

„Ein Coding-Agent, der stirbt, wenn dein Laptop in den Schlafmodus geht, ist ein Tool. Ein Agent, der persistiert – der bei Bedarf aufwacht, nach Unterbrechungen weiterarbeitet und den Zustand ohne lokale Laufzeit trägt – das beginnt wie Infrastruktur auszusehen.“

Die Kernbausteine von Project Think

Project Think liefert mehrere neue Primitiven für die Agents SDK:

Durable Execution mit Fibers: Crash-Recovery, Checkpointing, automatisches Keepalive für langlaufende Aufgaben
Sub-Agents: Isolierte Kind-Agenten mit eigenem SQLite und typisiertem RPC
Persistent Sessions: Baumstrukturierte Nachrichten, Forking, Kompaktion, Full-Text-Suche
Sandboxed Code Execution: Dynamic Workers, Codemode, Runtime-NPM-Resolution
Execution Ladder: Workspace, Isolate, NPM, Browser, Sandbox

Durable Execution

Ein einzelner Agent-Loop kann Minuten oder Stunden dauern. Wenn währenddessen das Ausführungsumfeld verschwindet (Deploy, Restart, Ressourcenlimits), geht der Zustand verloren. Fibers lösen das: Jede Ausführung wird vor dem Start in SQLite registriert und kann jederzeit über ctx.stash() gecheckpointet werden. Bei einem Restart wird der letzte Stand automatisch wiederhergestellt.

Ein Agent sollte nicht alles selbst tun. Sub-Agents sind als eigenständige Durable Objects realisiert, die über Facets mit dem Eltern-Agenten colokalisiert sind. Jeder Sub-Agent hat sein eigenes isoliertes SQLite und kann über typisierte RPCs angesprochen werden – kompilierungsseitig abgesichert.

Persistente Sessions

Die neue Session-API speichert Konversationen als Baumstruktur mit parent_id pro Nachricht. Das ermöglicht:

Forking: Alternative Ansätze erkunden, ohne den Originalpfad zu verlieren
Nicht-destruktive Kompaktion: Ältere Nachrichten zusammenfassen statt löschen
Full-Text-Suche über die gesamte Konversationshistorie

Sandboxed Code Execution und Execution Ladder

Statt einzelner Tool-Calls generiert der LLM ein komplettes Programm, das in einer isolierten Dynamic Worker ausgeführt wird. Laut Cloudflare-Quote wird dabei die Token-Nutzung im Vergleich zu sequenziellen Tool-Calls drastisch reduziert (z.B. von 1,17 Millionen Tokens auf rund 1.000). Die Execution Ladder definiert dabei aufsteigend mehr Fähigkeiten:

Tier	Umgebung	Fähigkeiten
0	Workspace	Virtuelles Dateisystem (SQLite + R2)
1	Dynamic Worker	JS-Code in isoliertem Sandbox, kein Netzwerk
2	Mit NPM	Automatische Paket-Resolution via Worker-Bundler
3	Headless Browser	Navigation, Klicks, Screenshots
4	Vollständiger Sandbox	OS-Zugriff mit git, compilers, etc.

Skalierung und Wirtschaftlichkeit

Das Skalierungsmodell von Cloudflare verschiebt die Kostenstruktur grundlegend:

Kosten im Leerlauf: Zero bei hibernierten Durable Objects
Scaling: Automatisch, pro Agent
State: Eingebautes SQLite statt externer Datenbank

Statt einer teuren Always-On-Instanz pro Nutzer können Agenten nur dann berechnet werden, wenn sie tatsächlich arbeiten. Cloudflare nennt als Beispiel: Für 10.000 Agenten, die jeweils nur einen kleinen Teil der Zeit aktiv sind, fallen nur Kosten für die tatsächlich ausgeführten an, während der Rest hiberniert.

Praxisbeispiel: Multi-Agent Research

Ein Beispiel aus dem Blogpost zeigt, wie Sub-Agents zusammenarbeiten:

export class Orchestrator extends Agent {
  async handleTask(task: string) {
    const researcher = await this.subAgent(ResearchAgent, "research");
    const reviewer = await this.subAgent(ReviewAgent, "review");

    const [research, review] = await Promise.all([
      researcher.search(task),
      reviewer.analyze(task)
    ]);

    return this.synthesize(research, review);
  }
}

Jeder Sub-Agent hat seine eigene isolierte Datenbank und Ausführungsumgebung, bleibt aber über RPC eng mit dem Orchestrierungs-Agenten verbunden.

Einordnung und Bedeutung

Project Think versucht, die Infrastruktur-Lücke zu schließen, die durch die Popularität von Coding-Agents wie Claude Code, OpenClaw und Codex entstanden ist. Diese Tools beweisen, dass Code das universelle Medium für Aktionen ist – aber sie laufen meist auf dem Laptop oder in teuren VPS-Umgebungen.

Cloudflare bietet mit Durable Objects bereits seit Jahren eine Plattform für langlaufende Zustände. Project Think baut darauf auf und richtet sich explizit an Agenten-Architekturen, wo jede Aufgabe einen eigenen Agenten erfordert. Die Plattform ändert die Kostenrechnung grundlegend: Statt “einer Container-Instanz pro Agent” gilt nun “Zero-Cost im Leerlauf, bezahlt nur bei Aktivität”. Für Entwickler bedeutet das, dass langlaufende Multi-Agent-Systeme wirtschaftlich betrieben werden können.

Cloudflare kündigt an: Project Think ist die nächste Generation der AI-Agenten-Plattform

Das Problem: Ephemere Agenten

Die Kernbausteine von Project Think

Durable Execution

Sub-Agents und Facets

Persistente Sessions

Sandboxed Code Execution und Execution Ladder

Skalierung und Wirtschaftlichkeit

Praxisbeispiel: Multi-Agent Research

Einordnung und Bedeutung

Quellenangaben

Quellen

Das könnte dich auch interessieren

Nexu – Open-Source-Desktop-Client für OpenClaw mit One-Click-Messaging-Integrationen

ClawTeam: OpenClaw‑Swarm für Multi‑Agent‑Koordination

OpenClaw Dashboard Guide: Monitoring, Kosten-Tracking und Agenten-Sichtbarkeit