Zum Inhalt springen
spotlight · 4 min Lesezeit

Cloudflare kündigt an: Project Think ist die nächste Generation der AI-Agenten-Plattform

Cloudflare stellt Project Think vor: Eine neue Agents SDK mit Durable Execution, Sub-Agents und Sandboxed Code Execution für langlaufende KI-Agenten.

cloudflare agents infrastructure serverless

Cloudflare hat heute Project Think vorgestellt – die nächste Generation der Agents SDK. Damit wird eine Plattform für AI-Agenten angekündigt, die über die klassischen Serverless-Funktionen hinausgeht: langlaufende, durable Ausführung, isolierte Sub-Agents und Sandboxed Code Execution sind die Kernbausteine.

Das Problem: Ephemere Agenten

Die aktuellen AI-Agenten laufen meist nur so lange, wie eine Session aktiv ist – und verschwinden danach. Das ist laut Cloudflare ein fundamentales Problem:

„Ein Coding-Agent, der stirbt, wenn dein Laptop in den Schlafmodus geht, ist ein Tool. Ein Agent, der persistiert – der bei Bedarf aufwacht, nach Unterbrechungen weiterarbeitet und den Zustand ohne lokale Laufzeit trägt – das beginnt wie Infrastruktur auszusehen.“

Die Kernbausteine von Project Think

Project Think liefert mehrere neue Primitiven für die Agents SDK:

  • Durable Execution mit Fibers: Crash-Recovery, Checkpointing, automatisches Keepalive für langlaufende Aufgaben
  • Sub-Agents: Isolierte Kind-Agenten mit eigenem SQLite und typisiertem RPC
  • Persistent Sessions: Baumstrukturierte Nachrichten, Forking, Kompaktion, Full-Text-Suche
  • Sandboxed Code Execution: Dynamic Workers, Codemode, Runtime-NPM-Resolution
  • Execution Ladder: Workspace, Isolate, NPM, Browser, Sandbox

Durable Execution

Ein einzelner Agent-Loop kann Minuten oder Stunden dauern. Wenn währenddessen das Ausführungsumfeld verschwindet (Deploy, Restart, Ressourcenlimits), geht der Zustand verloren. Fibers lösen das: Jede Ausführung wird vor dem Start in SQLite registriert und kann jederzeit über ctx.stash() gecheckpointet werden. Bei einem Restart wird der letzte Stand automatisch wiederhergestellt.

Sub-Agents und Facets

Ein Agent sollte nicht alles selbst tun. Sub-Agents sind als eigenständige Durable Objects realisiert, die über Facets mit dem Eltern-Agenten colokalisiert sind. Jeder Sub-Agent hat sein eigenes isoliertes SQLite und kann über typisierte RPCs angesprochen werden – kompilierungsseitig abgesichert.

Persistente Sessions

Die neue Session-API speichert Konversationen als Baumstruktur mit parent_id pro Nachricht. Das ermöglicht:

  • Forking: Alternative Ansätze erkunden, ohne den Originalpfad zu verlieren
  • Nicht-destruktive Kompaktion: Ältere Nachrichten zusammenfassen statt löschen
  • Full-Text-Suche über die gesamte Konversationshistorie

Sandboxed Code Execution und Execution Ladder

Statt einzelner Tool-Calls generiert der LLM ein komplettes Programm, das in einer isolierten Dynamic Worker ausgeführt wird. Laut Cloudflare-Quote wird dabei die Token-Nutzung im Vergleich zu sequenziellen Tool-Calls drastisch reduziert (z.B. von 1,17 Millionen Tokens auf rund 1.000). Die Execution Ladder definiert dabei aufsteigend mehr Fähigkeiten:

TierUmgebungFähigkeiten
0WorkspaceVirtuelles Dateisystem (SQLite + R2)
1Dynamic WorkerJS-Code in isoliertem Sandbox, kein Netzwerk
2Mit NPMAutomatische Paket-Resolution via Worker-Bundler
3Headless BrowserNavigation, Klicks, Screenshots
4Vollständiger SandboxOS-Zugriff mit git, compilers, etc.

Skalierung und Wirtschaftlichkeit

Das Skalierungsmodell von Cloudflare verschiebt die Kostenstruktur grundlegend:

  • Kosten im Leerlauf: Zero bei hibernierten Durable Objects
  • Scaling: Automatisch, pro Agent
  • State: Eingebautes SQLite statt externer Datenbank

Statt einer teuren Always-On-Instanz pro Nutzer können Agenten nur dann berechnet werden, wenn sie tatsächlich arbeiten. Cloudflare nennt als Beispiel: Für 10.000 Agenten, die jeweils nur einen kleinen Teil der Zeit aktiv sind, fallen nur Kosten für die tatsächlich ausgeführten an, während der Rest hiberniert.

Praxisbeispiel: Multi-Agent Research

Ein Beispiel aus dem Blogpost zeigt, wie Sub-Agents zusammenarbeiten:

export class Orchestrator extends Agent {
  async handleTask(task: string) {
    const researcher = await this.subAgent(ResearchAgent, "research");
    const reviewer = await this.subAgent(ReviewAgent, "review");

    const [research, review] = await Promise.all([
      researcher.search(task),
      reviewer.analyze(task)
    ]);

    return this.synthesize(research, review);
  }
}

Jeder Sub-Agent hat seine eigene isolierte Datenbank und Ausführungsumgebung, bleibt aber über RPC eng mit dem Orchestrierungs-Agenten verbunden.

Einordnung und Bedeutung

Project Think versucht, die Infrastruktur-Lücke zu schließen, die durch die Popularität von Coding-Agents wie Claude Code, OpenClaw und Codex entstanden ist. Diese Tools beweisen, dass Code das universelle Medium für Aktionen ist – aber sie laufen meist auf dem Laptop oder in teuren VPS-Umgebungen.

Cloudflare bietet mit Durable Objects bereits seit Jahren eine Plattform für langlaufende Zustände. Project Think baut darauf auf und richtet sich explizit an Agenten-Architekturen, wo jede Aufgabe einen eigenen Agenten erfordert. Die Plattform ändert die Kostenrechnung grundlegend: Statt “einer Container-Instanz pro Agent” gilt nun “Zero-Cost im Leerlauf, bezahlt nur bei Aktivität”. Für Entwickler bedeutet das, dass langlaufende Multi-Agent-Systeme wirtschaftlich betrieben werden können.

Quellenangaben