Ende der Agenten-Flatrate: Anthropic sperrt Third-Party, OpenAI Codex wird teurer

Die beschriebenen Pricing-Änderungen von Anthropic und OpenAI fanden im April 2025 statt. Seitdem ist aus einzelnen Tarifentscheidungen ein größeres Muster geworden: Third-Party-Agenten verlieren den bequemen Zugriff auf günstige Flatrates, während Anbieter stärker auf kontrollierte API- und Tier-Modelle setzen.

Die Ära der günstigen Flatrates für KI-Agenten endete im Frühjahr 2025. Mit Anthropic und OpenAI passten damals zwei der wichtigsten LLM-Provider ihre Preismodelle an und schlossen beliebte Schlupflöcher für automatisierte Workflows. Für Betreiber von Drittanbieter-Tools bedeutete das: Die Monetarisierungsstrategie musste auf den Prüfstand, um unkalkulierbare Kostenexplosionen zu vermeiden. Dieser Übergang erforderte ein präzises Ressourcenmanagement und markierte zugleich einen weiteren Schritt des gesamten Ökosystems.

Anthropic sperrt Claude Pro und Max für Drittanbieter

Ab dem 4. April 2025 waren Abonnenten von Claude Pro und Claude Max laut offiziellen Angaben von Anthropic nicht mehr berechtigt, ihre Zugänge für die Anbindung von Agenten-Frameworks oder Drittanbieter-Tools zu nutzen.

Diese Entscheidung zeigt, dass die bisherigen Abonnements primär für Endkonsumenten und kleine Unternehmen kalkuliert waren – und nicht für den massiven, automatisierten Durchsatz moderner Agenten-Plattformen. Anthropic verwies damals sinngemäß auf Kapazitätsmanagement und die Priorisierung direkter API- sowie Produktkunden.

Wer künftig Agenten mit Claude betreiben möchte, muss auf das reguläre, nutzungsbasierte API-Abrechnungsmodell (Pay-as-you-go) umsteigen. Die Auswirkungen waren spürbar: Laut der VentureBeat-Analyse waren beim Framework OpenClaw zahlreiche Nutzer betroffen, die ihre bestehenden Accounts auf API-basierten Betrieb umstellen mussten. Seither haben die meisten Agenten-Plattformen entsprechende Migrationstools und Preismodell-Optionen entwickelt.

OpenAI wechselt von der Flatrate zum Tier-Modell

Auch OpenAI strukturiert um und überführt sein Codex-Produkt in ein gestaffeltes Tier-Modell. Wie aus der offiziellen Pricing-Seite des Unternehmens hervorgeht, entfallen die fixen monatlichen Kosten zugunsten einer rein nutzungsbasierten Logik.

Das Angebot unterteilt sich in ein „Free“-Tier für einfache Programmieraufgaben, ein „Go“-Tier für leichtgewichtige Workflows und ein „Plus“-Tier für intensivere Coding-Sitzungen. Letzteres gewährt zwar Zugriff auf die neuesten Modellgenerationen, fungiert aber nicht mehr als unlimitierte Agenten-Flatrate. Es handelt sich um ein sitzungsbasiertes Modell, das die Intensität und Häufigkeit der Agenten-Nutzung klar deckelt.

Wird das Limit überschritten, drohen zusätzliche Gebühren (Overage) oder ein harter Stopp der API-Aufrufe. Um den Übergang abzufedern, bietet OpenAI laut eigenen Angaben berechtigten „ChatGPT Business“-Workspaces bis zu 500 US-Dollar in Form von Credits an. Dies verschafft Agenten-Anbietern eine kurze Testphase, um ihre eigenen Preismodelle an die neuen Gegebenheiten anzupassen.

Konsequenzen für das Agenten-Ökosystem

Beide Provider verlagern die Verantwortung und die Kostenkontrolle von pauschalen Abonnements hin zu nutzungsbasierten Modellen. Daraus ergeben sich konkrete strukturelle Anpassungen für Entwickler und Unternehmen:

Steigende Preiskomplexität: Agenten-Anwendungen müssen künftig präzise kalkulieren, ob sie auf bestimmte Tiers oder reine API-Abrechnungen setzen, um Budgets planbar zu halten. Während Flatrates nahezu linear mit der Nutzerzahl skalierten, machen token- und sitzungsbasierte Modelle die Kostenkontrolle anspruchsvoller.
Ende des Endkunden-Hacks: Die kostengünstige Bereitstellung von Drittanbieter-Agenten über Endkunden-Accounts ist Geschichte. Anbieter müssen künftig strikt zwischen API-basiertem Betrieb (Bring your own Key) und integriertem Subscription-Billing unterscheiden.
Engmaschiges Monitoring wird Pflicht: Latenz-Engpässe und drohende Overage-Kosten erfordern eine permanente Überwachung des Verbrauchs durch die Agenten-Plattformen selbst.

Praxisbeispiel: Anpassung der internen Infrastruktur

Ein typisches Szenario zeigt die praktischen Auswirkungen: Ein internes Entwicklerteam nutzt einen Codex-Agenten zur Validierung von Legacy-Code und einen Claude-Agenten zur Generierung von Requirements aus Jira. Bislang wurden die Setup-Kosten bequem über bestehende Firmen-Abonnements abgedeckt.

Mit den neuen Modellen ändert sich die Kalkulation drastisch. Das Plus-Tier von Codex bietet zwar ausreichend Sitzungen für Code-Reviews, stößt bei intensiver Entwicklungsarbeit jedoch an seine Grenzen. Der Claude-Agent muss zwingend auf die API umgezogen werden, was die Kosten im Vergleich zum bisherigen Standardpreis für die Pro-Subscription spürbar in die Höhe treibt.

Um die Preissicherheit wiederherzustellen, müssen Teams eine eigene Abstraktionsschicht für das Preismodell entwickeln. Ein neuer Service überwacht die aktuelle Nutzung in Relation zum Budget und warnt, sobald – laut gängigen Cloud-Best-Practices – 80 Prozent der verfügbaren Kapazitäten ausgeschöpft sind. Das Unternehmen spart dadurch zwar keine direkten Kosten, erhöht aber die Resilienz und Planbarkeit seiner Agenten-Infrastruktur erheblich.

Was bis April 2026 daraus wurde

Die strategischen Anpassungen von 2025 wurden umgesetzt; die Agenten-Ökosysteme haben sich darauf eingestellt. Neue Modelle (Codex-Flex, Claude-Enterprise-Pass) bieten heute differenziertere Abrechnungsoptionen. Der einfache Weg, Agenten über Endkunden-Flatrates zu skalieren, ist seit April 2025 passé.

Die Folge: Agenten-Projekte bauen heute von Anfang an nutzungsbasierte Kostenkalkulationen ein. Das Budget-Monitoring – etwa via OpenClaw-Dashboard oder externer Agent-orchestration-Plattformen – gehört zum Standard. Die Entwicklung der KI-Agenten hat sich nicht verlangsamt; stattdessen ist die Preistransparenz und Kapazitätsplanung professioneller geworden – eine Notwendigkeit, wenn Automatisierungsergebnisse verlässlich im Alltag ankommen sollen.

Ende der Agenten-Flatrate: Anthropic sperrt Third-Party, OpenAI Codex wird teurer

Anthropic sperrt Claude Pro und Max für Drittanbieter

OpenAI wechselt von der Flatrate zum Tier-Modell

Konsequenzen für das Agenten-Ökosystem

Praxisbeispiel: Anpassung der internen Infrastruktur

Was bis April 2026 daraus wurde

Transparenz

Quellen

Das könnte dich auch interessieren

Huawei macht Agentic Banking zur Infrastrukturfrage

Hark bekommt 700 Millionen Dollar für ein noch kaum sichtbares KI-Interface

Modal sammelt 355 Millionen Dollar für AI-Cloud-Infrastruktur