Claude Science macht Forschung zum Agenten-Workflow
Anthropic öffnet Claude Science als Workbench für Wissenschaftsteams: näher an Daten, Rechenumgebungen und überprüfbare Ergebnisse.
Anthropic hat Claude Science am 30. Juni 2026 freigegeben. Nach Angaben des Unternehmens ist das kein weiterer KI-Chat für Paper-Zusammenfassungen, sondern eine Arbeitsumgebung, die Literatur, Datenanalyse, Code und Rechenzugriff in einem wissenschaftlichen Workflow zusammenzieht. Genau deshalb lohnt sich der Blick auch außerhalb der Forschung. Hier wird sichtbar, wie vertikale Agentenprodukte aussehen, sobald sie an echte Arbeitsmittel dürfen.
Dataconomy griff den Start am 1. Juli als Launch einer Workbench für Forschungsteams auf. Spannend ist daran vor allem die Produktlogik. Wenn ein Agent mit Datenquellen, Skripten, Laufzeitumgebungen und nachvollziehbaren Zwischenschritten arbeitet, verschiebt sich der Maßstab. Dann zählt nicht mehr, ob er klug klingt, sondern ob seine Arbeit prüfbar bleibt.
Eine Workbench statt eines besseren Chatfensters
Anthropic beschreibt Claude Science als App, die häufig genutzte Forschungswerkzeuge in einem Arbeitsraum bündelt. Genannt werden unter anderem Literaturarbeit, mehrstufige Forschungsschritte, Figuren, Manuskripte und auditierbare Artefakte. Laut Anthropic soll die Umgebung den ständigen Wechsel zwischen Datenbanken, Dateiformaten, PubMed, Jupyter, R und Cluster-Terminals verringern.
Darin steckt die eigentliche Nachricht. Der Agent sitzt nicht mehr neben der Arbeit und kommentiert sie, sondern greift auf die Werkzeuge zu, aus denen das Ergebnis entsteht. Gerade in der Forschung ist dieser Unterschied groß, weil belastbare Resultate selten aus einem einzelnen Prompt kommen. Sie entstehen aus Datenquellen, Skripten, Berechnungen, Visualisierungen und Iterationen, die später jemand nachvollziehen können muss.
Der Maßstab liegt deshalb in der Spur hinter dem Output. Anthropic verspricht eine auditierbare Historie, damit Ergebnisse validiert und reproduziert werden können. Genau dort entscheidet sich, ob das Produkt im Alltag trägt. Ein überzeugendes Diagramm ist wissenschaftlich wenig wert, wenn später niemand mehr sagen kann, welche Daten, Parameter und Zwischenschritte dazu geführt haben.
Wenn der Agent an echte Rechenumgebungen darf
Nach Angaben von Anthropic lässt sich Claude Science lokal auf macOS oder Linux nutzen, auf einer entfernten Maschine über SSH sowie über einen HPC-Login-Node. Damit wird Rechenzugriff Teil des Produkts und nicht bloß ein Randdetail für Power-User.
Für Entwickler ist das die wichtigere Botschaft als jede Demo. Sobald ein Agent lokale Daten lesen, Remote-Maschinen ansprechen oder Cluster-Jobs vorbereiten kann, reicht eine gute Chatoberfläche nicht mehr. Dann geht es um Sichtbarkeit, Rechte, Freigaben und Kontrolle. Teams müssen klären, welche Umgebung der Agent sieht, welche Daten er anfassen darf, welche Jobs er anstoßen kann und wie seine Ergebnisse überprüft werden.
Claude Science adressiert laut Anthropic einen Teil davon über auditierbare Artefakte. Der organisatorische Rest verschwindet dadurch aber nicht. Gerade deshalb ist die Workbench interessant: als Koordinator zwischen Werkzeugen, nicht als Ersatz für Fachwissen, Statistik oder Labormethoden. Wenn ein Agent Literatur sichtet, Skripte ausführt, Abbildungen überarbeitet und Manuskriptteile iteriert, spart das Routine. Problematisch wird es dort, wo diese Kette zur schwarzen Box wird.
Mehr als 60 Skills sind hier kein Nebenmenü
Anthropic nennt mehr als 60 kuratierte Skills und Connectoren für Bereiche wie Genomik, Single-Cell-Analysen, Proteomik, strukturelle Biologie und Cheminformatik. Gesteuert werden sie laut Anthropic über einen allgemeinen koordinierenden Agenten, der diese Spezialzugänge nutzt.
Das passt zu einem Muster, das weit über die Wissenschaft hinaus wichtig wird. Das allgemeine Modell bleibt die Oberfläche, aber die eigentliche Nützlichkeit entsteht durch geprüfte Fähigkeiten und angebundene Systeme. Skills und Connectoren sind in diesem Bild kein Komfort-Feature mehr. Sie markieren die Grenze zwischen einem Modell, das gut reden kann, und einem System, das in einer Domäne wirklich arbeitet.
Auch die Auswahl der Fachbereiche ist aufschlussreich. Biowissenschaftliche Workflows sind voller Spezialtools, großer Datenmengen und hoher Anforderungen an Reproduzierbarkeit. Wenn eine Agenten-Workbench dort trägt, ist das ein deutlich härterer Test als ein sauber präsentierter Office-Workflow. Für Agenten-Builder liegt genau darin der interessante Teil: nicht die Demo, sondern die Domäne, an der sich das Produkt beweisen muss.
Der eigentliche Maßstab bleibt Reproduzierbarkeit
Claude Science startet mit großen Versprechen. Der nüchterne Test ist trotzdem einfach: Reichen die auditierbaren Artefakte im Alltag aus, damit Kolleginnen und Kollegen einen Lauf nachvollziehen können? Lassen sich Datenquellen, Skripte und Entscheidungen sauber wiederholen? Bleibt sichtbar, wann der Agent gerechnet, umformuliert oder nur vorgeschlagen hat?
Dataconomy rahmt den Start als Forschungs-Workbench, Anthropic selbst als Ausbau seiner Life-Sciences-Aktivitäten. Sichtbar wird daran vor allem ein größerer Trend: Agenten werden vertikaler. Anbieter verkaufen nicht mehr nur ein Modell für alles, sondern bauen Arbeitsräume für konkrete Domänen, inklusive Datenzugriff, Toolketten und Ergebnisprüfung.
Für Entwickler und Agenten-Builder ist Claude Science deshalb vor allem ein Testfall. Die Workbench zeigt, welche Bausteine ernsthafte Agentensysteme brauchen: kontrollierte Tool-Nutzung, Domänenfähigkeiten, Zugriff auf echte Laufzeitumgebungen und eine Historie, die mehr leistet als ein Chatverlauf. Die nächste Frage lautet nicht, ob der Agent überzeugend formuliert. Sie lautet, ob seine Arbeit bestehen bleibt, wenn Daten, Code und Rechenressourcen mit im Raum sind.
Transparenz
Agentenlog nutzt KI-Assistenz für Recherche, Struktur und Entwurf. Inhaltliche Auswahl, Einordnung und Veröffentlichung liegen redaktionell bei Agentenlog; Quellen und Fakten werden vor Veröffentlichung geprüft.
Quellen
Das könnte dich auch interessieren
AWS setzt eine Milliarde Dollar auf Forward-Deployed-Agenten
AWS baut eine neue Einheit für Forward Deployed Engineering auf. Der Schritt macht Agenten zur Integrationsfrage.
Cursor bringt Coding-Agenten aufs iPhone
Cursor hat eine iOS-App für seine Coding-Agenten gestartet. Der Schritt macht Agentenarbeit stärker zum beaufsichtigten Workflow.
Berichte: OpenAI bremst GPT-5.6 nach US-Regierungsbitte
OpenAI soll GPT-5.6 zunächst nur eingeschränkt freigeben. Der Fall verbindet Modellzugang, Sicherheitsprüfung und Agentenfähigkeit.