Claude Science macht Forschung zum Agenten-Workflow

Anthropic hat Claude Science am 30. Juni 2026 freigegeben. Nach Angaben des Unternehmens ist das kein weiterer KI-Chat für Paper-Zusammenfassungen, sondern eine Arbeitsumgebung, die Literatur, Datenanalyse, Code und Rechenzugriff in einem wissenschaftlichen Workflow zusammenzieht. Genau deshalb lohnt sich der Blick auch außerhalb der Forschung. Hier wird sichtbar, wie vertikale Agentenprodukte aussehen, sobald sie an echte Arbeitsmittel dürfen.

Dataconomy griff den Start am 1. Juli als Launch einer Workbench für Forschungsteams auf. Spannend ist daran vor allem die Produktlogik. Wenn ein Agent mit Datenquellen, Skripten, Laufzeitumgebungen und nachvollziehbaren Zwischenschritten arbeitet, verschiebt sich der Maßstab. Dann zählt nicht mehr, ob er klug klingt, sondern ob seine Arbeit prüfbar bleibt.

Eine Workbench statt eines besseren Chatfensters

Anthropic beschreibt Claude Science als App, die häufig genutzte Forschungswerkzeuge in einem Arbeitsraum bündelt. Genannt werden unter anderem Literaturarbeit, mehrstufige Forschungsschritte, Figuren, Manuskripte und auditierbare Artefakte. Laut Anthropic soll die Umgebung den ständigen Wechsel zwischen Datenbanken, Dateiformaten, PubMed, Jupyter, R und Cluster-Terminals verringern.

Darin steckt die eigentliche Nachricht. Der Agent sitzt nicht mehr neben der Arbeit und kommentiert sie, sondern greift auf die Werkzeuge zu, aus denen das Ergebnis entsteht. Gerade in der Forschung ist dieser Unterschied groß, weil belastbare Resultate selten aus einem einzelnen Prompt kommen. Sie entstehen aus Datenquellen, Skripten, Berechnungen, Visualisierungen und Iterationen, die später jemand nachvollziehen können muss.

Der Maßstab liegt deshalb in der Spur hinter dem Output. Anthropic verspricht eine auditierbare Historie, damit Ergebnisse validiert und reproduziert werden können. Genau dort entscheidet sich, ob das Produkt im Alltag trägt. Ein überzeugendes Diagramm ist wissenschaftlich wenig wert, wenn später niemand mehr sagen kann, welche Daten, Parameter und Zwischenschritte dazu geführt haben.

Wenn der Agent an echte Rechenumgebungen darf

Nach Angaben von Anthropic lässt sich Claude Science lokal auf macOS oder Linux nutzen, auf einer entfernten Maschine über SSH sowie über einen HPC-Login-Node. Damit wird Rechenzugriff Teil des Produkts und nicht bloß ein Randdetail für Power-User.

Für Entwickler ist das die wichtigere Botschaft als jede Demo. Sobald ein Agent lokale Daten lesen, Remote-Maschinen ansprechen oder Cluster-Jobs vorbereiten kann, reicht eine gute Chatoberfläche nicht mehr. Dann geht es um Sichtbarkeit, Rechte, Freigaben und Kontrolle. Teams müssen klären, welche Umgebung der Agent sieht, welche Daten er anfassen darf, welche Jobs er anstoßen kann und wie seine Ergebnisse überprüft werden.

Claude Science adressiert laut Anthropic einen Teil davon über auditierbare Artefakte. Der organisatorische Rest verschwindet dadurch aber nicht. Gerade deshalb ist die Workbench interessant: als Koordinator zwischen Werkzeugen, nicht als Ersatz für Fachwissen, Statistik oder Labormethoden. Wenn ein Agent Literatur sichtet, Skripte ausführt, Abbildungen überarbeitet und Manuskriptteile iteriert, spart das Routine. Problematisch wird es dort, wo diese Kette zur schwarzen Box wird.

Mehr als 60 Skills sind hier kein Nebenmenü

Anthropic nennt mehr als 60 kuratierte Skills und Connectoren für Bereiche wie Genomik, Single-Cell-Analysen, Proteomik, strukturelle Biologie und Cheminformatik. Gesteuert werden sie laut Anthropic über einen allgemeinen koordinierenden Agenten, der diese Spezialzugänge nutzt.

Das passt zu einem Muster, das weit über die Wissenschaft hinaus wichtig wird. Das allgemeine Modell bleibt die Oberfläche, aber die eigentliche Nützlichkeit entsteht durch geprüfte Fähigkeiten und angebundene Systeme. Skills und Connectoren sind in diesem Bild kein Komfort-Feature mehr. Sie markieren die Grenze zwischen einem Modell, das gut reden kann, und einem System, das in einer Domäne wirklich arbeitet.

Auch die Auswahl der Fachbereiche ist aufschlussreich. Biowissenschaftliche Workflows sind voller Spezialtools, großer Datenmengen und hoher Anforderungen an Reproduzierbarkeit. Wenn eine Agenten-Workbench dort trägt, ist das ein deutlich härterer Test als ein sauber präsentierter Office-Workflow. Für Agenten-Builder liegt genau darin der interessante Teil: nicht die Demo, sondern die Domäne, an der sich das Produkt beweisen muss.

Der eigentliche Maßstab bleibt Reproduzierbarkeit

Claude Science startet mit großen Versprechen. Der nüchterne Test ist trotzdem einfach: Reichen die auditierbaren Artefakte im Alltag aus, damit Kolleginnen und Kollegen einen Lauf nachvollziehen können? Lassen sich Datenquellen, Skripte und Entscheidungen sauber wiederholen? Bleibt sichtbar, wann der Agent gerechnet, umformuliert oder nur vorgeschlagen hat?

Dataconomy rahmt den Start als Forschungs-Workbench, Anthropic selbst als Ausbau seiner Life-Sciences-Aktivitäten. Sichtbar wird daran vor allem ein größerer Trend: Agenten werden vertikaler. Anbieter verkaufen nicht mehr nur ein Modell für alles, sondern bauen Arbeitsräume für konkrete Domänen, inklusive Datenzugriff, Toolketten und Ergebnisprüfung.

Für Entwickler und Agenten-Builder ist Claude Science deshalb vor allem ein Testfall. Die Workbench zeigt, welche Bausteine ernsthafte Agentensysteme brauchen: kontrollierte Tool-Nutzung, Domänenfähigkeiten, Zugriff auf echte Laufzeitumgebungen und eine Historie, die mehr leistet als ein Chatverlauf. Die nächste Frage lautet nicht, ob der Agent überzeugend formuliert. Sie lautet, ob seine Arbeit bestehen bleibt, wenn Daten, Code und Rechenressourcen mit im Raum sind.

Claude Science macht Forschung zum Agenten-Workflow

Eine Workbench statt eines besseren Chatfensters

Wenn der Agent an echte Rechenumgebungen darf

Mehr als 60 Skills sind hier kein Nebenmenü

Der eigentliche Maßstab bleibt Reproduzierbarkeit

Transparenz

Quellen

Das könnte dich auch interessieren

AWS setzt eine Milliarde Dollar auf Forward-Deployed-Agenten

Cursor bringt Coding-Agenten aufs iPhone

Berichte: OpenAI bremst GPT-5.6 nach US-Regierungsbitte