arXiv zieht bei ungeprüften KI-Papers die Bremse

arXiv verschärft den Umgang mit offensichtlich ungeprüften KI-generierten Einreichungen. TechCrunch berichtete am 16. Mai 2026, dass das Forschungsarchiv Autoren für ein Jahr sperren will, wenn sie ein Paper hochladen, bei dem ein Sprachmodell sichtbar die Arbeit übernommen hat und niemand den Text sauber geprüft hat.

Für wissenschaftliche Vorveröffentlichungen ist das ein klares Signal. arXiv ist für viele Disziplinen die schnelle Infrastruktur vor Journal- oder Konferenzentscheidungen. Wenn dort automatisiert erzeugte Fehler durchrutschen, landen sie nicht nur in einem privaten Entwurf, sondern im sichtbaren wissenschaftlichen Umlauf.

Die Sanktion richtet sich gegen Nachlässigkeit, nicht gegen Werkzeuge

Laut TechCrunch will arXiv die sorglose Nutzung großer Sprachmodelle in wissenschaftlichen Arbeiten eindämmen. Die Meldung beschreibt kein pauschales KI-Verbot. Der Kern ist enger: Wer ein Paper mit ungeprüften LLM-Spuren einreicht, riskiert eine lange Einreichungssperre.

Digg fasst die Regel ähnlich zusammen: Betroffen sind Autoren, die Arbeiten mit nicht verifizierten KI-generierten Inhalten hochladen. Genannt werden wiederkehrende Muster wie erfundene Referenzen und stehengebliebene Meta-Kommentare eines großen Sprachmodells. Das sind keine subtilen Stilfragen, sondern Prüfversagen an Stellen, die vor dem Upload auffallen müssten.

Für Agenten-Builder ist diese Unterscheidung wichtig; sie erinnert an die Kontrollfrage aus unserem Stück zu Codex-Agenten-Sicherheit. Ein Schreib- oder Recherche-Agent kann Literatur sortieren, Entwürfe strukturieren oder Widersprüche markieren. Aber sobald der Agent Quellen erfindet, Zitate falsch zuordnet oder interne Arbeitsnotizen im finalen Text stehen lässt, bleibt die Verantwortung beim Menschen oder Team, das den Output veröffentlicht.

Halluzinierte Quellen sind ein Infrastrukturproblem

Digg verweist auf eine öffentliche Debatte um die Maßnahme und beschreibt arXivs Vorgehen als Reaktion auf KI-Slop in wissenschaftlichen Einreichungen. Halluzinierte Zitationen sind dabei besonders leicht zu erkennen und schwer zu verteidigen. Plattformen müssen nicht beweisen, welches Modell welchen Absatz geschrieben hat. Sie können bei klaren Qualitätsartefakten ansetzen.

Eine erfundene Referenz ist ein harter Befund. Eine im Text stehengebliebene Modellnotiz wie ein Bearbeitungskommentar ist ebenfalls kein Grenzfall. Solche Spuren zeigen, dass der finale Kontrollschritt gefehlt hat. arXiv muss dafür keine philosophische Linie ziehen, ob KI als Werkzeug legitim ist. Es reicht, offensichtliche Prüfdefizite als Einreichungsproblem zu behandeln.

Die empirische Grundlage für diese Härte wird sichtbarer. In einem arXiv-Preprint vom 8. Mai 2026 untersuchten Zhenyue Zhao und Koautoren nach eigenen Angaben 111 Millionen Referenzen aus 2,5 Millionen Arbeiten in arXiv, bioRxiv, SSRN und PubMed Central. Der Abstract nennt für 2025 eine konservative Schätzung von 146.932 halluzinierten Zitaten. Damit wird aus einem Anekdotenproblem ein messbares Infrastrukturproblem.

Je mehr wissenschaftliche, journalistische und technische Plattformen mit automatisiert erzeugten Inhalten umgehen müssen, desto weniger werden sie über Absichten diskutieren. Entscheidend wird, ob ein Output belegbar, überprüft und veröffentlichungsreif ist. Wer das nicht liefern kann, verliert Zugang, Reichweite oder Vertrauen.

Agenten brauchen Publish-Gates, keine Vertrauensvorschüsse

Für automatisierte Workflows ist die arXiv-Meldung ein klares Architektur-Signal, ähnlich wie bei agentischen Fehlanreizen im Training. Ein Agent, der Texte produziert, braucht vor der Veröffentlichung harte Gates: Quellen müssen existieren, Zitate müssen auffindbar sein, Platzhalter dürfen nicht übrig bleiben, und jede technische oder wissenschaftliche Behauptung braucht eine prüfbare Spur.

Das ist der Unterschied zwischen Assistenz und Müllschleuder. Viele Agentensysteme optimieren noch immer auf Durchsatz: schneller Entwurf, längerer Kontext, mehr Tools, weniger Klicks. Die arXiv-Reaktion zeigt die Gegenbewegung. Plattformen belohnen nicht, dass ein System viel produziert. Sie sanktionieren, wenn ein System ungeprüfte Artefakte in den öffentlichen Raum kippt.

Gerade bei wissenschaftlichen Inhalten reicht eine gut lesbare Zusammenfassung nicht. Wenn eine Referenz nicht existiert, eine DOI falsch ist oder ein Paper eine angebliche Vorarbeit beschreibt, die niemand finden kann, entsteht Schaden entlang der ganzen Kette. Andere Forscher verlieren Zeit. Reviewer müssen triviale Fehler aussortieren. Suchmaschinen und KI-Systeme können falsche Spuren weiterverarbeiten.

Die Plattformen verschieben Verantwortung zurück zum Absender

Digg beschreibt die Maßnahme als Teil des normalen Review-Prozesses von arXiv, damit minderwertige Outputs nicht in den wissenschaftlichen Datensatz gelangen. Der entscheidende Punkt: Die Plattform behandelt KI-Slop nicht nur als Stilproblem, sondern als Integritätsproblem der eigenen Infrastruktur.

Für Autoren ist die Konsequenz hart, aber nachvollziehbar. Wer KI nutzt, muss den Prüfprozess im Zweifel erklären können: Welche Quellen wurden kontrolliert? Welche Zitate wurden verifiziert? Welche Stellen stammen aus eigener Analyse, welche aus Modellvorschlägen? Nicht jede Plattform wird dafür formale Nachweise verlangen. Aber sobald ein Text sichtbare LLM-Fehler enthält, wird die Ausrede „das Modell war schuld“ immer weniger tragen.

Für Agenten-Systeme bedeutet das: Der Fortschritt liegt nicht nur im besseren Generator, sondern im besseren Kontrollsystem. Retrieval, Zitierprüfung, Dublettencheck, Plausibilitätsprüfung und menschliche Freigabe sind keine lästigen Bremsen. Sie sind die Teile, die automatisierte Arbeit überhaupt publishbar machen.

Fazit: Automatisierung braucht nachweisbare Kontrolle

arXiv sendet ein simples Signal an alle, die mit KI Texte in professionelle Kontexte bringen: Automatisierung ist erlaubt, Schlamperei nicht. Wer Agenten baut, sollte diese Grenze nicht erst am Ende eines Workflows einziehen, sondern direkt in die Pipeline.

Die praktische Konsequenz ist unbequem, aber sinnvoll: Ein Publish-Button darf nicht nur fragen, ob ein Text gut klingt. Er muss prüfen, ob Quellen, Zitate und Behauptungen belastbar sind. Erst dann wird aus KI-Output veröffentlichungsreife Arbeit.

arXiv zieht bei ungeprüften KI-Papers die Bremse

Die Sanktion richtet sich gegen Nachlässigkeit, nicht gegen Werkzeuge

Halluzinierte Quellen sind ein Infrastrukturproblem

Agenten brauchen Publish-Gates, keine Vertrauensvorschüsse

Die Plattformen verschieben Verantwortung zurück zum Absender

Fazit: Automatisierung braucht nachweisbare Kontrolle

Transparenz

Quellen

Das könnte dich auch interessieren

Anthropic testet Midtraining gegen agentische Fehlanreize

OpenClaw Dreaming: Was dein KI-Agent tut, wenn du schläfst

Eigene Tools & Skills bauen – Teil 3 der Serie 'KI‑Agenten in der Praxis'