OpenClaw mit Ollama: lokale Modelle einrichten, Limits prüfen, Stalls vermeiden
Wie du Ollama in OpenClaw einrichtest, langsame oder instabile Läufe diagnostizierst und lokale Runtime‑Grenzen realistisch einschätzt.
OpenClaw lässt sich mit Ollama schnell lokal starten. Genau deshalb landet diese Kombination oft früh auf einem MacBook, Mini‑PC oder Heim‑Server. Für einen kurzen Test ist das praktisch: keine laufenden Modell‑Kosten, keine extra API‑Keys und mehr Kontrolle darüber, wo Prompts landen.
Sobald OpenClaw aber nicht nur kurze Chats, sondern längere Agentenläufe mit Tools, Anhängen und Sicherheitslogik abarbeiten soll, kippt der Eindruck schnell. Dann wirkt ein lokales Modell plötzlich langsam, vergisst Instruktionen, produziert nur Text statt Tool‑Calls oder bricht unter Last weg. Das ist meist kein einzelner Bug, sondern eine Mischung aus falscher Erwartung, zu kleinem Modell, zu knapper Hardware oder einer unpassenden Provider‑Konfiguration.
Wichtig: OpenClaw erwartet bei Ollama die native Basis‑URL ohne /v1‑Pfad, also exakt http://127.0.0.1:11434. Wer hier etwas anderes einträgt, debuggt später an der falschen Stelle.
Wann Ollama in OpenClaw sinnvoll ist
Ollama passt gut, wenn du:
- OpenClaw lokal ausprobieren willst, ohne sofort externe Modell‑Kosten zu erzeugen,
- sensible Prompts nicht standardmäßig an einen Cloud‑Provider schicken willst,
- bewusst akzeptierst, dass lokale Modelle bei langen Agentenläufen schneller an Grenzen stoßen als große gehostete Modelle.
Weniger gut passt Ollama als einzige Modellschicht, wenn dein Agent regelmäßig mit langen Sessions, vielen Tool‑Schemas, Vision‑Eingaben oder heiklen Sicherheitsentscheidungen umgehen muss. Die OpenClaw‑Doku zu lokalen Modellen warnt, dass Modelle mit weniger als 32 k Kontext‑Tokens und unter 16 k Kontext‑Tokens problematisch sein können.
Was du brauchst
- funktionierende OpenClaw‑Installation (Gateway läuft)
- laufender Ollama‑Dienst aus der aktuellen offiziellen Installation
- mindestens ein lokal gezogenes Ollama‑Modell (z. B.
ollama/qwen2.5:7b) - ausreichend RAM bzw. GPU‑Speicher für das gewählte Modell
- Netzwerk‑Sicherheit: Ollama sollte nur auf
127.0.0.1lauschen oder per VPN/SSH‑Tunnel geschützt sein
Setup‑Pfad: Ollama zuerst, dann OpenClaw
1. Ollama installieren & starten
# macOS (Homebrew) – erfordert macOS 14+ (Sonoma)
brew install ollama
# Linux – offizielles Install‑Script
curl -fsSL https://ollama.com/install.sh | sh
# Dienst starten (falls nicht automatisch)
ollama serve &
2. Modell ziehen
ollama pull qwen2.5:7b # oder ein anderes Modell deiner Wahl
ollama list # prüft, ob das Modell sichtbar ist
3. Endpoint prüfen
curl -s http://127.0.0.1:11434/api/tags | jq .models[0].name
Erwartete Ausgabe: qwen2.5:7b. Wenn hier ein Fehler erscheint, ist Ollama nicht korrekt erreichbar.
4. OpenClaw konfigurieren (bestehende Installation anpassen)
openclaw configure
Im Konfigurations‑Wizard wähle Provider → Ollama und trage exakt die Basis‑URL ein:
http://127.0.0.1:11434
Falls du bereits eine agents.defaults.models‑Allowlist nutzt, ergänze den Ollama‑Eintrag, damit das Modell angezeigt wird:
{
agents: {
defaults: {
models: [
"ollama/qwen2.5:7b",
"ollama/*" // optional, um alle lokalen Modelle zu erlauben
]
}
}
}
5. Modell‑Scan & Setzen
openclaw models scan # erkennt neue lokale Modelle
openclaw models list # prüft, ob qwen2.5:7b erscheint
openclaw models set ollama/qwen2.5:7b
openclaw models status # bestätigt das primäre Modell
Hinweis:
openclaw models setverwendet den vollen Aliasollama/qwen2.5:7b. Ein fehlender Präfix führt dazu, dass OpenClaw ein falsches Modell wählt.
6. Hybrid‑Setup (empfohlen)
Lokale Modelle sind oft nicht stark genug für sehr lange Kontext‑Fenster. Aktiviere daher Fallback‑Modelle aus der Cloud:
{
agents: {
defaults: {
model: {
primary: "ollama/qwen2.5:7b",
mode: "merge", // lokale Modelle zuerst, Cloud‑Fallbacks danach
fallbacks: ["openrouter/anthropic/claude-opus-4.8"]
}
}
}
}
Damit greift OpenClaw automatisch auf das Cloud‑Modell zurück, sobald das lokale Modell das Kontext‑Limit überschreitet.
Diagnose‑Leiter für langsame oder instabile Ollama‑Läufe
- Ollama‑Dienst prüfen –
ollama list/curl …/api/tags. - Endpoint prüfen – korrekte Basis‑URL ohne
/v1. - Modell‑Scan erneuern –
openclaw models scan. - Standardmodell verifizieren –
openclaw models status. - Hardware‑Grenzen prüfen – kurze Tests laufen, lange Sessions nicht → Modell zu klein oder zu stark quantisiert.
- Hybrid‑Fallback aktivieren –
models.mode: "merge".
Bildverarbeitung (optional)
Falls du Vision‑Modelle nutzen willst, prüfe, ob das Modell vision‑fähig ist (z. B. qwen2.5vl:7b). Dann setze zusätzlich:
{
agents: {
defaults: {
imageModel: "ollama/qwen2.5vl:7b"
}
}
}
Aktiviere Vision‑Funktionen erst, wenn Text‑Läufe stabil sind – sonst erhöht sich die Latenz stark.
Sicherheitshinweise
- Nur lokal: Lass Ollama auf
127.0.0.1lauschen. Öffentliche IPs ohne Authentifizierung öffnen ein Sicherheitsrisiko. - Firewall / VPN: Wenn du Ollama auf einem anderen Rechner betreibst, sichere den Zugriff per Firewall‑Regel oder SSH‑Tunnel.
- Kein API‑Key nötig: Für den nativen Ollama‑Endpoint wird kein Schlüssel benötigt, aber ein falscher Endpoint kann zu Fehlermeldungen führen, die wie Auth‑Probleme aussehen.
Reality‑Check
- Ollama‑Basis‑URL ohne
/v1ist zwingend. - Modelle mit < 32 k Kontext‑Tokens können bei langen Agentenläufen schnell an Grenzen stoßen.
- Hybride Setups (
models.mode: "merge") bieten die robusteste Lösung für produktive Workflows.
Wenn du die Modellschicht breiter planen willst, passt dazu der separate Guide zu OpenClaw-Modellen, Providern und Fallbacks. Er erklärt, wo Provider-Konfiguration, Allowlist und Fallback-Reihenfolge auseinanderfallen.
Kurzantworten (FAQ)
- Warum ist OpenClaw mit Ollama langsam? Meist zu kleines Modell, zu knappe Hardware oder falscher Endpoint.
- Brauche ich einen API‑Key? Nein, nicht für den nativen Ollama‑Pfad.
- Soll ich komplett auf lokal umstellen? Nur, wenn deine Hardware das Modell‑Größen‑ und Kontext‑Bedarf deckt. Hybride Setups sind sicherer.
- Was ist der direkte Debug‑Pfad?
ollama list→curl …/api/tags→openclaw models scan→openclaw models status.
Weiterführende Literatur
- OpenClaw – Lokale Modelle
- OpenClaw – Modelle konfigurieren
- Ollama – Library
- Hybrid‑Fallback‑Strategie
Fazit
Ollama ist für OpenClaw ein guter lokaler Einstieg, aber kein Freifahrtschein für lange Agentenläufe. Behandle lokale Modelle als kontrollierte Runtime mit klaren Grenzen: Endpoint prüfen, Modell sichtbar machen, Hardware realistisch einschätzen und für produktive Workflows einen Cloud-Fallback bereithalten.
Dieser Guide ist Teil der OpenClaw‑Praxis‑Serie (Teil 4 von 6).
Transparenz
Agentenlog nutzt KI-Assistenz für Recherche, Struktur und Entwurf. Inhaltliche Auswahl, Einordnung und Veröffentlichung liegen redaktionell bei Agentenlog; Quellen und Fakten werden vor Veröffentlichung geprüft.
Quellen
Serie: OpenClaw Praxis-Serie
Das könnte dich auch interessieren
Slack mit OpenClaw verbinden: Bot, Mentions und Routing sauber einrichten
OpenClaw kann in Slack per Socket Mode oder HTTP Request URLs laufen. Entscheidend sind Bot-Setup, Gruppenzugriff, Mention-Gating und deterministisches Routing.
Signal mit OpenClaw verbinden: signal-cli, Pairing, Gruppen und Troubleshooting
So bindest du Signal per signal-cli an OpenClaw an, prüfst Pairing und Gruppenrouting und findest typische Fehler bei Container-, Daemon- und Bot-Setups.
OpenClaw mit Mattermost verbinden: Bot, Channels und Self-Hosting ohne Blindflug
Wenn OpenClaw in Mattermost nur halb reagiert, prüfst du Runtime, Pairing, Chatmode, Callback-Erreichbarkeit und Routing.