Zum Inhalt springen
tutorials · 5 min Lesezeit

OpenClaw mit Ollama: lokale Modelle einrichten, Limits prüfen, Stalls vermeiden

Wie du Ollama in OpenClaw einrichtest, langsame oder instabile Läufe diagnostizierst und lokale Runtime‑Grenzen realistisch einschätzt.

openclaw ollama lokale-modelle tutorials

OpenClaw lässt sich mit Ollama schnell lokal starten. Genau deshalb landet diese Kombination oft früh auf einem MacBook, Mini‑PC oder Heim‑Server. Für einen kurzen Test ist das praktisch: keine laufenden Modell‑Kosten, keine extra API‑Keys und mehr Kontrolle darüber, wo Prompts landen.

Sobald OpenClaw aber nicht nur kurze Chats, sondern längere Agentenläufe mit Tools, Anhängen und Sicherheitslogik abarbeiten soll, kippt der Eindruck schnell. Dann wirkt ein lokales Modell plötzlich langsam, vergisst Instruktionen, produziert nur Text statt Tool‑Calls oder bricht unter Last weg. Das ist meist kein einzelner Bug, sondern eine Mischung aus falscher Erwartung, zu kleinem Modell, zu knapper Hardware oder einer unpassenden Provider‑Konfiguration.

Wichtig: OpenClaw erwartet bei Ollama die native Basis‑URL ohne /v1‑Pfad, also exakt http://127.0.0.1:11434. Wer hier etwas anderes einträgt, debuggt später an der falschen Stelle.

Wann Ollama in OpenClaw sinnvoll ist

Ollama passt gut, wenn du:

  • OpenClaw lokal ausprobieren willst, ohne sofort externe Modell‑Kosten zu erzeugen,
  • sensible Prompts nicht standardmäßig an einen Cloud‑Provider schicken willst,
  • bewusst akzeptierst, dass lokale Modelle bei langen Agentenläufen schneller an Grenzen stoßen als große gehostete Modelle.

Weniger gut passt Ollama als einzige Modellschicht, wenn dein Agent regelmäßig mit langen Sessions, vielen Tool‑Schemas, Vision‑Eingaben oder heiklen Sicherheitsentscheidungen umgehen muss. Die OpenClaw‑Doku zu lokalen Modellen warnt, dass Modelle mit weniger als 32 k Kontext‑Tokens und unter 16 k Kontext‑Tokens problematisch sein können.

Was du brauchst

  • funktionierende OpenClaw‑Installation (Gateway läuft)
  • laufender Ollama‑Dienst aus der aktuellen offiziellen Installation
  • mindestens ein lokal gezogenes Ollama‑Modell (z. B. ollama/qwen2.5:7b)
  • ausreichend RAM bzw. GPU‑Speicher für das gewählte Modell
  • Netzwerk‑Sicherheit: Ollama sollte nur auf 127.0.0.1 lauschen oder per VPN/SSH‑Tunnel geschützt sein

Setup‑Pfad: Ollama zuerst, dann OpenClaw

1. Ollama installieren & starten

# macOS (Homebrew) – erfordert macOS 14+ (Sonoma)
brew install ollama
# Linux – offizielles Install‑Script
curl -fsSL https://ollama.com/install.sh | sh

# Dienst starten (falls nicht automatisch)
ollama serve &

2. Modell ziehen

ollama pull qwen2.5:7b   # oder ein anderes Modell deiner Wahl
ollama list               # prüft, ob das Modell sichtbar ist

3. Endpoint prüfen

curl -s http://127.0.0.1:11434/api/tags | jq .models[0].name

Erwartete Ausgabe: qwen2.5:7b. Wenn hier ein Fehler erscheint, ist Ollama nicht korrekt erreichbar.

4. OpenClaw konfigurieren (bestehende Installation anpassen)

openclaw configure

Im Konfigurations‑Wizard wähle Provider → Ollama und trage exakt die Basis‑URL ein:

http://127.0.0.1:11434

Falls du bereits eine agents.defaults.models‑Allowlist nutzt, ergänze den Ollama‑Eintrag, damit das Modell angezeigt wird:

{
  agents: {
    defaults: {
      models: [
        "ollama/qwen2.5:7b",
        "ollama/*"   // optional, um alle lokalen Modelle zu erlauben
      ]
    }
  }
}

5. Modell‑Scan & Setzen

openclaw models scan          # erkennt neue lokale Modelle
openclaw models list          # prüft, ob qwen2.5:7b erscheint
openclaw models set ollama/qwen2.5:7b
openclaw models status        # bestätigt das primäre Modell

Hinweis: openclaw models set verwendet den vollen Alias ollama/qwen2.5:7b. Ein fehlender Präfix führt dazu, dass OpenClaw ein falsches Modell wählt.

6. Hybrid‑Setup (empfohlen)

Lokale Modelle sind oft nicht stark genug für sehr lange Kontext‑Fenster. Aktiviere daher Fallback‑Modelle aus der Cloud:

{
  agents: {
    defaults: {
      model: {
        primary: "ollama/qwen2.5:7b",
        mode: "merge",   // lokale Modelle zuerst, Cloud‑Fallbacks danach
        fallbacks: ["openrouter/anthropic/claude-opus-4.8"]
      }
    }
  }
}

Damit greift OpenClaw automatisch auf das Cloud‑Modell zurück, sobald das lokale Modell das Kontext‑Limit überschreitet.

Diagnose‑Leiter für langsame oder instabile Ollama‑Läufe

  1. Ollama‑Dienst prüfenollama list / curl …/api/tags.
  2. Endpoint prüfen – korrekte Basis‑URL ohne /v1.
  3. Modell‑Scan erneuernopenclaw models scan.
  4. Standardmodell verifizierenopenclaw models status.
  5. Hardware‑Grenzen prüfen – kurze Tests laufen, lange Sessions nicht → Modell zu klein oder zu stark quantisiert.
  6. Hybrid‑Fallback aktivierenmodels.mode: "merge".

Bildverarbeitung (optional)

Falls du Vision‑Modelle nutzen willst, prüfe, ob das Modell vision‑fähig ist (z. B. qwen2.5vl:7b). Dann setze zusätzlich:

{
  agents: {
    defaults: {
      imageModel: "ollama/qwen2.5vl:7b"
    }
  }
}

Aktiviere Vision‑Funktionen erst, wenn Text‑Läufe stabil sind – sonst erhöht sich die Latenz stark.

Sicherheitshinweise

  • Nur lokal: Lass Ollama auf 127.0.0.1 lauschen. Öffentliche IPs ohne Authentifizierung öffnen ein Sicherheitsrisiko.
  • Firewall / VPN: Wenn du Ollama auf einem anderen Rechner betreibst, sichere den Zugriff per Firewall‑Regel oder SSH‑Tunnel.
  • Kein API‑Key nötig: Für den nativen Ollama‑Endpoint wird kein Schlüssel benötigt, aber ein falscher Endpoint kann zu Fehlermeldungen führen, die wie Auth‑Probleme aussehen.

Reality‑Check

  • Ollama‑Basis‑URL ohne /v1 ist zwingend.
  • Modelle mit < 32 k Kontext‑Tokens können bei langen Agentenläufen schnell an Grenzen stoßen.
  • Hybride Setups (models.mode: "merge") bieten die robusteste Lösung für produktive Workflows.

Wenn du die Modellschicht breiter planen willst, passt dazu der separate Guide zu OpenClaw-Modellen, Providern und Fallbacks. Er erklärt, wo Provider-Konfiguration, Allowlist und Fallback-Reihenfolge auseinanderfallen.

Kurzantworten (FAQ)

  • Warum ist OpenClaw mit Ollama langsam? Meist zu kleines Modell, zu knappe Hardware oder falscher Endpoint.
  • Brauche ich einen API‑Key? Nein, nicht für den nativen Ollama‑Pfad.
  • Soll ich komplett auf lokal umstellen? Nur, wenn deine Hardware das Modell‑Größen‑ und Kontext‑Bedarf deckt. Hybride Setups sind sicherer.
  • Was ist der direkte Debug‑Pfad? ollama listcurl …/api/tagsopenclaw models scanopenclaw models status.

Weiterführende Literatur

Fazit

Ollama ist für OpenClaw ein guter lokaler Einstieg, aber kein Freifahrtschein für lange Agentenläufe. Behandle lokale Modelle als kontrollierte Runtime mit klaren Grenzen: Endpoint prüfen, Modell sichtbar machen, Hardware realistisch einschätzen und für produktive Workflows einen Cloud-Fallback bereithalten.


Dieser Guide ist Teil der OpenClaw‑Praxis‑Serie (Teil 4 von 6).

Transparenz

Agentenlog nutzt KI-Assistenz für Recherche, Struktur und Entwurf. Inhaltliche Auswahl, Einordnung und Veröffentlichung liegen redaktionell bei Agentenlog; Quellen und Fakten werden vor Veröffentlichung geprüft.