
Artikelübersicht: Hermes-Agent ist eine modellagnostische Open-Source-Agentenlaufzeit von Nous Research. OpenClaw ist ein Node.js-Personal-Assistenten-Gateway mit Kanälen für WhatsApp, Telegram, Slack und Discord. Paperclip ist ein Multi-Agenten-Orchestrator, der den Hermes-Agenten als verwalteten Mitarbeiter aufrufen kann. Hermes 4 wird in 70B und 405B ausgeliefert (August 2025); Hermes 3 gewinnt weiterhin bei günstigen VPS-Bereitstellungen mit seinen Größen 3B und 8B.
Der Open-Source-KI-Agentenbereich sieht im Jahr 2026 anders aus als vor einem Jahr. Hermes vs OpenClaw ist keine Nischendebatte mehr, und die Wahl des Modells zwischen Hermes 3 und Hermes 4 ist jetzt genauso wichtig wie die Agentenlaufzeit, die davor sitzt. Dieser Artikel vergleicht den Hermes-Agenten mit OpenClaw und Paperclip und erläutert dann Hermes 3 versus Hermes 4, damit du das richtige Modell mit der richtigen Laufzeit auf einem Contabo VPS kombinieren kannst.
Open-Source-KI-Agenten im Jahr 2026: Eine schnelle Übersicht
Drei Projekte dominieren das Self-Hosting-Gespräch. Hermes-Agent (die Open-Source-Agentenlaufzeit von Nous Research) richtet sich an Entwickler, die einen kleinen, skriptbaren Prozess auf einem einzelnen VPS laufen lassen möchten, mit Unterstützung für eigene Modelle über Nous Portal, OpenRouter, OpenAI, NovitaAI, NVIDIA NIM, Hugging Face und lokale Endpunkte. OpenClaw zielt auf die Achse des persönlichen Assistenten ab: ein Node.js-Gateway, das sich auf Messaging-Kanäle wie WhatsApp, Telegram, Slack, Discord, iMessage, Signal, Teams und Matrix verteilt, mit integrierten Fähigkeiten und Tool-Nutzung. Paperclip AI Hermes-Integrationen sitzen eine Ebene höher, da Paperclip ein Multi-Agenten-Orchestrator ist, der Aufgaben an Worker-Agenten delegiert, und der Hermes-Agent einen offiziellen hermes_local Adapter zur Verwendung als verwalteter Mitarbeiter innerhalb einer Paperclip-Firma mitbringt. Unter allen dreien liegen die tatsächlichen Sprachmodelle, und die Kombination, die du wählst, entscheidet über die Kosten, den VRAM und wie viel Kleber-Code du selbst schreiben musst.
Hermes-Agent vs OpenClaw: Im Vergleich
Die kürzeste Antwort bei Hermes-Agent vs OpenClaw ist diese: Der Hermes-Agent optimiert den serverseitigen Fußabdruck und das Scripting, OpenClaw optimiert die Erreichbarkeit über mehrere Kanäle als persönlicher Assistent. Der folgende Vergleich zwischen OpenClaw und dem Hermes-KI-Agenten deckt die sechs Dimensionen ab, die die Bereitstellungsentscheidungen beeinflussen.
| Dimension | Hermes Agent | OpenClaw |
|---|---|---|
| Primärer Formfaktor | Kopfloser Daemon, CLI, HTTP-API auf Port 8642 | Node.js-Gateway (npm/pnpm/bun), läuft auf macOS/Linux/Windows über WSL2 |
| Standardmodell | Modellagnostisch; unterstützt Nous Portal, OpenRouter, OpenAI, NovitaAI, NVIDIA NIM, HF, lokal | Bring-your-own-, Anthropic/OpenAI/lokale Modelle |
| Plugin / Tool-Ökosystem | Kleinere, Code-first Tool-Definitionen | Skills + Kanaladapter (WhatsApp, Telegram, Slack, Discord, iMessage, Signal, Teams, Matrix) |
| Minimales VPS-Profil | 4 GB RAM, 2 vCPU für kleine Modelle | 8 GB RAM, 4 vCPU empfohlen |
| GPU-Anforderung | Optional für 7B-13B, erforderlich für 70B+ | Optional, hängt vom Modell-Backend ab |
| Lizenz | Open source | Open source |
Wann du den Hermes-Agenten gegenüber OpenClaw wählen solltest
Wähle die Hermes-Agent-vs-OpenClaw-Seite, wenn die Bereitstellung Server-first ist und dir planbare Kosten wichtig sind:
- Du lässt den Agenten auf einem VPS ohne Desktop laufen und erreichst ihn über SSH oder HTTP.
- Du willst einen kleinen Prozess, der sich ohne zusätzliche Adapter sauber mit Hermes 3 oder Hermes 4 kombinieren lässt.
- Deine Toolchain ist Code, keine GUI: n8n-Flows, Cron-Jobs, Shell-Skripte oder dein eigenes Backend.
- Du musst mit 4–8 GB RAM auf einer Budget-VPS-Instanz auskommen.
- Du willst den einfachstmöglichen Upgrade-Pfad zwischen den Hermes-Modellversionen.
Wann du OpenClaw dem Hermes-Agenten vorziehen solltest
Wähle OpenClaw, wenn dir die sichtbare Benutzeroberfläche wichtiger ist als der Server-Fußabdruck:
- Du willst einen persönlichen Assistenten, der über WhatsApp, Telegram, Slack, Discord, iMessage, Signal, Teams oder Matrix erreichbar ist.
- Du willst eine Node.js-Codebasis, die du mit eigenen Skills erweitern kannst.
- Die Bereitstellung ist für eine einzelne Workstation oder einen kleinen privaten Server gedacht, nicht für eine ganze Produktionsflotte.
- Du planst, Anthropic-, OpenAI- und lokale Modelle hinter einem einzigen Assistenten zu kombinieren.
Migration von OpenClaw zum Hermes-Agenten
Bei der Migration von OpenClaw zu Hermes geht es hauptsächlich darum, Prompts und Tool-Definitionen zu exportieren und sie dann auf den HTTP-Endpunkt des Hermes-Agenten umzuleiten. Der Migrationsbefehl unten setzt voraus, dass du bereits ein OpenClaw-Workspace-Bundle exportiert hast.
hermes-agent import --from openclaw --bundle ./openclaw-export.zip --target http://127.0.0.1:8642Lass nach dem Import deine Test-Prompts noch einmal gegen den neuen Endpunkt laufen, bevor du die OpenClaw-Installation abschaltest.
Hermes-Agent vs. Paperclip: Einzelner Agent oder Multi-Agenten-Organisation?
Die Frage „Paperclip KI oder Hermes“ ist kein direktes Duell: Paperclip ist ein Orchestrator, der Hermes-Agent ist ein Worker, und die beiden sind dafür gedacht, über den offiziellen zusammenzuspielen hermes-paperclip-adapter. Nutze den Hermes-Agenten allein, wenn ein einziger, gut geprompteter Prozess den Job erledigen kann: ein einfacher Triage-Flow für den Posteingang, ein Code-Review-Bot oder ein Kundensupport-Assistent. Nutze Paperclip, wenn du mehrere spezialisierte Agenten brauchst, die sich gegenseitig Aufgaben übergeben – jeder mit eigenen Prompts und Tools. In einer Paperclip-Topologie wird der Hermes-Agent als ein hermes_local von verwalteter Mitarbeiter innerhalb einer Paperclip-Firma registriert – meistens als der günstige, schnelle Worker für eine oder mehrere Rollen, während ein größeres Modell für den Planer reserviert bleibt. Die richtige Frage lautet selten „Hermes-Agent oder Paperclip?“, sondern eher, ob die Workload die Aufgabe für einen einzelnen Agenten oder für ein ganzes Team ist.
Andere Alternativen zum Hermes-Agenten, die man kennen sollte
Wenn weder der Hermes-Agent noch OpenClaw oder Paperclip passen, fallen oft drei andere Namen, wenn Leute nach der besten Alternative für Hermes KI suchen. Die Diskussion um Frameworks für Hermes-KI-Agenten umfasst sowohl leichtgewichtigere Skript-Bibliotheken als auch schwerere Orchestratoren.
| Alternative | Am besten für | Trade-off |
|---|---|---|
| LangGraph | Graphbasierte, zustandsbehaftete Agenten-Workflows in Python | Steilere Lernkurve als bei einem Agenten mit nur einem einzelnen Prozess |
| AutoGen | Multi-Agenten-Konversationsmuster mit Rollenspielen | Das konversationsgesteuerte Modell reift in den Tools für den Produktionseinsatz gerade noch heran |
| CrewAI | Kleine Teams von rollenbasierten Agenten mit klaren Aufgaben und Rollen | Für komplexe, nicht-lineare Workflows weniger flexibel als LangGraph |
Betrachte die Tabelle als eine Einstiegsliste, nicht als Ranking. Die richtige Wahl hängt davon ab, ob du eine Bibliothek, eine Laufzeit oder einen Orchestrator suchst.
Hermes 3 vs. Hermes 4: Vollständiger Modellvergleich
Hermes 3 KI und Hermes 4 KI sind die beiden Modellgenerationen von Nous Research, zwischen denen du 2026 die Wahl hast. Die Entscheidung für das richtige Hermes-KI-Modell bildet die Basis für jede oben genannte Agenten-Wahl: Eine grandiose Laufzeit kann ein zu schwaches Modell nicht retten, und ein überdimensioniertes Modell verschwendet nur dein VPS-Budget. Die Modellreihe rund um Hermes 3 KI ist älter, breiter gefächert und wird in den Größen 3B, 8B, 70B und 405B angeboten. Das Modell Hermes 4 KI ist neuer (veröffentlicht im August 2025), kommt in den Größen 70B und 405B und bringt Logikfunktionen im Hybridmodus mit.
Hermes 3 KI-Modell: Größen, Varianten und beste Anwendungsfälle
Das Hermes 3 KI-Modell wird in den Größen 3B, 8B, 70B und 405B ausgeliefert, die alle auf Llama 3.1 oder 3.2 feinabgestimmt sind. Die Bezeichnung Hermes 13B KI bezieht sich auf das alte Nous-Hermes-Llama2-13B-Feintuning und ist keine Größe von Hermes 3. Die Modellmarke Nous Hermes 3 KI umfasst auch unzensierte Varianten für Forschungszwecke. Die folgende Tabelle dient als grobe Orientierung für die Größen. Gleich die exakten Zahlen mit der offiziellen Model-Card von Nous Research ab, bevor du die Größe deines VPS festlegst.
| Modell | VRAM (GPU) | Reine CPU-Nutzung machbar? | Am besten für |
|---|---|---|---|
| Hermes 3 3B | ~3-6 GB | Ja | Edge und Budget-VPS-Chat |
| Hermes 3 8B | ~16 GB FP16, ~8 GB 4-Bit | Ja, langsam | Günstiger VPS-Chat und Tool-Nutzung |
| Hermes 3 70B | ~140 GB FP16, ~40 GB 4-Bit | Nein | Höherwertiges Denken auf GPU-Servern |
| Hermes 3 405B | ~810 GB FP16, ~430 GB FP8 | Nein | Forschung und Benchmarking auf Multi-GPU-Rigs |
| Nous-Hermes-Llama2-13B (Legacy-Hermes-13B-KI) | ~26 GB FP16, ~8 GB 4-Bit | Geringfügig | Legacy-Projekte, die immer noch an Llama 2 gebunden sind |
| Unzensierte Hermes 3 KI-Modellvarianten | Gleich wie Basiszustand | Gleich wie Basis | Red-Teaming-Forschung, Fiktion, Richtlinien-Tests |
Hermes 4 KI-Modell: Was sich geändert hat und wer upgraden sollte
Die Modellreihe rund um Hermes 4 KI wird in den Größen 70B und 405B angeboten, wurde am 26. August 2025 veröffentlicht und bringt im Vergleich zu Hermes 3 Logikfunktionen im Hybridmodus mit. Open-Source-KI-Modellveröffentlichungen für Hermes 4 werden auf Nous Research und Hugging Face getrackt. Mach ein Upgrade, wenn dein Engpass die Antwortqualität ist und nicht die Infrastrukturkosten. Bleib bei Hermes 3, wenn du an RAM- oder VRAM-Grenzen stößt oder die Größen 3B oder 8B brauchst.
Ältere Hermes-Modelle: Nous Hermes 2, Chronos-Hermes, OpenHermes
Mehrere frühere Hermes-Varianten tauchen immer noch in Tutorials und Community-Repos auf:
- Nous Hermes 2: Die Vorgängerreihe von Hermes 3, wobei der Mixtral 8x7B DPO-Release vom Januar 2024 in der Community immer noch aktiv genutzt wird.
- Chronos-Hermes: Ein 13B-Merge von Austism, der sich auf lange erzählerische Kontexte und Rollenspiele konzentriert und oft über TheBloke-Quantisierungen bereitgestellt wird.
- OpenHermes: Ein offenes Release basierend auf Mistral 7B-Feintunings, das oft als Anschauungsbeispiel genutzt wird.
- Nous-Hermes-Llama2-13B: Ein 13B-Feintuning aus der Llama-2-Ära vom Juli 2023, das immer noch in Legacy-Projekten vorkommt.
- DeepHermes 3: Ein Preview-Feintuning mit Fokus auf Logikfunktionen von Llama 3 8B vom Februar 2025.
Betrachte diese als Legacy, es sei denn, ein ganz bestimmter Workflow setzt sie zwingend voraus. Neue Bereitstellungen sollten direkt mit Hermes 3 oder Hermes 4 starten.
Den Hermes-Agenten lokal mit Hermes 3 oder Hermes 4 verknüpfen
Um den Hermes-Agenten mit einem lokalen Hermes-KI-Modell auf einem VPS zu verknüpfen, geh die folgenden Schritte durch. Sie setzen Ubuntu 22.04, Root-SSH-Zugriff und voraus, dass der Agent als systemd-Dienst läuft:
- Stell einen VPS bereit, der für das Zielmodell ausgelegt ist: 4 GB RAM für Hermes 3 3B, mindestens 16 GB für Hermes 3 8B und mehr.
- Installiere die Hermes-Agentenlaufzeit und überprüfe, ob der Dienst auf
API_SERVER_PORT8642 lauscht. Der Hermes-Agent ist auch als kostenloses 1-Klick-Add-On für deinen Server verfügbar, was dir einen Teil der Einrichtung erspart. - Zieh dir die gewählten Gewichte von Hermes 3 oder Hermes 4 aus der offiziellen Quelle von Nous Research.
- Registriere das Modell in der Agenten-Konfiguration und jag einen Smoke-Test-Prompt gegen den lokalen Endpunkt.
- Verbinde den Endpunkt über dieselbe HTTP-API mit deinen Tools (n8n, Skripte oder Paperclip KI).
Entscheidungsmatrix: Wähle deinen Stack in 60 Sekunden
Nutze die Tabelle unten als Ausgangspunkt. Wähle die Zeile, die zu deinem primären Anwendungsfall passt, und lies die empfohlene Kombination aus Agent und Modell ab.
| Anwendungsfall | Agent | Modell |
|---|---|---|
| Einzel-VPS-Chatbot oder Tool-Nutzungsbot | Hermes Agent | Hermes 3 3B oder 8B |
| Persönlicher Assistent über Messaging-Kanäle | OpenClaw | Gehosteter Claude oder OpenAI oder lokales Hermes 3 8B |
| Multi-Agenten-Inhaltspipeline | Paperclip KI koordiniert Hermes-Agenten-Worker | Hermes 4 70B-Planer, Hermes 3 8B-Arbeiter |
| Hochwertige Logikfunktionen auf einem GPU-Server | Hermes Agent | Hermes 4 70B oder Hermes 3 70B |
| Forschung zu unzensierten Varianten | Hermes Agent | Unzensierte Hermes 3 Variante |
Warum du deinen Hermes-Vergleichsstack auf Contabo selbst hosten solltest
Das Self-Hosting vom Hermes-Agenten, OpenClaw oder Paperclip KI auf einem Contabo-VPS oder GPU-Server gibt dir monatlich planbare Kosten, die volle Kontrolle darüber, welche Modellgewichte du lädst, und die Option, Prompts und Kundendaten auf einer von dir betriebenen Infrastruktur zu behalten. Derselbe VPS kann heute die Agentenlaufzeit und in einem Jahr die nächste Modellgeneration hosten – ganz ohne den Anbieter zu wechseln oder Gebühren pro Token zu zahlen.
FAQ: Hermes-Agent und Hermes-Modelle im Vergleich
Der Hermes-Agent ist eine kleine Open-Source-KI-Agentenlaufzeit von Nous Research, die als kopfloser Dienst auf einem VPS läuft und sich mit jedem unterstützten Modellanbieter kombinieren lässt – natürlich auch mit der Hermes-Familie. OpenClaw ist ein Node.js-Gateway für persönliche Assistenten, das Kanäle wie WhatsApp, Telegram, Slack und Discord mit einem ausgewählten Modell-Backend verbindet. Die Wahl zwischen OpenClaw und Hermes läuft meistens darauf hinaus, ob du einen serverseitigen Agenten oder einen kanalübergreifenden persönlichen Assistenten brauchst.
Hermes 4 KI ist die neuere Generation von Nous Research, die im August 2025 in den Größen 70B und 405B mit Logikfunktionen im Hybridmodus veröffentlicht wurde. Ob es für dich besser ist, hängt ganz von deiner Workload ab. Hermes 4 gewinnt am oberen Ende bei der Antwortqualität, während die Entscheidung für das Hermes-KI-Modell oft auf Hermes 3 fällt, wenn VPS-Kosten, ein kleinerer VRAM, die Größen 3B oder 8B oder unzensierte Varianten eine wichtigere Rolle spielen.
Es gibt nicht die eine beste Alternative für Hermes KI. Die passende Alternative zum Hermes-KI-Agenten hängt ganz von der Struktur ab. Für die Multi-Agenten-Orchestrierung kommt Paperclip KI dem Ganzen am nächsten. Für graphbasierte Python-Workflows ist LangGraph ideal geeignet. Für kanalübergreifende persönliche Assistenten ist OpenClaw die beste Entsprechung. Wähle zuerst nach der Bereitstellungsstruktur und erst danach nach der Modellkompatibilität aus.
Ja, das klappt für das alte Hermes-13B-KI-Feintuning (Nous-Hermes-Llama2-13B) auf einem ausreichend dimensionierten VPS – wobei die praktische Untergrenze bei etwa 16 GB RAM für eine reine CPU-gestützte 4-Bit-Inferenz oder bei einem kleinen GPU-Tarif für brauchbare Geschwindigkeiten liegt. Das Modell Hermes 3 70B KI spielt in einer ganz anderen Liga: Plane hierfür lieber einen GPU-Server mit rund 140 GB VRAM bei FP16 oder ~40 GB bei einer 4-Bit-Quantisierung ein, statt eines Standard-VPS. Passe beim Hermes 3 KI-Modell die Größe ganz allgemein an dein RAM- und VRAM-Budget an, bevor du die genaue Variante wählst.
Ja. Die Hermes-Integrationen von Paperclip KI sind dank des offiziellen erstklassig gelöst
Das GitHub-Repository des Hermes-Agenten wird von Nous Research unter https://github.com/nousresearch/hermes-agent veröffentlicht. Überprüfe die exakte GitHub-URL des Hermes-Agenten auf der Website von Nous Research, bevor du das Repo klonst, da einige Community-Forks ganz ähnliche Namen verwenden. Setz in der Produktion lieber auf ein festes, veröffentlichtes Release-Tag, anstatt direkt den Standard-Branch zu tracken.
Eine unzensierte Variante des Hermes 3 KI-Modells ist eine Version von Hermes 3 mit reduziertem Verweigerungsverhalten, die für Forschung, Red-Teaming und kreative Anwendungsfälle gedacht ist. Die unzensierten Versionen von Hermes 3 KI teilen sich die gleiche Basisarchitektur mit der Standard-Modellreihe von Hermes 3, weshalb die VRAM- und CPU-Profile exakt mit der jeweiligen Basisgröße übereinstimmen. Geh mit ihnen mit der gleichen Vorsicht um, die du bei jedem unzensierten Modell walten lassen würdest, und wirf vorher einen Blick auf die Acceptable-Use-Policy deines Hosting-Anbieters.