Hermes Agent: Der selbstverbessernde Open-Source-Konkurrent zu Claude Code
Kaum ein Thema wird in der Entwickler- und Infrastruktur-Community derzeit so intensiv diskutiert wie agentische KI-Systeme, die nicht nur Aufgaben ausführen, sondern aus ihrer eigenen Arbeit systematisch lernen. Mit Hermes Agent hat Nous Research im Frühjahr 2026 genau in diese Debatte hineingetroffen. Das Projekt ist innerhalb weniger Wochen auf über 100.000 GitHub-Stars gewachsen, hat sich beim Tokenvolumen auf OpenRouter auf Platz zwei etabliert und wird in vielen technischen Kreisen bereits als ernstzunehmender Gegenpol zu Claude Code betrachtet.
Der Grund für diese Aufmerksamkeit liegt nicht allein in der Open-Source-Lizenz oder in der Möglichkeit, Hermes selbst zu hosten. Entscheidend ist vor allem das Architekturprinzip: Hermes ist darauf ausgelegt, sich nach erledigten Aufgaben selbst zu verbessern. Es schreibt und aktualisiert Skills, verdichtet Erinnerungen, reflektiert in festen Intervallen über vergangene Sitzungen und modelliert den Nutzerkontext, ohne dass dafür ständig manuelle Eingriffe nötig wären. Genau diese Kombination macht das System für Unternehmen, technische Teams und Strategieverantwortliche relevant.
Für Leserinnen und Leser aus Konzernen, Mittelstand und technologiegetriebenen Organisationen ist das deshalb nicht nur eine Produktmeldung. Hermes steht exemplarisch für eine neue Generation von KI-Agenten, bei denen der eigentliche Wettbewerbsvorteil nicht mehr nur im zugrundeliegenden Modell liegt, sondern in der Lernarchitektur rund um das Modell: Wie gut speichert ein System Wissen? Wie sauber kann es projektbezogene Regeln aufbauen? Wie nachhaltig lassen sich wiederkehrende Abläufe in maschinenlesbare Betriebslogik übersetzen? Und unter welchen Governance-Bedingungen ist ein solcher Agent produktiv nutzbar?
Der folgende Artikel analysiert Hermes Agent im Detail: seine Herkunft, die technische Architektur, den Self-Improvement Loop, die Unterschiede zu Claude Code, Deployment-Optionen, Chancen für Unternehmen sowie Risiken, Kosten und strategische Implikationen. Ziel ist keine Hype-Beschreibung, sondern eine nüchterne Einordnung dessen, was Hermes heute schon kann und warum das Konzept dahinter über das einzelne Projekt hinausweist.
Warum Hermes Agent derzeit überall diskutiert wird
Dass ein Open-Source-Projekt in kurzer Zeit eine sechsstellige Star-Zahl auf GitHub erreicht, ist selten genug. Noch seltener ist, dass diese Dynamik mit echter operativer Nutzung korreliert. Bei Hermes scheint genau das der Fall zu sein. Das System ist nicht bloß ein Showcase oder Forschungsexperiment, sondern wird bereits produktiv in Entwicklungs-, Recherche- und Automatisierungsszenarien eingesetzt. Die Platzierung auf OpenRouter hinter Claude Code, gemessen am Tokenvolumen, deutet darauf hin, dass es sich nicht nur um kurzlebige Neugier handelt, sondern um reale Last auf realen Arbeitsprozessen.
Der Zeitpunkt ist ebenfalls bemerkenswert. Seit Monaten suchen Teams nach Wegen, agentische Entwicklungsumgebungen stärker unter Kontrolle zu bringen. Viele nutzen Claude Code wegen seiner praktischen Fähigkeiten beim Navigieren in Codebasen, beim Bearbeiten von Dateien und bei Tool-gestützter Problemlösung. Gleichzeitig wächst aber das Interesse an Alternativen, die offener, flexibler und unternehmenskontrollierbar sind. Self-Hosting, Integration in bestehende Systeme, geringere Lock-in-Risiken und bessere Steuerbarkeit von Speichermechanismen sind hier zentrale Anforderungen.
Hermes trifft diesen Bedarf in mehreren Dimensionen gleichzeitig:
- Open Source und MIT-Lizenz: Unternehmen können den Agenten prüfen, anpassen und in eigene Plattformen integrieren.
- Self-Hosting: Der Betrieb auf Linux, macOS, WSL2 oder eigenen Servern ist möglich.
- Mehrkanal-Integration: Telegram, Slack, WhatsApp und Discord können angebunden werden.
- Persistentes Lernen: Skills, Memory-Dateien, SQLite-Langzeitgedächtnis und periodische Selbstreflexion greifen ineinander.
- Tool-Orientierung: Hermes arbeitet nicht nur textuell, sondern mit Tool Calls, Dateien, Recherche und Prozessschritten.
Die eigentliche Aufmerksamkeit entsteht aber vor allem aus einem Architekturversprechen: Hermes will nicht bei jedem neuen Task wieder bei null beginnen. Stattdessen soll jede erfolgreich oder auch fehlerhaft bearbeitete Aufgabe in ein besseres Systemverhalten für die nächste Aufgabe übersetzt werden. Damit verschiebt sich der Fokus von einmaliger Modellleistung hin zu kumulativer operativer Intelligenz.
Für Unternehmen ist das relevant, weil ein erheblicher Teil der wertschöpfenden KI-Nutzung nicht aus singulären Prompts besteht, sondern aus wiederkehrenden Mustern: Release-Prozesse, Dokumentationsregeln, Reporting-Routinen, Incident-Kommunikation, Analystenbriefings, CRM-Updates, Code-Konventionen, Sicherheitsprüfungen oder branchenspezifische Freigabeprozesse. Wenn ein Agent lernt, diese Muster stabil abzubilden, steigt sein Nutzen weit über die Qualität eines einzelnen Basismodells hinaus.
Wer ist Nous Research?
Hermes Agent stammt von Nous Research, einer Forschungs- und Entwicklungsorganisation, die sich in den vergangenen Jahren vor allem mit offenen Modellfamilien, experimentellen Trainingsansätzen und einer bewusst community-nahen Open-Source-Strategie einen Namen gemacht hat. Nous Research wird in der öffentlichen Wahrnehmung häufig als Gegenpol zu stärker abgeschotteten KI-Anbietern verstanden: weniger Plattform-Exklusivität, mehr Offenheit für Reproduzierbarkeit, Anpassung und gemeinschaftsgetriebene Weiterentwicklung.
Die Organisation ist in New York verortet und hat sich mit der Hermes-Modellfamilie bereits vor Hermes Agent eine erkennbare Marke aufgebaut. In Entwicklerkreisen steht der Name Hermes seit längerem für leistungsfähige, instruktionstaugliche Open-Model-Varianten, die oft mit Fokus auf praktische Nutzbarkeit statt rein benchmarkgetriebener Präsentation entwickelt wurden. Hermes Agent überträgt diesen Anspruch nun auf die Ebene des agentischen Systems.
Das ist ein wichtiger Unterschied. Zwischen einem guten Sprachmodell und einem guten Agenten liegt ein erheblicher technischer und organisatorischer Abstand. Ein Modell beantwortet Fragen oder erzeugt Inhalte. Ein Agent muss dagegen Werkzeuge orchestrieren, Kontext priorisieren, Entscheidungen über Speichern und Vergessen treffen, Nebenbedingungen berücksichtigen und über längere Interaktionen konsistent bleiben. Genau hier zeigt sich, ob eine Organisation in der Lage ist, aus Modellen belastbare Systeme zu bauen.
Nous Research verfolgt dabei eine Open-Source-Mission, die aus Unternehmenssicht ambivalent, aber hochinteressant ist. Einerseits sorgt Offenheit für hohe Innovationsgeschwindigkeit, schnelle Fehlerfindung und breite Adaption. Andererseits entsteht dadurch keine klassische Enterprise-Produktgarantie mit SLA, dediziertem Support und vordefinierten Compliance-Artefakten. Für Entscheider ist das kein Ausschlusskriterium, wohl aber ein Hinweis darauf, dass Hermes eher als technologische Plattformkomponente denn als sofort vollständig verpacktes Enterprise-Produkt zu betrachten ist.
Gerade darin liegt für viele Organisationen aber auch der Reiz. Wer nicht auf eine geschlossene Agentenplattform festgelegt sein will, sondern einen Agenten in bestehende Sicherheits-, Daten- und Prozesslandschaften integrieren möchte, findet in einem offenen Projekt oft die besseren Ansatzpunkte. Hermes ist deshalb nicht nur als Tool relevant, sondern als Referenz dafür, wie sich offene Agenten-Stacks in den nächsten Jahren entwickeln könnten.
Architektur-Überblick: Was Hermes Agent technisch besonders macht
Auf hoher Ebene ist Hermes Agent ein agentisches System, das auf Sprachmodelle zugreift, Tool Calls ausführt, Dateien bearbeitet, Recherchen anstößt und über mehrere Speicher- und Lernschichten verfügt. Die Architektur ist darauf ausgelegt, kurzzeitige Task-Ausführung mit längerfristigem Wissensaufbau zu verknüpfen. Statt eines einzigen, unstrukturierten Kontexts kommen mehrere Ebenen zusammen:
- Akuter Arbeitskontext: die aktuelle Aufgabe mit ihren Tool Calls, Dateien und Zwischenschritten.
- Projekt-Memory: eine bewusst knappe Datei für stabile Fakten zum Projekt.
- Nutzer-Memory: eine ebenfalls knappe Datei für Präferenzen, Stil und Eigenschaften des Nutzers.
- Skills: Markdown-Anleitungen für wiederkehrende Aufgaben oder Problemlösungsmuster.
- Session-Historie in SQLite: ein langfristiger Speicher mit Volltextsuche über vergangene Interaktionen.
- Reflexionsmechanismen: automatische Konsolidierung wichtiger Erkenntnisse in festen Intervallen.
- Honcho/Dialect: ein separates User-Modeling, das Hypothesen über den Nutzer bildet, prüft und verdichtet.
Damit folgt Hermes einem Muster, das man als mehrschichtige Gedächtnisarchitektur beschreiben kann. Das aktuelle Fenster des Modells wird nicht mit allem überladen, was je passiert ist. Stattdessen wird Relevanz organisiert: Was ist dauerhafter Projektfakt? Was ist persönliche Präferenz? Was ist eine verallgemeinerbare Arbeitsanweisung? Was ist nur historisch auffindbar, aber nicht immer aktiv? Diese Trennung ist für Agentensysteme entscheidend, weil sie dem zentralen Problem vieler Prompt-getriebener Ansätze begegnet: Kontexte wachsen unkontrolliert und werden über die Zeit unbrauchbar.
Claude Code kennt ebenfalls Speicher- und Skill-Konzepte. Der zentrale Unterschied bei Hermes liegt jedoch in der Konsequenz, mit der daraus ein dauerhafter Lernzyklus gemacht wird. Hermes prüft nach erledigten Aufgaben aktiv, ob sich aus der Interaktion ein neuer Skill ableiten lässt. Existiert bereits ein passender Skill, wird dieser aktualisiert. Zusätzlich zwingt die Zeichenbegrenzung in den Memory-Dateien zu Priorisierung statt Akkumulation. Das System ist also nicht nur speichernd, sondern selektiv und verdichtend angelegt.
Für technische Entscheider lohnt sich, Hermes nicht als „ein weiteres Coding-Tool“ zu betrachten, sondern als einen modularen Agenten-Stack mit vier Kernfunktionen:
- Ausführen: Tasks mit Tool Calls, Dateioperationen und Recherchen bearbeiten.
- Abstrahieren: wiederkehrende Muster in Skills überführen.
- Verdichten: wichtige Fakten in begrenzte Memory-Strukturen konsolidieren.
- Personalisieren: Nutzerprofile automatisch aufbauen und in den Kontext einfließen lassen.
Gerade die Kombination dieser vier Funktionen erklärt, warum Hermes mehr ist als ein Funktionsvergleich zu Claude Code. Es ist ein anderer Ansatz dafür, wie ein Agent dauerhaft besser werden kann.
Der Self-Improvement Loop im Detail
Der zentrale Innovationspunkt von Hermes Agent ist der Self-Improvement Loop. Er beschreibt keinen singulären Trainingsprozess im Hintergrund, sondern eine laufende operative Schleife, in der das System aus erledigten Aufgaben unmittelbar Verhaltenswissen ableitet. Diese Schleife ist der Grund, warum viele Beobachter Hermes als strukturell interessanter einstufen als klassische Agenten mit bloßem Session-Memory.
Wichtig ist dabei: „Selbstverbesserung“ bedeutet hier nicht, dass das zugrundeliegende Basismodell neu trainiert würde. Vielmehr optimiert Hermes die Verwendung des Modells durch bessere Anleitung, bessere Verdichtung, bessere Erinnerung und bessere Personalisierung. In Unternehmenskontexten ist genau das oft wertvoller als theoretische Modellverbesserung, weil operative Produktivität nicht nur von Rohintelligenz, sondern von Kontextqualität abhängt.
1. Aufgabenbearbeitung: Der Nutzer stellt eine Aufgabe, Hermes arbeitet sie ab
Der Einstieg ist klassisch agentisch: Ein Nutzer gibt eine Aufgabe vor, Hermes analysiert das Ziel und arbeitet die Aufgabe mit den verfügbaren Werkzeugen ab. Dazu können Tool Calls, Dateizugriffe, Recherchen, Codebearbeitung oder andere Arbeitsschritte gehören. Die Relevanz dieses ersten Schritts wird leicht unterschätzt, denn hier entsteht das Rohmaterial für alle späteren Lernprozesse.
Anders als einfache Chat-Interaktionen hinterlässt agentische Arbeit eine strukturierte Spur: Welche Werkzeuge wurden benötigt? Welche Zwischenschritte waren erfolgreich? Wo traten Fehler auf? Welche Datenquellen wurden konsultiert? Welche Dateiänderungen waren notwendig? Diese Prozessspur ist wesentlich aussagekräftiger als ein bloßer Prompt-und-Response-Verlauf. Hermes kann daraus erkennen, ob die Aufgabe trivial war oder ob sie mehrere koordinierte Schritte erforderte.
Für Unternehmensanwendungen ist das entscheidend. Wiederkehrende Routineprozesse bestehen fast nie aus einer einzigen Textgenerierung. Typisch sind vielmehr Sequenzen wie:
- Daten abrufen
- Quellen vergleichen
- Formatvorgaben prüfen
- Dateien oder Datensätze aktualisieren
- Ausgaben in einem Zielsystem bereitstellen
- Kommunikationskanäle bespielen
Genau solche Ketten sind für Hermes das Material, aus dem sich später Skills ableiten lassen. Der Agent betrachtet eine Aufgabe daher nicht nur als zu lösendes Problem, sondern auch als potenziellen Kandidaten für organisatorisches Lernen.
2. Nach jeder Aufgabe prüft Hermes, ob ein neuer Skill erstellt werden soll
Der zweite Schritt ist der eigentliche Wendepunkt der Architektur. Nach Abschluss einer Aufgabe bewertet Hermes, ob das Vorgehen so relevant oder komplex war, dass daraus ein Skill entstehen sollte. Als Faustregel gilt: Wenn mehr als fünf Tool Calls notwendig waren, ist die Wahrscheinlichkeit hoch, dass ein wiederverwendbares Muster vorliegt und deshalb ein Skill erzeugt wird.
Diese Heuristik ist pragmatisch und aus Systemsicht sinnvoll. Nicht jede Kleinigkeit sollte in einen Skill überführt werden; sonst entsteht Skill-Inflation und die Qualität der Bibliothek sinkt. Wenn jedoch mehrere Werkzeuge koordiniert werden mussten, spricht das für eine gewisse Komplexität, Wiederholbarkeit oder Fehleranfälligkeit. Genau dort lohnt es sich, das Vorgehen explizit niederzuschreiben.
Skills liegen als Markdown-Anleitungen vor. Das klingt unspektakulär, ist aber strategisch klug. Markdown ist leicht lesbar, versionierbar, diff-fähig und mit gängigen Entwicklungs- und Dokumentationsworkflows kompatibel. Unternehmen können Skills prüfen, committen, auditiert nachverfolgen und gegebenenfalls über Pull Requests oder Freigaben steuern. Damit wird das implizite Wissen des Agenten in ein überprüfbares Artefakt übersetzt.
Man kann sich einen Skill als standardisierte Betriebsanweisung für den Agenten vorstellen. Ein solcher Skill kann beschreiben:
- Wann ein bestimmter Workflow anzuwenden ist
- Welche Tools in welcher Reihenfolge typischerweise genutzt werden
- Welche Prüfungen vor einem Ergebnis nötig sind
- Welche Formatvorgaben oder Qualitätsstandards gelten
- Welche typischen Fehlerquellen es gibt
- Welche Sonderfälle berücksichtigt werden müssen
Damit ähnelt der Mechanismus weniger einem flüchtigen Chat-Memory und stärker einer automatisierten Wissensdokumentation. Für Unternehmen ist das ein potenziell großer Vorteil: Wenn ein Agent nicht nur arbeitet, sondern seine erfolgreiche Arbeitsweise in standardisierte Anleitungen überführt, entsteht im besten Fall ein wachsender Korpus von digitalem Betriebswissen.
3. Existiert bereits ein Skill, aktualisiert Hermes ihn selbstständig
Der wohl wichtigste Unterschied zu Claude Code zeigt sich im dritten Schritt. Hermes erzeugt nicht nur neue Skills, sondern aktualisiert bestehende Skills selbstständig, wenn neue Aufgaben zeigen, dass eine bestehende Anleitung unvollständig, verbesserungsbedürftig oder fehlerhaft ist. Das ist mehr als Komfort. Es ist der Kern des dauerhaften Lernzyklus.
Viele Agentensysteme haben zwar die Möglichkeit, Wissen oder Regeln abzulegen, behandeln diese Artefakte dann aber eher statisch. Sie werden erzeugt und bleiben bestehen, bis ein Mensch oder eine explizite Aufforderung ihre Überarbeitung anstößt. Hermes verfolgt stattdessen einen dynamischen Ansatz: Skills sind lebende Dokumente, die aus der Nutzung heraus korrigiert und verfeinert werden.
Das hat mehrere Konsequenzen:
- Fehlerkorrektur wird systemisch verankert: Wenn ein Skill in der Praxis zu Fehlschlägen führt, kann Hermes sein Vorgehen anpassen.
- Wiederholung erhöht Qualität: Je häufiger ähnliche Aufgaben auftreten, desto robuster wird die zugehörige Anleitung.
- Wissensartefakte altern langsamer: Änderungen in Tools, APIs oder Dateistrukturen können in Skills nachgeführt werden.
- Verbesserung wird zum Standardfall: Lernen ist keine Ausnahme, sondern Teil jeder bearbeiteten Aufgabe.
Diese Selbstaktualisierung ist aus Unternehmenssicht hochattraktiv, bringt aber auch Governance-Fragen mit sich. Denn wenn ein Agent seine eigenen Skills fortlaufend verändert, entsteht eine Form von operational drift: Das Systemverhalten entwickelt sich weiter, ohne dass zwingend jede Änderung einzeln von einem Menschen initiiert wurde. In produktiven Umgebungen sollte deshalb klar geregelt sein, ob Skill-Updates automatisch übernommen, versioniert, freigegeben oder in bestimmten Bereichen schreibgeschützt gehalten werden.
Technologisch ist die Idee dennoch überzeugend. Agenten scheitern in der Praxis oft nicht an mangelnder Intelligenz, sondern daran, dass sie dieselben Fehler wiederholen. Hermes versucht genau dieses Muster zu brechen, indem es aus Fehlern strukturierte Korrekturen ableitet.
4. Memory-Dateien: memory.md und user.md mit bewusst knapper Größe
Der vierte Baustein des Self-Improvement Loops betrifft das explizite Kurzzeit- und Mittelzeitgedächtnis. Hermes nutzt zwei zentrale Memory-Dateien: memory.md für Projektfakten und user.md für Informationen über die Person oder den primären Nutzer. Beide Dateien sind bewusst zeichenbegrenzt. Dieser Punkt ist architektonisch von großer Bedeutung.
Viele Systeme behandeln Memory als Akkumulationsraum. Über die Zeit wächst dort alles hinein, was irgendwann einmal relevant schien: Präferenzen, historische Details, Projektänderungen, frühere Sonderfälle, Stilwünsche, technische Notizen. Das klingt zunächst nützlich, führt aber häufig dazu, dass das Memory selbst zum Problem wird. Es wird lang, redundant, widersprüchlich und schwer priorisierbar. In der Folge sinkt die Qualität des Kontexts, weil Wesentliches in Nebensächlichkeiten untergeht.
Hermes setzt bewusst auf Knappheit. Die Begrenzung zwingt das System dazu, nur diejenigen Informationen aufzubewahren, die wirklich dauerhaft relevant sind. Das ist eine Form technischer Disziplinierung: Nicht jedes Detail bekommt denselben Speicherstatus. Stattdessen muss verdichtet, priorisiert und gegebenenfalls vergessen werden.
memory.md enthält typischerweise projektbezogene Fakten, etwa:
- welche Zielarchitektur ein Projekt verfolgt
- welche Technologien oder Frameworks gesetzt sind
- welche Namenskonventionen gelten
- welche wichtigen Abhängigkeiten bestehen
- welche langfristigen Projektziele und Randbedingungen relevant sind
user.md beschreibt eher persönliche oder arbeitsstilbezogene Informationen, zum Beispiel:
- bevorzugte Antwortformate
- Abneigung gegen unnötige Erklärungen oder umgekehrt Bedarf an Kontext
- Sprachpräferenzen
- Entscheidungsstil
- Rolle im Projekt, etwa Entwickler, Produktmanager oder Geschäftsführer
Diese Trennung verhindert, dass projektfeste und personenbezogene Informationen vermischt werden. Für Governance ist das hilfreich, weil unterschiedliche Datenkategorien auch unterschiedlich behandelt werden sollten. In einem Unternehmenskontext kann es sinnvoll sein, Projekt-Memory relativ breit zuzulassen, während nutzerbezogene Profile restriktiver verwaltet werden.
5. SQLite-Datenbank mit Volltextsuche als Langzeitgedächtnis
Die Zeichenbegrenzung der Memory-Dateien bedeutet nicht, dass Hermes ältere Informationen einfach verliert. Stattdessen existiert mit der SQLite-Datenbank inklusive Volltextsuche eine separate Langzeitgedächtnis-Ebene über alle Sessions hinweg. Diese Ebene ist nicht dafür gedacht, permanent alles in den aktiven Kontext zu schieben, sondern historische Informationen bei Bedarf auffindbar zu machen.
Das ist eine sinnvolle Arbeitsteilung. Ein gutes Agentensystem braucht nicht nur Gedächtnis, sondern auch Gedächtnisverwaltung. Manche Informationen sollten ständig präsent sein, andere nur dann, wenn sie relevant werden. Die SQLite-Schicht übernimmt genau diese Rolle: Sie speichert Interaktionen, Ergebnisse, Erkenntnisse und vergangene Arbeitszusammenhänge so, dass sie später semantisch oder textuell wieder durchsucht werden können.
Für Unternehmen ist SQLite zunächst unspektakulär, aber in Wirklichkeit sehr praktisch. Die Technologie ist leichtgewichtig, etabliert, auditierbar und in vielen Umgebungen einfach zu sichern oder zu replizieren. Gleichzeitig signalisiert sie, dass Hermes nicht auf proprietäre Black-Box-Speicher setzt, sondern auf nachvollziehbare, portable Komponenten. Das erleichtert Integration, Backup, Analyse und gegebenenfalls Compliance-Prüfungen.
Die Kombination aus knappen Memory-Dateien und umfangreicher Langzeitspeicherung ist architektonisch stark, weil sie zwei gegensätzliche Ziele vereint:
- Kontextstabilität: Das aktive Memory bleibt kurz und fokussiert.
- Wissenspersistenz: Historisches geht nicht verloren, sondern wird auslagerbar und durchsuchbar.
Genau darin liegt ein zentraler Unterschied zu vielen herkömmlichen Chat- oder Agentensystemen. Diese entscheiden oft implizit zwischen „alles im Kontext“ und „alles vergessen“. Hermes versucht stattdessen, zwischen ständig relevanten, gelegentlich relevanten und nur historisch relevanten Informationen zu unterscheiden.
6. Alle 10 User-Turns: automatische Selbstreflexion und Konsolidierung
Ein weiterer Baustein des Self-Improvement Loops ist die regelmäßige Selbstreflexion alle zehn User-Turns. In diesem Intervall konsolidiert Hermes wichtige Erkenntnisse und überprüft, welche Informationen oder Muster langfristig relevant sein könnten. Das ist mehr als ein technischer Zusatz. Es ist ein Mechanismus zur aktiven Verhinderung von Kontextzerfall.
In längeren Interaktionen entsteht häufig ein bekanntes Problem: Viele Details sind kurzfristig wichtig, aber nur wenige davon sind dauerhaft bedeutsam. Ohne strukturierte Reflexion wächst der Gesprächsverlauf, während die eigentliche Essenz untergeht. Hermes durchbricht dieses Muster, indem es in festen Abständen eine Metaperspektive einnimmt: Was war wirklich wichtig? Was sollte ins dauerhafte Memory? Was gehört in Skills? Was war nur temporär?
Diese Form der periodischen Verdichtung erinnert an menschliche Arbeitsweisen. Gute Teams dokumentieren nicht jede einzelne Aktivität vollständig, sondern halten in Regelterminen oder Retrospektiven fest, was gelernt wurde, was sich bewährt hat und was künftig anders laufen sollte. Hermes überführt dieses Prinzip in Agentenlogik.
Für unternehmerische Anwendungen ist diese Selbstreflexion aus drei Gründen relevant:
- Qualitätssicherung: Erkenntnisse werden nicht nur produziert, sondern sortiert und bewertet.
- Speicherhygiene: Das System verhindert, dass irrelevante Details dauerhaft Platz belegen.
- Skalierbarkeit: Längere Arbeitsbeziehungen mit dem Agenten bleiben handhabbar, weil Wissen regelmäßig komprimiert wird.
Gleichzeitig entsteht hier ein wichtiger Governance-Punkt. Reflexion und Konsolidierung sind interpretative Prozesse. Hermes entscheidet, was wesentlich ist. Diese Entscheidung kann in Einzelfällen falsch sein. Wer Hermes produktiv nutzt, sollte deshalb definieren, wie stark solche Zusammenfassungen überwacht werden, in welchen Bereichen sie nur Vorschlagscharakter haben und wo automatische Übernahme zulässig ist.
7. Honcho im Dialect-Modus: User-Modeling in drei Runden
Der siebte Bestandteil der Architektur ist die Komponente Honcho im Dialect-Modus. Sie dient dem User-Modeling und läuft in drei Schritten: zunächst eine Hypothese über den Nutzer, dann eine Gegenprüfung dieser Hypothese und schließlich ein kompaktes Profil. Dieses Profil fließt automatisch in den Kontext künftiger Interaktionen ein.
Technisch betrachtet ist das bemerkenswert, weil es die Personalisierung von einer bloßen Ansammlung von Vorlieben zu einem strukturierten Ableitungsprozess erhebt. Hermes speichert nicht einfach, dass ein Nutzer „kürzere Antworten“ mag. Es versucht vielmehr, aus Interaktionen ein belastbares Profil zu entwickeln, prüft dieses gegen alternative Interpretationen und verdichtet das Ergebnis in eine handhabbare Form.
Der Dreischritt aus Hypothese, Gegenprüfung und Verdichtung ist wichtig, weil User-Modeling anfällig für vorschnelle Schlüsse ist. Wenn ein Nutzer in einer Situation kurze Antworten verlangt, bedeutet das nicht zwingend, dass dies immer gewünscht ist. Die Gegenprüfung soll solche Fehlschlüsse reduzieren. Auch hier zeigt sich wieder das Grundprinzip von Hermes: Lernen soll nicht bloß additiv, sondern reflektiert erfolgen.
Für Unternehmen eröffnet das interessante Möglichkeiten. Ein Agent, der Kommunikationsstil, Detailgrad, Zielorientierung, bevorzugte Artefakte oder Rollenverständnisse verschiedener Nutzer besser versteht, kann in Teams deutlich produktiver agieren. Ein Entwickler erwartet oft andere Ausgaben als ein CFO, ein Compliance-Verantwortlicher andere als ein Produktmanager. Ein gutes User-Modeling kann diese Unterschiede ohne permanente manuelle Kontextsetzung berücksichtigen.
Gleichzeitig ist Honcho auch die Komponente, die am stärksten Fragen nach Datenschutz, Profilbildung und interner Transparenz aufwirft. Sobald ein Agent Personenprofile bildet, ist entscheidend, welche Informationen erfasst werden, wie diese gespeichert werden, wer Zugriff darauf hat und wie Korrekturen möglich sind. In B2B-Umgebungen darf Personalisierung nicht zu unkontrollierter Schattenprofilbildung werden.
Skills als organisationales Wissen
Die vielleicht unterschätzteste Dimension von Hermes Agent ist die Rolle der Skills. In technischer Kurzform handelt es sich um Markdown-Anleitungen, die aus konkreten Arbeitsabläufen entstehen und bei Bedarf fortgeschrieben werden. In organisatorischer Perspektive sind Skills jedoch deutlich mehr: Sie sind ein Mechanismus, um implizites Arbeitswissen in explizites, überprüfbares Systemwissen zu überführen.
Das ist für Unternehmen hochrelevant. Ein großer Teil der Wertschöpfung in Wissensorganisationen besteht aus wiederkehrenden Routinen, die in Köpfen, Chats, Tickets oder Gewohnheiten verteilt sind. Solange dieses Wissen implizit bleibt, ist es schwer zu skalieren. Es hängt an einzelnen Personen, wird inkonsistent angewendet und geht bei Teamwechseln verloren. Wenn ein Agent aus echter Arbeit standardisierte Skills erzeugt, entsteht eine neue Form digitaler Prozessdokumentation.
Der Charme dieses Ansatzes liegt darin, dass Skills nicht im Elfenbeinturm entworfen werden müssen. Sie entstehen direkt aus operativen Aufgaben. Das reduziert die Lücke zwischen dokumentiertem Soll-Prozess und tatsächlich gelebter Praxis. Unternehmen kennen dieses Problem seit Jahren: Prozesshandbücher sehen sauber aus, aber niemand arbeitet exakt danach. Hermes kann helfen, diese Lücke zu verkleinern, weil der dokumentierte Skill aus den tatsächlich ausgeführten Tool Calls und Entscheidungsschritten abgeleitet wird.
Wie Skills konkret funktionieren
Ein Skill beschreibt in strukturierter Form, wie eine bestimmte Klasse von Aufgaben effizient, robust und regelkonform bearbeitet wird. Er kann Trigger, Voraussetzungen, Arbeitsschritte, Prüfregeln und Sonderfälle enthalten. Entscheidend ist, dass Skills nicht bloß statische Prompts sind, sondern auf agentische Ausführung ausgerichtet sind. Sie sollen den Agenten in die Lage versetzen, wiederkehrende Probleme konsistent zu lösen.
Ein Beispiel aus der Softwareentwicklung wäre ein Skill für „Pull-Request-Review vorbereiten“. Dieser könnte festhalten, dass zunächst relevante Dateien identifiziert, anschließend Testartefakte geprüft, dann Stilregeln angewendet und zuletzt eine strukturierte Zusammenfassung für Reviewer erstellt wird. Ein Skill für Content-Operations könnte definieren, wie aus mehreren Quellen ein tägliches Management-Briefing erzeugt wird, inklusive Quellenvergleich, Priorisierung und Formatierung.
Die besondere Stärke entsteht dort, wo Skills nicht nur Anleitungen, sondern komprimierte Erfahrung sind. Wenn Hermes bei der Ausführung feststellt, dass bestimmte Reihenfolgen besser funktionieren oder dass ein häufiger Fehler durch eine zusätzliche Prüfung vermieden werden kann, kann genau dieses Wissen in den Skill zurückfließen.
Selbstaktualisierung als Qualitätsmotor
Dass Hermes Skills selbst aktualisiert, ist aus Wissensmanagement-Sicht fast wichtiger als ihre bloße Erstellung. Viele Organisationen scheitern nicht daran, Wissen einmal aufzuschreiben, sondern daran, es aktuell zu halten. Dokumentation veraltet, sobald sich APIs, Tools, Zuständigkeiten oder Qualitätsanforderungen ändern. Der Wartungsaufwand steigt, die Verlässlichkeit sinkt.
Hier setzt Hermes mit einem operativ gekoppelten Lernmodell an. Weil Skills aus der laufenden Nutzung heraus angepasst werden, kann sich eine Bibliothek mit der Realität mitbewegen. Das bedeutet nicht automatisch perfekte Aktualität. Aber es erhöht die Chance, dass Fehler und Änderungen dort sichtbar werden, wo sie entstehen: im produktiven Ablauf.
Aus Governance-Sicht ist ein sinnvoller Mittelweg ratsam. Unternehmen sollten Skills nicht als unkontrollierte Selbstaussagen des Agenten betrachten, sondern als Vorschläge oder Arbeitsartefakte, die je nach Kritikalität automatisiert oder mit Freigabemechanismen in Produktivbetrieb überführt werden. Ein internes Skill-Repository mit Versionierung, Review-Regeln und Verantwortlichkeiten wäre dafür ein naheliegender Ansatz.
Skills Hub und Bibliothekslogik
Mit zunehmender Nutzung entsteht aus einzelnen Skills zwangsläufig eine Bibliothek. Diese Bibliothek kann zu einem Skills Hub werden, also zu einem zentralen Ort maschinenlesbarer Arbeitslogik. Strategisch betrachtet ist das ein möglicher Wettbewerbsvorteil. Denn während Basismodelle am Markt zunehmend austauschbar werden, ist eine gut gepflegte, organisationsspezifische Skill-Bibliothek hochindividuell und schwer kopierbar.
Für Konzerne und Mittelstand ergeben sich daraus mehrere Perspektiven:
- Standardisierung: Wiederkehrende Abläufe werden reproduzierbarer.
- Onboarding: Neue Mitarbeitende und Agenteninstanzen greifen auf vorhandenes Wissen zu.
- Qualität: Best Practices werden operationalisiert.
- Wissenssicherung: Know-how verbleibt stärker in der Organisation statt in Einzelköpfen.
- Skalierung: Einmal erarbeitete Prozesslogik kann über Teams, Standorte oder Kanäle hinweg genutzt werden.
Hermes ist deshalb nicht nur ein Agent, sondern potenziell ein Werkzeug zum Aufbau von organisationalem KI-Wissen. Genau das macht den Ansatz für Entscheider so interessant.
Memory-Architektur: Warum Knappheit hier ein Vorteil ist
Im Diskurs über KI-Systeme wird häufig angenommen, mehr Memory sei automatisch besser. Tatsächlich ist das Gegenteil oft der Fall. Je mehr Informationen ungefiltert im aktiven Kontext landen, desto größer wird das Risiko von Widersprüchen, Redundanzen und Fokusverlust. Hermes verfolgt daher einen bemerkenswert nüchternen Ansatz: nicht maximale Speicherung, sondern gezielte Verdichtung.
Die beiden Dateien memory.md und user.md sind nicht dafür gedacht, beliebig zu wachsen. Ihre Zeichenbegrenzung fungiert als Designprinzip. Dieses Prinzip zwingt das System und indirekt auch seine Nutzer dazu, zwischen dauerhaft wichtig und bloß situativ hilfreich zu unterscheiden. Im Unternehmenskontext ist das ein Qualitätsmerkmal. Denn produktive Systeme scheitern selten an Mangel an Information, sondern an Mangel an Priorisierung.
memory.md: das stabile Projektgedächtnis
Die Datei memory.md bildet den Kern des projektbezogenen Gedächtnisses. Hier sollten nur Informationen landen, die über viele Interaktionen hinweg relevant bleiben. Dazu zählen Architekturentscheidungen, verbindliche Namenskonventionen, Zielplattformen, Sicherheitsrestriktionen oder definierende Produktannahmen. Was hier nicht hineingehört, sind temporäre Zwischenstände oder Details mit kurzer Halbwertszeit.
Gerade für technische Projekte ist das wertvoll. Viele Fehlentscheidungen von Agenten entstehen nicht aus Unwissenheit, sondern aus fehlender Stabilität im Projektkontext. Wenn der Agent nicht sauber erinnert, welche Datenbank gesetzt ist, ob ein Monorepo verwendet wird, welche Programmiersprache Priorität hat oder welche Teststrategie verbindlich ist, produziert er zwar plausible, aber organisatorisch falsche Arbeit. Ein kuratiertes memory.md kann genau solche Fehler reduzieren.
user.md: das bewusste Personenprofil
User-Memory ist heikler, aber ebenfalls nützlich. In user.md werden Präferenzen und Arbeitsstile festgehalten, die den Umgang mit dem Nutzer verbessern sollen. Das kann die gewünschte Sprache, Antworttiefe, Struktur oder Rollenperspektive betreffen. Der Nutzen liegt auf der Hand: Der Agent muss nicht in jeder Sitzung neu lernen, wie mit einer bestimmten Person kommuniziert werden sollte.
Allerdings ist user.md auch die Datei, bei der Unternehmen besonders auf Datenschutz, Rollenabgrenzung und Transparenz achten sollten. Nicht jede beobachtete Präferenz sollte dauerhaft gespeichert werden, und nicht jede Rolle darf auf solche Informationen zugreifen. In regulierten Umfeldern sollte klar dokumentiert sein, welche Arten personenbezogener Metadaten zulässig sind und wie Löschung oder Korrektur erfolgen.
SQLite als strategisch sinnvolle Langzeitschicht
Die SQLite-Datenbank ergänzt die knappen Memory-Dateien um ein archiviertes, durchsuchbares Langzeitgedächtnis. Für Unternehmen ist das ein starker Kompromiss zwischen Leistungsfähigkeit und Kontrollierbarkeit. Anders als versteckte, proprietäre Speichermechanismen bleibt SQLite transparent. Daten können exportiert, geprüft, gesichert und in bestehende Governance- oder Logging-Systeme eingebunden werden.
Von zentraler Bedeutung ist die Volltextsuche. Sie erlaubt, vergangene Sitzungen nicht nur zu archivieren, sondern bei Bedarf wieder in die Arbeit einzubeziehen. Damit wird historische Erfahrung zu einem abrufbaren Wissensraum, ohne den permanenten Kontext zu überfrachten. In Wissensorganisationen ist genau diese Trennung oft entscheidend: Nicht alles muss immer präsent sein, aber Wichtiges muss zuverlässig wiederauffindbar bleiben.
Honcho und User Modeling: Personalisierung mit Systematik
Während viele Agenten Personalisierung eher beiläufig behandeln, macht Hermes daraus einen expliziten Architekturbaustein. Honcho im Dialect-Modus modelliert den Nutzer in einem dreistufigen Verfahren und speist dieses Profil automatisch in den Kontext ein. Das ist technisch interessant, weil es einen strukturierten Gegenentwurf zur typischen „Memory-Sammelbox“ darstellt.
Der Ablauf ist bewusst vorsichtig gestaltet:
- Hypothese: Hermes formuliert eine Annahme über den Nutzer oder dessen Präferenzen.
- Gegenprüfung: Die Hypothese wird auf mögliche Fehldeutungen geprüft.
- Kompaktes Profil: Nur das verdichtete Ergebnis wird in handhabbarer Form übernommen.
Dieses Verfahren reduziert zwar nicht alle Risiken, zeigt aber einen wichtigen Reifegrad. Personalisierung wird hier nicht als ungefilterte Speicherung von Beobachtungen verstanden, sondern als kleine Inferenzschleife mit Fehlerbremse. Für Organisationen ist das relevant, weil Nutzerprofile sonst leicht in unpräzise oder problematische Zuschreibungen abrutschen.
Richtig eingesetzt, kann User Modeling die Produktivität deutlich erhöhen. Ein Vorstand benötigt oft Management-Summaries mit Risiko-, Kosten- und Handlungsfokus. Ein Entwickler erwartet konkrete Artefakte, Logs, Dateipfade oder Patch-Vorschläge. Ein Compliance-Verantwortlicher will Grenzen, Nachvollziehbarkeit und Dokumentationsaspekte betont sehen. Wenn Hermes diese Unterschiede zuverlässig erfasst, steigt die Qualität der Zusammenarbeit spürbar.
Die Kehrseite ist offensichtlich: Personalisierung berührt Privatsphäre und interne Machtfragen. Unternehmen sollten deshalb definieren, ob Honcho personenbezogen oder rollenbasiert betrieben wird. In vielen Fällen dürfte ein rollenorientiertes Profiling die bessere Wahl sein. Statt individuelle Gewohnheiten stark zu personalisieren, könnte man etwa Profile für „CTO“, „Teamleitung Compliance“, „Support-Agent“ oder „Data Engineer“ pflegen. So bleibt der Nutzen erhalten, während Datenschutz- und Transparenzrisiken sinken.
Hermes vs. Claude Code: Ein ehrlicher Vergleich
Wer Hermes Agent ernsthaft bewerten will, kommt an einem Vergleich mit Claude Code nicht vorbei. Claude Code hat sich als leistungsfähige agentische Entwicklungsumgebung etabliert und ist für viele Teams heute die Referenz, wenn es um KI-gestütztes Arbeiten in Codebasen geht. Hermes ist daher nicht einfach ein beliebiges Open-Source-Projekt, sondern wird zwangsläufig am Marktführer in seiner Kategorie gemessen.
Ein ehrlicher Vergleich muss dabei zwei Ebenen unterscheiden: erstens die unmittelbare Nutzbarkeit im Alltag, zweitens die Architekturphilosophie hinter dem System. Auf der ersten Ebene kann Claude Code in vielen Szenarien durch Reife, Nutzererfahrung und starke Grundperformance punkten. Auf der zweiten Ebene bringt Hermes Konzepte ein, die für langfristige Wissensstabilität und organisatorische Integration besonders interessant sind.
Wo Claude Code stark ist
Claude Code überzeugt in der Praxis durch seine Fähigkeit, in Codebasen schnell produktiv zu werden, Dateien zu analysieren, Änderungen vorzuschlagen und Arbeitskontexte relativ elegant zu navigieren. Viele Teams schätzen die Reibungslosigkeit des Systems und die hohe Qualität der Antworten. Auch Memory- und Skill-Konzepte sind vorhanden, was zeigt, dass Claude Code die Bedeutung persistenter Kontextmechanismen erkannt hat.
Für viele Anwendungsfälle bleibt Claude Code deshalb eine starke Wahl, insbesondere wenn Teams eine ausgereifte Benutzererfahrung und ein integriertes System bevorzugen, das sofort mit hoher Qualität einsetzbar ist.
Wo Hermes strukturell anders ansetzt
Hermes unterscheidet sich vor allem in der Aktivität seines Lernzyklus. Während bei Claude Code Skills und Memory zwar existieren, deren Updates aber eher spontan, gelegentlich oder auf ausdrückliche Anforderung erfolgen, behandelt Hermes die Ableitung und Überarbeitung von Skills als nativen Standardprozess. Lernen ist hier nicht optionaler Zusatz, sondern Teil jeder abgeschlossenen Aufgabe.
Auch die restriktive Memory-Strategie ist ein wesentlicher Unterschied. Claude Code kann im Lauf der Zeit unter dem typischen Problem wachsender Memory-Dateien leiden: Sie werden länger, dichter und damit anfälliger für Vergessenseffekte, Priorisierungsfehler und Kontextrauschen. Hermes begegnet diesem Risiko mit bewusst engen Speichergrenzen und ergänzender Langzeitarchivierung über SQLite.
Zusammengefasst lässt sich sagen:
- Claude Code ist stark als sofort nutzbare, leistungsfähige agentische Umgebung.
- Hermes ist besonders interessant als offenes System mit nativem, dauerhaftem Lernzyklus.
Self-Improvement als Kernunterschied
Der größte Unterschied liegt in der Frage, wie ein Agent mit wiederkehrender Arbeit umgeht. Claude Code kann sich merken, was wichtig ist, und verfügt über Skill-Mechanismen. Hermes geht einen Schritt weiter, indem es aus jeder hinreichend komplexen Aufgabe aktiv Regeln und Verbesserungen ableitet. Dieser Unterschied mag im Einzelfall klein erscheinen, kumuliert aber über Wochen und Monate potenziell stark.
Für Unternehmen ist das von strategischer Bedeutung. Wenn ein Agent häufig dieselben Prozesse unterstützt, zählt nicht nur seine Erstleistung, sondern auch, wie schnell und stabil er im organisatorischen Kontext dazulernt. Hermes zielt genau auf diese kumulative Verbesserung.
Offenheit und Kontrolle
Ein weiterer Unterschied ist das Betriebsmodell. Hermes ist MIT-lizenziert und self-hostbar. Das erleichtert Datenhoheit, Anpassung, Audits und Integration in interne Systeme. Claude Code ist als kommerzielles Produkt in einer anderen Logik verankert. Je nach Organisation kann das ein Nachteil oder ein Vorteil sein. Wer maximale Flexibilität und Eigenkontrolle benötigt, sieht in Hermes klare Pluspunkte. Wer minimalen Integrationsaufwand und produktnahe Unterstützung priorisiert, kann mit Claude Code besser fahren.
Grenzen des Vergleichs
Allerdings wäre es falsch, Hermes vorschnell zum generellen Sieger zu erklären. Open Source bedeutet nicht automatisch höhere Betriebssicherheit, bessere Dokumentation oder geringeren Aufwand. Ein selbst gehosteter Agent bringt Infrastruktur-, Wartungs- und Governance-Aufgaben mit sich. Auch der selbstverbessernde Charakter ist kein reiner Vorteil, wenn unkontrollierte Skill-Updates zu Drift oder unerwünschten Verhaltensänderungen führen.
Der faire Vergleich lautet daher: Hermes ist nicht einfach besser oder schlechter als Claude Code, sondern anders optimiert. Hermes priorisiert Offenheit, Lernzyklus und kontextuelle Stabilisierung. Claude Code priorisiert Reife, Benutzererfahrung und ein bereits stark etabliertes Produktmodell. Welche Lösung geeigneter ist, hängt von Zielen, Governance-Anforderungen und interner technischer Reife ab.
Installation und Deployment: lokal, auf Servern und in bestehenden Umgebungen
Ein zentrales Argument für Hermes Agent ist die Flexibilität beim Betrieb. Das System kann self-hosted auf Linux, macOS oder unter WSL2 betrieben werden und lässt sich ebenso auf Servern oder VPS-Umgebungen deployen, etwa bei allgemeinen Hosting-Anbietern wie Hostinger. Für viele Organisationen ist genau das attraktiv, weil es den Agenten in die bestehende Infrastruktur einbettbar macht, statt ihn als abgeschlossenen externen Dienst konsumieren zu müssen.
Lokaler Betrieb für Entwicklung und Evaluation
Der lokale Betrieb ist vor allem für technische Teams, Prototyping und sichere Evaluation interessant. Entwickler können Hermes auf Linux oder macOS aufsetzen oder auf Windows-Systemen über WSL2 nutzen. Das ermöglicht schnelle Tests, lokale Anpassungen und die Untersuchung von Skills, Memory-Dateien und Datenbankinhalten in einer kontrollierten Umgebung.
Für erste Bewertungen ist dieser Weg ideal. Teams können prüfen:
- wie sich Hermes in den eigenen Workflow einfügt
- welche Daten gespeichert werden
- wie Skills erzeugt und aktualisiert werden
- welche Modellprovider sinnvoll angebunden werden sollen
- welche Governance-Regeln nötig sind
Server-Deployment für dauerhafte Nutzung
Für produktivere Einsätze bietet sich ein Deployment auf einem dedizierten Server oder VPS an. Das kann ein eigener Linux-Server im Unternehmensnetz, eine Cloud-Instanz oder ein gemieteter Host bei einem Anbieter wie Hostinger sein. Der Vorteil liegt in Verfügbarkeit, zentraler Wartung und der Möglichkeit, Integrationen in Teamkanäle oder Automatisierungen dauerhaft laufen zu lassen.
Ein solcher Betrieb bringt jedoch klassische Plattformfragen mit sich:
- Authentifizierung und Rollenverwaltung
- Netzwerksegmentierung
- Geheimnisverwaltung für API-Schlüssel
- Backups für SQLite und Skill-Dateien
- Monitoring, Logging und Audit-Trails
- Patch- und Update-Management
Gerade weil Hermes Open Source ist, liegt diese Verantwortung nicht automatisch bei einem Hersteller. Unternehmen gewinnen Kontrolle, übernehmen aber auch Betriebspflichten.
Modellzugriff und Provider-Schicht
Self-Hosting von Hermes bedeutet nicht zwingend, dass auch das Sprachmodell lokal läuft. In vielen Konfigurationen wird Hermes mit einem externen Modellprovider verbunden. Das kann wirtschaftlich sinnvoll sein, weil Agentenlogik und Modellbezug getrennt werden. So lässt sich Hermes als offener Steuerungs- und Memory-Layer betreiben, während Tokens über einen oder mehrere Modellanbieter bezogen werden.
Für die Build-vs.-Buy-Frage ist das ein wichtiger Punkt. Unternehmen können den Agenten selbst kontrollieren, ohne sofort in eigenes Modellhosting investieren zu müssen. Gleichzeitig bleibt die Möglichkeit bestehen, je nach Sensibilität oder Kostenstruktur später auf andere Provider oder hybride Setups umzusteigen.
Praxisbeispiel: Telegram-Bot für ein KI-News-Briefing
Um den Nutzen von Hermes jenseits klassischer Coding-Szenarien greifbar zu machen, eignet sich ein einfaches, aber realistisches Beispiel: ein Telegram-Bot für ein tägliches KI-News-Briefing. Hermes unterstützt Integrationen in Telegram, Slack, WhatsApp und Discord, was ihn nicht nur für Entwicklungsteams, sondern auch für interne Wissens- und Kommunikationsworkflows interessant macht.
Ein mögliches Setup könnte so aussehen: Ein Unternehmen möchte jeden Morgen eine kuratierte Zusammenfassung relevanter KI- und Technologiemeldungen für eine Führungskräftegruppe bereitstellen. Hermes erhält die Aufgabe, definierte Quellen oder Suchprozesse abzuarbeiten, Inhalte zu priorisieren, Redundanzen zu entfernen und die Ergebnisse in einem festen Format in einen Telegram-Kanal zu posten.
Wie Hermes den Workflow verbessern kann
Anfangs würde der Agent die Aufgabe mit mehreren Tool Calls, Recherche- und Formatierungsschritten ausführen. Nach einigen Durchläufen erkennt Hermes, dass dieser Ablauf wiederkehrend ist, und erzeugt einen Skill. Dieser Skill könnte festhalten:
- welche Themen priorisiert werden
- welche Quellen als besonders relevant gelten
- wie Zusammenfassungen strukturiert sein sollen
- welcher Tonfall für Management-Adressaten angemessen ist
- welche Dublettenregeln gelten
- welche Warnhinweise bei unsicheren Informationen nötig sind
Im weiteren Betrieb würde Hermes den Skill anpassen, wenn sich zeigt, dass bestimmte Formate besser funktionieren oder bestimmte Quellen regelmäßig unbrauchbar sind. Parallel würde user.md oder Honcho erfassen, ob die Empfänger knappe Executive Summaries oder stärker analytische Zusammenfassungen bevorzugen. memory.md könnte projektfeste Regeln enthalten, etwa die zu berücksichtigenden Themengebiete oder die gewünschte Veröffentlichungszeit.
Warum dieses Beispiel strategisch interessant ist
Das Beispiel ist bewusst simpel, zeigt aber gut, was self-improving Agents für Unternehmen bedeuten können. Der Mehrwert liegt nicht nur in der Automatisierung einer Aufgabe, sondern in der kontinuierlichen Optimierung der Aufgabe durch Nutzung. Das Briefing wird nicht nur billiger, sondern im Idealfall treffender, konsistenter und stärker auf die Zielgruppe zugeschnitten.
Darüber hinaus zeigt das Beispiel, wie Hermes in bestehende Arbeitskanäle einfließen kann. Viele Unternehmen scheitern mit KI-Projekten nicht an der Modellqualität, sondern an fehlender Integration in alltägliche Werkzeuge. Ein Agent, der in Telegram, Slack oder Discord arbeitet, begegnet den Nutzern dort, wo Kommunikation ohnehin stattfindet.
Was Self-Improving KI für Konzerne und Mittelstand bedeutet
Aus strategischer Sicht ist Hermes Agent vor allem deshalb relevant, weil er ein Architekturprinzip verkörpert, das über das einzelne Produkt hinausgeht: Selbstverbessernde KI-Agenten könnten zur nächsten Ausbaustufe betrieblicher KI werden. Statt nur Anfragen zu beantworten oder Inhalte zu generieren, bauen solche Systeme Schritt für Schritt organisationsspezifisches Arbeitswissen auf.
Für Konzerne bedeutet das die Aussicht auf agentische Plattformen, die nicht bei jeder Fachdomäne von vorne beginnen. Wenn Skills, Memory-Mechanismen und User-Modeling kontrolliert skaliert werden, könnten sich Agenten sukzessive in Domänen wie IT, Finance, Procurement, Compliance, HR oder Corporate Communications einarbeiten. Die eigentliche Hebelwirkung liegt dann nicht in einer einzelnen Interaktion, sondern in der kumulativen Verbesserung über viele Prozesse hinweg.
Für den Mittelstand ist die Perspektive etwas anders, aber nicht weniger relevant. Mittelständische Unternehmen verfügen oft nicht über große KI-Plattformteams, brauchen aber dennoch produktive, kosteneffiziente Automatisierung. Gerade hier kann ein offener, self-hostbarer Agent attraktiv sein, wenn er wiederkehrende Routinen lernfähig abbildet und sich in vorhandene Tools integrieren lässt. Der Mittelstand profitiert besonders dort, wo Prozesswissen stark in wenigen Personen konzentriert ist. Skills können helfen, dieses Wissen teilweise zu externalisieren und breiter nutzbar zu machen.
Gleichzeitig verändert self-improving KI die Anforderungen an Führung und Organisation. Unternehmen müssen entscheiden:
- welches Wissen ein Agent selbstständig verallgemeinern darf
- welche Arbeitsanweisungen automatisiert entstehen dürfen
- wie Änderungen an Skills freigegeben werden
- wie personenbezogene Präferenzen gespeichert werden
- welche Bereiche vollständig oder nur assistiv durch Agenten unterstützt werden sollen
Mit anderen Worten: Der Nutzen steigt, aber auch die Notwendigkeit klarer Betriebsmodelle. Self-improving KI ist kein „set and forget“-System. Sie verlangt bewusstes Design von Kontrollpunkten, Verantwortlichkeiten und Qualitätsstandards.
Governance, Compliance und EU AI Act
Je näher ein Agent an operative Prozesse rückt und je stärker er aus laufender Arbeit lernt, desto wichtiger werden Governance und Compliance. Hermes Agent ist hier besonders interessant, weil seine Offenheit sowohl Chancen als auch Verpflichtungen schafft. Self-Hosting und transparente Artefakte wie Markdown-Skills und SQLite-Datenbanken erleichtern Kontrolle. Zugleich erzeugen selbstaktualisierende Mechanismen neue Aufsichtsfragen.
Datenhoheit durch Self-Hosting
Ein offensichtlicher Vorteil von Hermes ist die Möglichkeit, den Agenten im eigenen Infrastruktur- und Sicherheitsrahmen zu betreiben. Für viele europäische Unternehmen ist das entscheidend. Wenn sensible Projekt-, Kunden- oder Prozessdaten verarbeitet werden, ist Datenhoheit oft wichtiger als reine Bequemlichkeit. Self-Hosting erlaubt, Zugriffe, Speicherorte, Netzgrenzen und Backup-Konzepte selbst festzulegen.
Allerdings sollte man zwischen Agentenhosting und Modellhosting unterscheiden. Sobald Tokens über externe Modellprovider laufen, verlassen unter Umständen Teile des Kontexts die eigene Infrastruktur. Unternehmen müssen daher genau prüfen, welche Daten an den Modellanbieter übermittelt werden, welche Auftragsverarbeitungs- und Sicherheitsvereinbarungen bestehen und ob datenschutzrechtliche Anforderungen eingehalten werden.
EU AI Act: Risikoklassifizierung und Dokumentationspflichten
Im Lichte des EU AI Act wird entscheidend sein, in welchem Risikokontext Hermes eingesetzt wird. Ein Agent, der interne Zusammenfassungen erstellt oder Entwickler beim Refactoring unterstützt, fällt in eine andere Bewertung als ein System, das Personalentscheidungen vorbereitet, Kreditbewertungen beeinflusst oder sicherheitskritische Prozesse automatisiert.
Unabhängig von der konkreten Einstufung ergeben sich für Unternehmen mehrere Pflichten oder zumindest Best Practices:
- Dokumentation: Welche Daten verarbeitet Hermes, welche Skills existieren, wie werden diese geändert?
- Nachvollziehbarkeit: Welche Entscheidungen oder Vorschläge des Agenten können auditierbar rekonstruiert werden?
- Human Oversight: Wo ist menschliche Freigabe erforderlich, insbesondere bei kritischen Ausgaben oder Skill-Updates?
- Risikomanagement: Welche Fehlertypen sind möglich, wie werden sie erkannt und begrenzt?
- Datenminimierung: Welche personenbezogenen Informationen speichert user.md oder Honcho tatsächlich?
Gerade self-improving Agenten sind regulatorisch interessant, weil sie ihr Verhalten über Zeit verändern können. Auch wenn kein Basismodell nachtrainiert wird, ändert sich die operative Entscheidungslogik durch neue Skills, aktualisierte Memories und User-Profile. Unternehmen sollten daher Mechanismen etablieren, um diese Veränderungen sichtbar und kontrollierbar zu halten.
Privacy-Implikationen von Memory und User Modeling
Memory ist in Unternehmen nie nur ein Feature, sondern immer auch eine datenschutzrechtliche Frage. Bei Hermes betrifft das nicht nur die direkten Inhalte von memory.md und user.md, sondern auch die Session-Historie in SQLite und die von Honcho verdichteten Nutzerprofile. Jede Organisation sollte für sich definieren, welche Informationen dort zulässig sind und welche nicht.
Empfehlenswert sind insbesondere:
- klare Lösch- und Retentionsregeln
- rollenbasierte Zugriffsrechte
- Transparenz gegenüber Nutzern über gespeicherte Profilinformationen
- Möglichkeiten zur Korrektur oder Löschung von User-Profilen
- Trennung zwischen personenbezogenem und projektbezogenem Memory
Die gute Nachricht ist: Hermes liefert mit seiner strukturierten Aufteilung prinzipiell einen besseren Ausgangspunkt für solche Regeln als viele diffuse Chat-Systeme. Die schlechte Nachricht ist: Governance entsteht nicht automatisch aus Architektur. Sie muss organisatorisch umgesetzt werden.
Build vs. Buy: Hermes, Claude Code oder eigene Agentenplattform?
Für Entscheider stellt sich nicht die isolierte Frage, ob Hermes „gut“ ist, sondern wie Hermes in die eigene Technologie- und Sourcing-Strategie passt. Die klassische Build-vs.-Buy-Debatte wird durch Agentensysteme komplexer, weil zwischen vollständig gekaufter Lösung und vollständig selbst entwickelter Plattform mehrere Zwischenstufen existieren.
Option 1: Claude Code als produktnahe Kaufentscheidung
Claude Code repräsentiert stärker die Buy-Seite: ein leistungsfähiges, bereits etabliertes System mit hoher Reife und geringerem Integrationsaufwand. Für Teams, die schnell produktiv werden wollen und keine eigenen Plattformressourcen aufbauen möchten, ist das attraktiv. Der Preis dafür ist weniger Offenheit, geringere Anpassbarkeit und potenziell stärkere Abhängigkeit vom Anbieter.
Option 2: Hermes als offener Mittelweg
Hermes ist gewissermaßen der Mittelweg zwischen Buy und Build. Das System ist einsatzbereit genug, um nicht bei null anfangen zu müssen, aber offen genug, um in eine eigene Plattformlogik eingebettet zu werden. Unternehmen können Hermes als Kern einer internen Agentenlösung nutzen, ohne die gesamte Gedächtnis-, Skill- und Tool-Orchestrierung selbst entwickeln zu müssen.
Das ist vor allem dann interessant, wenn:
- Datenhoheit wichtig ist
- mehrere Kommunikationskanäle angebunden werden sollen
- Skills als internes Wissenssystem aufgebaut werden sollen
- die Agentenlogik an interne Governance angepasst werden muss
- ein Anbieter-Lock-in vermieden werden soll
Option 3: eigene Agentenplattform
Große Unternehmen mit eigenen Plattformteams können auch eine komplett eigene Agentenplattform entwickeln. Das bietet maximale Kontrolle, ist aber teuer, langsam und risikoreich. Gerade die feinen Mechanismen für Memory-Management, Skill-Lifecycle, Reflexion und User-Modeling sind in der Praxis deutlich schwieriger als es auf Folien aussieht.
Hermes kann hier als Referenz, Beschleuniger oder sogar als Grundlage dienen. Statt alles selbst zu bauen, könnten Unternehmen einen offenen Kern übernehmen und nur die wirklich differenzierenden Schichten selbst hinzufügen.
Total Cost of Ownership: Server-Kosten, Token-Provider und Betriebsaufwand
Ein häufiger Reflex bei Open-Source-Lösungen lautet: kostenlos. Das ist im Unternehmenskontext fast immer zu kurz gedacht. Zwar ist Hermes als MIT-lizenziertes Projekt ohne klassische Lizenzgebühren nutzbar, doch die tatsächlichen Gesamtkosten ergeben sich aus mehreren Komponenten: Infrastruktur, Modellzugriff, Betrieb, Wartung, Governance und personeller Betreuung.
Direkte Kostenkomponenten
- Server oder lokale Infrastruktur: je nach Last und Verfügbarkeitsanforderung
- Token-Kosten beim Modellprovider: abhängig von Modellwahl und Nutzungsvolumen
- Speicher und Backup: für Session-Daten, Skills und Logs
- Monitoring und Sicherheit: etwa Secrets-Management, Logging, Zugriffsschutz
- Integrationsaufwand: etwa für Telegram, Slack, interne Systeme oder Datenquellen
Im Vergleich zu abonnementbasierten Agentenprodukten kann Hermes dennoch wirtschaftlich attraktiv sein, insbesondere bei höherem Volumen oder wenn mehrere Nutzergruppen auf einer gemeinsamen Instanz arbeiten. Statt pro Nutzer oder Sitz separat zu bezahlen, verlagert sich die Kostenlogik auf Infrastruktur plus Verbrauch beim Modellprovider.
Versteckte Kosten und Einsparpotenziale
Wirklich interessant wird die Rechnung bei den indirekten Effekten. Hermes kann Kosten sparen, wenn wiederkehrende Aufgaben nicht nur automatisiert, sondern über Skills auch zunehmend stabilisiert werden. Dann sinkt nicht nur der manuelle Aufwand, sondern auch der Korrekturaufwand für schlechte oder inkonsistente Ergebnisse. Gleichzeitig dürfen die Kosten für Skill-Governance, Qualitätskontrolle und internes Enablement nicht unterschätzt werden.
Der ROI hängt deshalb stark davon ab, ob Hermes in Prozessen eingesetzt wird, die:
- häufig wiederkehren
- mehrstufig sind
- klaren Regeln folgen
- hohe manuelle Dokumentations- oder Rechercheaufwände haben
- vom Lernen aus vergangenen Durchläufen spürbar profitieren
In solchen Szenarien ist self-improving KI besonders wirtschaftlich. In rein ad-hoc geprägten, sehr seltenen Einzelaufgaben fällt der Mehrwert des Lernzyklus naturgemäß geringer aus.
Risiken und Limitationen
So überzeugend die Architektur von Hermes in vielen Punkten wirkt, wäre es falsch, die Risiken zu unterschlagen. Gerade weil Hermes offen, flexibel und selbstverbessernd ist, entstehen neue technische und organisatorische Herausforderungen.
Open-Source-Maintenance und Reifegrad
Open Source bringt Dynamik und Transparenz, aber nicht automatisch Enterprise-Reife. Unternehmen müssen prüfen, wie aktiv das Projekt gepflegt wird, wie schnell Bugs behoben werden, wie stabil APIs und Konfigurationen sind und ob interne Ressourcen vorhanden sind, um notfalls selbst Anpassungen vorzunehmen. Ein populäres Repository ist noch kein Ersatz für belastbaren Langzeitsupport.
Modellabhängigkeit trotz offenem Agenten
Auch ein offener Agent bleibt von der Qualität und Verfügbarkeit der angebundenen Sprachmodelle abhängig. Wenn Hermes mit externen Providern arbeitet, können Kosten, Latenz, Richtlinien oder Modellverhalten variieren. Die Offenheit des Agenten reduziert Lock-in-Risiken, beseitigt sie aber nicht vollständig.
Drift im Self-Improvement
Selbstverbesserung ist nur dann ein Vorteil, wenn die Verbesserung tatsächlich in die richtige Richtung geht. Es besteht das Risiko, dass Skills durch ungünstige Einzelfälle, fehlerhafte Schlussfolgerungen oder schwache Selbstreflexionen schleichend von den gewünschten Standards abweichen. Dieser Drift kann subtil sein und fällt erst spät auf.
Deshalb sollten Unternehmen gerade in kritischen Domänen Regeln für Skill-Versionierung, Review, Rollback und Freigabe etablieren. Ein Agent, der lernen darf, braucht auch die Möglichkeit, kontrolliert zurückgesetzt oder korrigiert zu werden.
Privacy und Profilbildung
User Modeling und Memory können bei schlechter Governance in problematische Profilbildung umschlagen. Wenn Nutzer nicht wissen, welche Präferenzen oder Verhaltensmuster gespeichert werden, entsteht schnell Misstrauen. Besonders in europäischen Unternehmenskontexten ist Transparenz daher unverzichtbar.
Komplexität der Integration
Hermes ist flexibel, aber Flexibilität kostet. Je stärker der Agent in bestehende Workflows, Kommunikationskanäle und Datenquellen integriert wird, desto mehr Architektur- und Sicherheitsarbeit fällt an. Ohne klares Zielbild droht daraus ein Flickenteppich zu werden.
Empfehlung: Für wen lohnt sich Hermes Agent?
Hermes lohnt sich nicht für jede Organisation gleichermaßen. Der Nutzen hängt stark von technischer Reife, Governance-Kompetenz und Prozesscharakter ab. Eine differenzierte Empfehlung ist daher sinnvoll.
Hermes ist besonders interessant für
- Technisch starke Teams, die Self-Hosting und Integrationen selbst beherrschen
- Organisationen mit hohem Bedarf an Datenhoheit, die Agenten nicht vollständig in geschlossene Plattformen auslagern wollen
- Unternehmen mit vielen wiederkehrenden Wissensprozessen, bei denen Skills echten Mehrwert stiften
- Teams, die organisationales Wissen systematisch aufbauen möchten
- Mittelständler und Plattformteams, die einen offenen Kern statt vollständiger Eigenentwicklung suchen
Hermes ist weniger geeignet für
- Organisationen ohne interne technische Betriebsfähigkeit
- Teams, die eine vollständig betreute Enterprise-Lösung mit klaren SLAs erwarten
- Anwendungsfälle, bei denen Self-Improvement aus regulatorischen Gründen kaum zulässig ist
- Unternehmen, die Personalisierung und Memory noch nicht governance-seitig sauber abbilden können
Für viele größere Organisationen dürfte ein gestufter Ansatz sinnvoll sein: zunächst Piloten in klar begrenzten, nicht hochkritischen Prozessen; dann Aufbau einer kontrollierten Skill-Governance; anschließend Ausweitung auf weitere Teams und Kanäle. Hermes eignet sich gut für solche Lernkurven, weil der offene Aufbau Transparenz schafft und Anpassungen erlaubt.
Ausblick: Self-Improving Agents als nächste Stufe der Unternehmens-KI
Hermes Agent ist mehr als ein kurzfristiger Open-Source-Erfolg. Das Projekt zeigt, in welche Richtung sich agentische KI-Systeme entwickeln könnten: weg von rein promptbasierten Assistenten, hin zu dauerhaft lernenden operativen Systemen, die Arbeit ausführen, reflektieren, verdichten und in organisatorisch nutzbares Wissen überführen.
Gerade der Self-Improvement Loop markiert dabei einen wichtigen Entwicklungsschritt. Wenn Agenten nach jeder komplexeren Aufgabe nicht nur Ergebnisse liefern, sondern auch Skills schreiben, bestehende Anleitungen korrigieren, Memory priorisieren und Nutzerprofile verfeinern, verschiebt sich der Wertschwerpunkt. Entscheidend ist dann nicht mehr nur, wie gut ein Modell heute antwortet, sondern wie gut ein System morgen aus der Arbeit von gestern gelernt hat.
Für Unternehmen ist das eine strategische Chance und eine Managementaufgabe zugleich. Die Chance besteht darin, dass KI nicht länger nur punktuell unterstützt, sondern über Zeit zu einem Träger organisationalen Wissens wird. Die Managementaufgabe besteht darin, diese Entwicklung kontrollierbar, compliance-fähig und wirtschaftlich sinnvoll zu gestalten. Self-improving Agents brauchen nicht weniger Führung als klassische Software, sondern oft mehr.
Hermes zeigt, dass Open Source in diesem Feld keineswegs nur die günstigere Alternative zu proprietären Produkten sein muss. Im Gegenteil: Gerade bei Themen wie Datenhoheit, Skill-Bibliotheken, überprüfbaren Wissensartefakten und anpassbarer Gedächtnisarchitektur kann Offenheit zum entscheidenden Vorteil werden. Dass ein solches Projekt in kurzer Zeit eine so hohe Nutzung und Aufmerksamkeit erreicht hat, ist deshalb kein Zufall. Es trifft einen realen Bedarf im Markt.
Ob Hermes selbst langfristig die führende Plattform in diesem Segment wird, ist offen. Sicher ist aber: Die Grundidee, agentische Systeme mit einem nativen, dauerhaften Lernzyklus auszustatten, wird bleiben. Wer heute KI-Strategien für Entwicklung, Wissensarbeit und interne Automatisierung plant, sollte diese Entwicklung sehr genau beobachten. Hermes Agent ist nicht nur ein Konkurrent zu Claude Code. Es ist ein Signal dafür, wie die nächste Stufe betrieblicher KI aussehen könnte.
