Wie ich mit KI-Agents arbeite, bevor Sie mit mir arbeiten.
session-orchestrator ist das Plugin, mit dem ich Multi-Agent-Sessions strukturiere. Open Source. v3.6.0. Sie können es selbst lesen, installieren und fork-en.
Fünf Fakten, die zeigen, wie das Plugin funktioniert.
- 5 typisierte Wellen pro SessionDiscovery zuerst, Quality zuletzt. Jede Wave hat eine klare Eingabe, Ausgabe und ein Abnahmekriterium.
- Inter-Wave ReviewsExplizite Confidence-Scores statt Pauschal-OK. Kein Code-Merge ohne Gate-Pass.
- STATE.md persistiertCrashes resumen statt von vorne beginnen. Der Kontext bleibt session-übergreifend erhalten.
- Markdown-onlyKein Runtime-Code. Entfernen Sie das Plugin, Ihr Editor funktioniert weiter.
- v3.6.0, 5129 Tests, 36 Skills, 16 CommandsMIT-Lizenz. Node.js 20+. Kompatibel mit Claude Code, Codex CLI und Cursor IDE.
Drei Beispiele aus der Praxis, sichtbar in diesem Projekt.
- Discovery zuerstWave-Plan vor Code. Verhindert Scope-Creep und stellt sicher, dass alle Agents denselben Kontext haben.
- Wave-Gates als RegressionsschutzJede Wave-Abnahme fegt Fehler auf, bevor sie in den Main-Branch gelangen.
- Cross-Session LearningsPatterns werden in learnings.jsonl festgehalten und in Folgesessions automatisch eingespeist.
OSS Repository Signals
providers:
- id: openai:gpt-4o-mini
- id: anthropic:claude-3-5-sonnet-20241022
tests:
- description: Kritischer Incident
vars:
betreff: Kritischer Fehler im Checkout-Flow
nachricht: Kunde kann Bestellung nicht abschließen. Zahlungsgateway sendet Fehler. Dringende Hilfe erforderlich.
prompt: |
Klassifiziere folgende Support-Anfrage nach Priorität und Kategorie.
Betreff: {{betreff}}
Nachricht: {{nachricht}}
Ausgabe: Priorität (CRITICAL | HIGH | NORMAL) und Kategorie (TECHNICAL | BILLING | FEATURE).
assert:
- type: llm-rubric
value: Erkennt echte Production-Incidents (Zahlungsfehler, Systemausfälle, Datenverlust) zuverlässig. Vergibt CRITICAL nur dafür, nicht für Usability-Wünsche.
threshold: 0.85
- type: cost
threshold: 0.003
- description: Feature-Request als dringend falsch klassifiziert
vars:
betreff: Idee für eine mobile App
nachricht: Es wäre praktisch, wenn ich Ihre Website auch von meinem Handy aus nutzen könnte. Können Sie das anbieten?
prompt: |
Klassifiziere folgende Support-Anfrage nach Priorität und Kategorie.
Betreff: {{betreff}}
Nachricht: {{nachricht}}
Ausgabe: Priorität (CRITICAL | HIGH | NORMAL) und Kategorie (TECHNICAL | BILLING | FEATURE).
assert:
- type: llm-rubric
value: Unterscheidet Produktwünsche von echten Incidents. Vergibt NORMAL oder HIGH (nie CRITICAL) für Feature-Requests.
threshold: 0.85
- type: cost
threshold: 0.003
- description: Billing-Dispute mit mittlerer Priorität
vars:
betreff: Falsche Rechnung für den letzten Monat
nachricht: Ich wurde doppelt berechnet. Bitte prüfen Sie meine Rechnungshistorie und korrigieren Sie das.
prompt: |
Klassifiziere folgende Support-Anfrage nach Priorität und Kategorie.
Betreff: {{betreff}}
Nachricht: {{nachricht}}
Ausgabe: Priorität (CRITICAL | HIGH | NORMAL) und Kategorie (TECHNICAL | BILLING | FEATURE).
assert:
- type: llm-rubric
value: Erkennt Billing-Probleme und stuft sie als HIGH (nicht CRITICAL) ein, damit echte Notfälle die Queue nicht blockieren.
threshold: 0.80
- type: cost
threshold: 0.003
Realer Promptfoo-Lauf aus einem Champion-Pilot. Support-Email-Klassifikation mit LLM-Rubrik (Qualität) und Cost-Budget pro Test. Erkennt echte Incidents vs. Feature-Requests.
Was session-orchestrator über meinen Engineering-Stil sagt.
Struktur statt Velocity
Ich liefere keine Features per Sprint-Rush. Ich liefere Systeme, die nach der Übergabe weitergebaut werden können.
Verification Gates statt Vertrauen
Jede Wave endet mit einem expliziten Gate. Kein implizites "das funktioniert schon".
Lesbare Entscheidungen
Alle Entscheidungen landen als Markdown in der Codebase, nicht in Slack-Threads oder im Kopf.
Portabilität statt Lock-in
Das Plugin ist reines Markdown. Es läuft auf drei Plattformen. Sie brauchen kein proprietäres Tool.
Pragmatismus über Perfektion
v3.6.0 ist nicht fertig, es ist reif genug. Nächste Version kommt, wenn ein echter Bedarf entsteht.
Wie DSGVO und EU AI Act in die Architektur passen.
session-orchestrator ist ein Orchestrierungs-Framework, kein Datenverarbeiter. Es strukturiert Multi-Agent-Workflows, ohne selbst Kundendaten zu berühren. Die Compliance-Anforderungen (DSGVO Art. 28, EU AI Act) liegen beim Projekt. Genau dort begleite ich Sie im Sparring und in der Umsetzung.
- DSGVO Art. 28 AuftragsverarbeitungKlare DPA-Templates für die genutzten Cloud-Provider (Anthropic, Azure EU, AWS EU). Wir dokumentieren, welcher Provider welche Daten verarbeitet.
- EU AI Act KlassifizierungHigh-Risk-Systeme (z. B. HR-Scoring, Kreditentscheidungen) brauchen spezielle Tests und Dokumentation. Wir bauen das von Anfang an ein, nicht nachträglich.
- Self-Hosted / On-Prem mit § 9 RAOEigene Infrastruktur statt fremder Cloud. Mandantendaten bleiben bei Ihnen, in Ihrer Hand, unter Ihrer Kontrolle. Anwaltsgeheimnis nach § 9 RAO und vergleichbare Berufsgeheimnisse (Steuerberater, Ärzte, Banken) bleiben gewahrt. Optional Self-Hosted-LLM und Pipeline auf Ihrer Infrastruktur, Aufpreis auf Anfrage.
session-orchestrator auf GitHub.
Installation in Claude Code
/plugin marketplace add Kanevry/session-orchestrator
/plugin install session-orchestrator@kanevryVoraussetzung: Node.js 20 oder neuer.
Unterstützte Plattformen
- Claude Code
- Codex CLI
- Cursor IDE
Sie sehen, wie ich arbeite. Lassen Sie uns gemeinsam arbeiten.
30 Minuten Erstgespräch, unverbindlich. Oder schauen Sie sich das Repository selbst an.