Paperclip Review: Das Open-Source Tool das dein AI-Team managt
Paperclip orchestriert mehrere KI-Agenten als virtuelles Unternehmen. Wir haben das virale Open-Source-Tool ausführlich getestet – mit allen Stärken und Schwächen.

Was ist Paperclip?
Paperclip ist ein Open-Source-Tool, das mehrere KI-Agenten als virtuelles Unternehmen organisiert. Statt einen einzelnen KI-Assistenten für alles zu nutzen, baust du mit Paperclip ein ganzes Team: Ein CEO plant und delegiert, ein CTO kümmert sich um technische Architektur, Content-Writer erstellen Texte, und so weiter. Jeder Agent hat eine klar definierte Rolle, Verantwortlichkeiten und Budgets.
Das Konzept klingt zunächst wie Science-Fiction, hat aber in der Praxis überraschend gut funktioniert. Innerhalb der ersten Woche nach Launch hat Paperclip über 14.000 GitHub Stars gesammelt – ein Zeichen dafür, dass die Entwickler-Community nach genau so einer Lösung gesucht hat.
Wichtig vorab: Paperclip selbst ist kostenlos und Open Source. Die Kosten entstehen durch die API-Nutzung der KI-Modelle, die deine Agents verwenden. Je nachdem, welche Modelle du einsetzt und wie aktiv dein Team ist, können das zwischen 5 € und 50 € pro Tag sein.
Wie funktioniert Paperclip?
Das Grundprinzip orientiert sich an einem echten Unternehmen:
Organigramm und Rollen
Du erstellst eine Company mit einer Mission und Zielen. Innerhalb dieser Company stellst du Agents ein, die in einer Hierarchie stehen. Typischerweise sieht das so aus:
- CEO – Plant Strategien, erstellt Tasks, delegiert an Untergebene
- CTO – Verantwortlich für technische Entscheidungen und Code-Architektur
- Head of Content – Erstellt Content-Pläne, schreibt oder delegiert Texte
- SEO Writer – Schreibt suchmaschinenoptimierte Artikel
- QA Engineer – Prüft Code und Inhalte auf Qualität
Jeder Agent hat einen Adapter (z.B. Claude Code, Codex, oder ein anderes CLI-Tool) und ein zugewiesenes Modell (Opus, Sonnet, Haiku). Der CEO sollte auf dem stärksten Modell laufen, weil er strategische Entscheidungen trifft. Alle anderen können oft mit günstigeren Modellen arbeiten.
Tasks und Budgets
Tasks werden vom CEO oder manuell erstellt und an Agents zugewiesen. Jeder Task hat:
- Eine klare Beschreibung
- Ein Token-Budget (wie viel der Agent maximal verbrauchen darf)
- Eine Priorität
- Einen Status (offen, in Arbeit, erledigt, fehlgeschlagen)
Das Budget-System ist entscheidend: Ohne Limits können Agents unkontrolliert Tokens verbrauchen. Ich empfehle, pro Task ein Budget von maximal 50.000 Tokens zu setzen und dieses schrittweise zu erhöhen.
Heartbeats
Ein Mechanismus, der gleichzeitig Stärke und Schwäche von Paperclip ist: Agents haben regelmäßige Heartbeats – sie "wachen auf", prüfen ob neue Tasks vorhanden sind, und arbeiten diese ab. Das Problem: Auch ein Heartbeat ohne neue Arbeit verbraucht Tokens, weil der Agent seinen Status und Kontext prüft.
Installation
Die Installation ist denkbar einfach. Du brauchst Node.js 20+ und ein Terminal:
npx paperclipai onboard --yes
Dieser Befehl führt dich durch die Einrichtung:
- Company-Name und Mission festlegen
- Ersten Agent (CEO) erstellen
- Adapter konfigurieren (z.B. Claude Code)
- API-Schlüssel hinterlegen
Nach dem Onboarding öffnet sich das Dashboard automatisch im Browser. Die gesamte Einrichtung dauert etwa 5 Minuten.
Das Dashboard
Das Paperclip Dashboard ist übersichtlich aufgebaut und zeigt dir:
- Agents – Alle aktiven Agents mit Status, letzter Aktivität und verbrauchtem Budget
- Issues – Offene Probleme, die manuelles Eingreifen erfordern
- Activity – Timeline aller Aktionen: Tasks erstellt, Code geschrieben, Dateien geändert
- Costs – Detaillierte Kostenaufschlüsselung pro Agent, pro Task und pro Tag
Besonders die Kosten-Übersicht ist Gold wert. Du siehst auf einen Blick, welcher Agent wie viel verbraucht hat, und kannst Budgets entsprechend anpassen. In meinem Testlauf hat der CEO etwa 40 % des Gesamtbudgets verbraucht, gefolgt vom CTO mit 30 %.
Vergleich: Paperclip vs. einfach mehrere Claude Code Tabs
Die ehrliche Frage, die sich stellt: Brauche ich wirklich Paperclip, oder öffne ich einfach drei Claude-Code-Terminals?
| Kriterium | Paperclip | Mehrere Tabs | |-----------|-----------|-------------| | Governance | Rollen, Budgets, Audit-Log | Keine Struktur | | Koordination | Automatisch via Organigramm | Manuell | | Kosten-Tracking | Eingebaut pro Agent/Task | Nicht vorhanden | | Overhead | Heartbeats verbrauchen Tokens | Kein Overhead | | Einrichtung | 5 Minuten | Sofort | | Skalierung | 10+ Agents möglich | Ab 3 wird es unübersichtlich |
Mein Fazit zum Vergleich: Für kleine Projekte (1-2 Tasks parallel) sind separate Tabs effizienter. Ab 3+ parallelen Arbeitsströmen mit klarer Aufgabenteilung lohnt sich Paperclip.
Vorteile
- Struktur und Governance – Klare Rollen, Verantwortlichkeiten und Eskalationswege. Der CEO entscheidet, nicht der einzelne Agent
- Audit-Log – Jede Aktion wird protokolliert. Du kannst nachvollziehen, wer was wann getan hat
- Task-Management – Aufgaben werden priorisiert, zugewiesen und überwacht
- Budget-Kontrolle – Token-Limits pro Agent und Task verhindern unkontrollierte Kosten
- Multi-Agent-Orchestrierung – Agents können untereinander kommunizieren und Aufgaben delegieren
Nachteile
- Hoher Token-Verbrauch – Die Orchestrierungsschicht selbst verbraucht erheblich Tokens. In meinem Test waren etwa 25-30 % des Gesamtverbrauchs reiner Overhead für Koordination
- Heartbeat-Leerlauf – Agents verbrauchen auch Tokens, wenn sie nichts zu tun haben. Das summiert sich, besonders wenn du vergisst, inaktive Agents zu pausieren
- Braucht viel API-Kontingent – Wer einen Festpreis-Plan nutzt (z.B. Claude Max für 100 €/Monat), stößt schnell an Limits, weil Paperclip parallel mehrere Sessions öffnet
- Noch jung – Einige Features sind noch instabil. Gelegentlich verlieren Agents ihren Kontext nach einem Heartbeat
- Lernkurve – Die Konzepte (Company, Org-Chart, Budgets) müssen erst verstanden werden
Für wen lohnt sich Paperclip?
Ideal für:
- Entwickler und Teams, die nach API-Verbrauch bezahlen (z.B. über Anthropic API direkt). Hier lohnt sich die Parallelisierung, weil du nur für tatsächlich verbrauchte Tokens zahlst
- Projekte mit klar definierten Arbeitsströmen (Frontend, Backend, Content, QA)
- Solopreneure, die ein virtuelles Team simulieren wollen
Weniger geeignet für:
- Nutzer mit Max-Plan oder festem Kontingent – Die parallelen Sessions verbrauchen das monatliche Limit zu schnell
- Einfache Projekte, die ein einzelner Agent bewältigen kann
- Leute, die schnelle Ergebnisse ohne Einrichtungsaufwand wollen
Clipmart: Was kommt noch?
Das Paperclip-Team hat den Clipmart Marketplace angekündigt – ein Marktplatz für vorgefertigte Company-Templates. Statt dein Organigramm von Null aufzubauen, könntest du bald Templates wie "SaaS Startup", "Content Agency" oder "E-Commerce Team" installieren und sofort loslegen. Das könnte die Einstiegshürde deutlich senken.
Fazit: 4 von 5 Sternen
Paperclip ist ein beeindruckendes Tool, das zeigt, wohin die Reise mit KI-Agenten geht. Die Idee, mehrere Agents als Unternehmen zu organisieren, funktioniert in der Praxis erstaunlich gut – vorausgesetzt, man hat die nötigen API-Ressourcen.
Was überzeugt: Die Governance-Schicht mit Rollen, Budgets und Audit-Log. Endlich Ordnung im Multi-Agent-Chaos.
Was noch fehlt: Effizientere Heartbeats, bessere Unterstützung für Festpreis-Pläne, und der versprochene Clipmart Marketplace.
Für API-Nutzer, die bereit sind, die Einrichtungszeit zu investieren, ist Paperclip aktuell die beste Open-Source-Lösung für Multi-Agent-Orchestrierung. Alle anderen sollten warten, bis das Ökosystem etwas reifer ist.
Bewertung: ★★★★☆ (4/5)

Über den Autor
Max Müller
KI-Experte und Software-Entwickler mit Fokus auf Large Language Models und AI-Automation. Schreibt über praktische KI-Anwendungen.
Ähnliche Artikel

Claude Code vs. Cursor vs. Windsurf: Der große AI-Coding-Vergleich
Drei der beliebtesten AI-Coding-Assistenten im direkten Vergleich: Welches Tool ist das beste für Entwickler in 2026?

Suno AI: Musik erstellen mit KI – So funktioniert's
Mit Suno AI kann jeder in Minuten professionell klingende Songs erstellen. Wir zeigen, wie das Tool funktioniert und was es kann.