Ein GitHub-Repo, das nichts weiter enthält als eine einzige CLAUDE.md-Datei, steht aktuell bei über 25.000 Sternen. Kein Framework, keine CLI, kein Python-Paket. Nur Text. Das Projekt andrej-karpathy-skills destilliert Andrej Karpathys öffentliche Beobachtungen zu typischen Fehlermustern von LLMs in vier Verhaltensregeln für Claude Code.
Dass ausgerechnet eine Markdown-Datei dieses Maß an Aufmerksamkeit bekommt, ist kein Zufall. Es ist ein Signal dafür, wo die eigentliche Arbeit mit KI-Coding-Assistenten gerade stattfindet: nicht mehr in der Frage, ob das Modell Code schreiben kann, sondern wie man sein Verhalten so lenkt, dass der Code auch brauchbar ist.
Karpathys Diagnose
Die Datei greift drei Beobachtungen auf, die Karpathy in seinen Posts zu LLM-Coding formuliert hat:
"Die Modelle treffen falsche Annahmen für dich und laufen damit einfach los, ohne nachzufragen. Sie managen ihre eigene Unsicherheit nicht, bitten nicht um Klärung, zeigen keine Inkonsistenzen auf, präsentieren keine Tradeoffs, widersprechen nicht, wenn sie sollten."
"Sie neigen stark dazu, Code und APIs zu überkomplizieren, Abstraktionen aufzublähen, toten Code nicht aufzuräumen... und bauen auf 1000 Zeilen, was in 100 gegangen wäre."
"Sie ändern oder entfernen manchmal noch Kommentare und Code, den sie nicht ausreichend verstanden haben, als Seiteneffekt – selbst wenn das mit der eigentlichen Aufgabe nichts zu tun hat."
Jeder, der KI-Assistenten produktiv einsetzt, kennt diese Muster. Die interessante These des Repos: Wenn die Fehler vorhersehbar sind, kann man ihnen mit den richtigen Anweisungen vorbeugen.
Die vier Prinzipien
Annahmen explizit machen, bei Mehrdeutigkeit mehrere Interpretationen nennen statt still eine zu wählen, bei einfacherem Weg widersprechen, bei Unklarheit stoppen und fragen. Das Gegenmittel gegen stille Fehlinterpretationen.
Nur der Code, der die Aufgabe löst. Keine Features, die nicht angefragt wurden. Keine Abstraktion für Einmal-Code. Keine "Flexibilität" auf Verdacht. Kein Error-Handling für Fälle, die nicht auftreten können. Wenn 200 Zeilen auch 50 täten, wird umgeschrieben.
Nur anfassen, was angefasst werden muss. Bestehenden Stil übernehmen, auch wenn man es selbst anders machen würde. Kein "Aufräumen" am Rand der Aufgabe. Jede geänderte Zeile muss sich auf den Auftrag zurückführen lassen.
Erfolgskriterien vor Code. "Fix den Bug" wird zu "Schreibe einen Test, der den Bug reproduziert, und bring ihn zum Grün". Starke Kriterien erlauben dem Modell, selbstständig zu iterieren. Schwache Kriterien ("mach, dass es funktioniert") erzwingen ständige Rückfragen.
Was die Datei tatsächlich löst – und was nicht
Die Prinzipien adressieren reale, wiederkehrende Fehlermuster. Besonders Regel 3 spart in der Praxis viel Zeit: Wer einmal erlebt hat, wie ein Agent beim Fixen eines Tippfehlers im Vorbeigehen die halbe Formatierung einer Datei "verbessert", versteht, warum chirurgische Präzision ein Prinzip sein muss.
Gleichzeitig ist eine CLAUDE.md kein Allheilmittel. Die Regeln sind generisch. Sie wissen nichts über deine Architektur, deine Tests, deine Deployment-Pipeline. Bei komplexeren Aufgaben – PDF-Verarbeitung, Browser-Automatisierung, domänenspezifische Workflows – reichen vier abstrakte Prinzipien nicht. Dort braucht es die strukturierteren Claude Code Skills, die bei Bedarf geladen werden und konkrete Tools und Scripte mitbringen.
CLAUDE.md vs. Skills: Wann was?
CLAUDE.md
- • Immer im Kontext
- • Generelles Verhalten
- • Projektweit gültig
- • Ideal für Stil, Disziplin, Do's und Don'ts
Skills
- • On-Demand geladen
- • Konkrete Workflows
- • Aufgabenspezifisch
- • Ideal für Tools, Scripte, spezifische Domänen
Die beiden Mechanismen schließen sich nicht aus. Im Gegenteil: Eine schlanke CLAUDE.md mit Verhaltensregeln plus ein Satz Skills für die tatsächlichen Werkzeuge ist in meinen Projekten gerade das Setup, das am zuverlässigsten funktioniert. Die Datei sorgt dafür, dass der Agent nicht über die Stränge schlägt. Die Skills geben ihm die konkreten Fähigkeiten, die er für die jeweilige Aufgabe braucht.
Warum 25.000 Sterne
Der Erfolg des Repos erzählt eine Geschichte, die größer ist als die Datei selbst. Entwickler verschieben gerade ihren Fokus. "KI nutzen, um Code zu schreiben" war die Phase der letzten zwei Jahre. "Das Verhalten der KI so formen, dass der Code tatsächlich gut wird" ist die Phase, in die wir gerade eintreten.
Das Werkzeug dafür ist erstaunlich schlicht: Text. Eine klare Anweisung, ein gut formuliertes Prinzip, ein expliziter Erfolgstest sind oft wirkungsvoller als das nächste Framework. Die besten Werkzeuge im Claude-Code-Ökosystem sind aktuell keine Software. Es sind gut durchdachte Anweisungen.
Wer produktiv mit KI-Agenten arbeitet, sollte die CLAUDE.md nicht als optionale Doku verstehen, sondern als Teil der Architektur. Was darin steht, entscheidet mit darüber, welcher Code am Ende im Repository landet.
Verwendete Tools:
Arbeiten Sie an KI-gestützten Entwicklungs-Workflows und fragen sich, wie Sie das Verhalten Ihrer Agenten zuverlässig in den Griff bekommen? Lassen Sie uns sprechen. Ich helfe beim Aufbau von CLAUDE.md- und Skill-Setups, die in echten Projekten funktionieren.