Meine Tests waren alle gruen.
Trotzdem fehlten Felder. Trotzdem war Output leer. Trotzdem hat die KI Abkuerzungen genommen, die ich gestern beschrieben habe.
Das Problem war nicht der Test. Das Problem war, dass der Test ein isolierter Checkpoint war. Kein System.
Heute: Was ich dagegen gebaut habe.
5 Level, von einfach bis automatisch:
-> Level 1: Self-Check. Die KI reviewt sich selbst.
-> Level 2: Fresh Context. Ein anderes Modell reviewt ohne die Diskussion.
-> Level 3: Structural Tests. Linter-Style Faktenchecks.
-> Level 4: Pattern Tests. Wiederkehrende Probleme, codifiziert.
-> Level 5: Hooks. Tests laufen nach jedem Schritt automatisch. Ergebnisse fliessen direkt in den naechsten Prompt.
Im Deutschen nennen wir das Leitplanken - keine Waende, die stoppen, sondern Schienen, die auf der Spur halten.
Hard Gates fuer was nie passieren darf. Soft Warnings fuer "pruef das nochmal."
Welches Level habt ihr - und welches braucht ihr?
Sebastian Breitzke •
Leitplanken
#AI#BTS#AIWorkflow#DeveloperExperience