Die KI war perfekt. Fuer die ersten 46 Dateien.
Datei 47: Drei Lokalisierungs-Keys fehlen. Kein EN. Kein DE. Die KI hatte das Muster 46 Mal richtig - dann ist sie abgedriftet.
Und du haettest Datei 47 nie manuell geprueft.
Specs beschreiben, was passieren soll. Tests verifizieren, dass es passiert ist.
Ein Test, der nach jeder Datei laeuft. Wie ein Linter - aber nicht nur fuer Code. Fuer Verhalten. Fuer Inhalte. Faengt, was manuelle Reviews nicht schaffen.
Nicht 100% Coverage. 100% von dem, was bei Skalierung zaehlt.
Mein Ansatz: Ideen ausprobieren, gucken was klebt, dann das Wichtige mit Tests pinnen. Vor dem Skalieren - nicht vor dem Coden. Manche Tests bleiben fuer immer. Manche loesche ich, wenn die Aufgabe erledigt ist.
Und damit loest sich das Carbonara-Problem: Was implizit ist wird probabilistisch. Tests machen es explizit. Nicht mehr Doku - ausfuehrbare Constraints, die die KI nicht ignorieren kann.
Im Deutschen nennen wir den ultimativen Test die Nagelprobe. So kompromisslos sollte deine Verifikation sein.
Wo vertraut ihr, obwohl ein Test sicherer waere?
Sebastian Breitzke •
The Nagelprobe
#AI#BTS#AIWorkflow#DeveloperExperience