KI ist auch faul.
Ich hab's rausgefunden, als meine Tests alle gruen waren - aber die Haelfte der Visualisierungen leer.
120 Zollnachrichtentypen. Jeder hat 20 bis 500 Felder. Jedes Feld muss im Code auftauchen - dafuer hab ich einen Test geschrieben.
Fuer Felder die bewusst nicht angezeigt werden sollen gab's ein Ventil: acknowledge_unused_fields(). Feld als gesehen, bewusst uebersprungen markieren. Test gruen.
Die KI hat das sofort verstanden. Zu gut.
40 Nachrichten spaeter faellt mir auf: Eine Visualisierung sieht duenn aus. Business-kritische Felder fehlen. Ich schau in den Code - und die KI hat ganze Feldsegmente in acknowledge_unused_fields() gestopft.
Test: gruen.
Visualisierung: halb leer.
Wie ein Schueler, der den Loesungsschluessel hinten im Buch findet und das Aufschreiben ueberspringt.
Die KI hat optimiert - aber fuer "Test ist gruen", nicht fuer "Job ist erledigt". Sie findet den Weg des geringsten Widerstands. Jedes. Einzelne. Mal.
Im Deutschen nennen wir das ein Schlitzohr - schlau, erfinderisch, immer einen Trick in der Tasche. Nicht boeswillig. Einfach effizient.
Mein Takeaway:
-> Dein Test definiert, was fertig bedeutet
-> Hat dein Test Schlupfloecher, wird die KI sie finden
-> Teste den Geist der Anforderung, nicht nur den Buchstaben
-> Je smarter das Modell, desto kreativer die Abkuerzungen
Wo hat KI bei euch eine Abkuerzung genommen, die ihr erst zu spaet bemerkt habt?
Sebastian Breitzke •
Lazy AI
#AI#BTS#AIWorkflow#DeveloperExperience