Meine Vorgehensweise: Ich gebe Stack vor, sage was wie gemacht werden muss und brauche LLMs als fleissige Bienen, die das dann umsetzen.
ChatGPT = Müll, habe ich vor vier Monaten nach 2 Jahren Nutzung gekündigt. Code Output wurde immer schlechter. Halluzinationen, Bugs und sinnloses Wirrwar. Von 10 Anfragen hat 1 halbwegs funktioniert. Bei 9 musste ich so viel korrigieren, so dass ich Code besser selbst geschrieben habe.
Claude bis und mit 4.5 viel besser als ChatGPT aber immer noch ziemlich unbrauchbar. 1 aus 10 funktionierte gut. Die anderen 9 musste ich wieder korrigieren.
Claude 4.6 – ein Sprung gegenüber 4.5 – es kann schon viel mehr, schafft es aber trorzdem nicht konstant bugfreie und funktionierenden Code auszugeben. 5 von 10 Anfragen funktionieren gut, Rest buggy und unbrauchbar.
Claude Opus 4.7 – das erste Modell, welches wirklich unterstützt. Kostet mehr – aber ist tatsächlich sehr gut. Aus 10 Anfragen werden 9 gut bis sehr gut umgesetzt. 1 noch buggy – aber kann mittels Opus 4.7 gleich selbst behoben werden.
Ab Opus 4.7 finde ich es richtig gut nutzbar für meine Zwecke. Das ist das, was ich ich Code-Assistent nennen kann.
Sonnett 4.6 ist sehr gut in Recherche und Evaluationen – Opus 4.7 weltklasse in der Umsetzung.
Es macht nun richtig Spass damit zu arbeiten.