ChatGPT 5.4 is vs Claude Opus 4.6 - Test on real code
Show description
ChatGPT 5.4 is out, so I put it head-to-head against Claude Code on real design tasks. In this video, I test both tools on actual codebases to redesign my SaaS landing page, then throw in a one-shot flight simulator app challenge to see how well they handle vague prompts, UI decisions, and real-world coding tasks. No benchmark fluff. Just real outputs, real apps, and a straight comparison of which one actually feels more useful when you're building. I also share my honest thoughts on bad prompts, why that matters for so-called autonomous AI tools, and which model I’d actually trust more for design-heavy workflows right now. If you're building apps, SaaS, or AI tools with Claude Code, check out Build With Luke. I’m rebuilding it right now with lessons on shipping your first AI tool, better web design prompts, Claude skills, and real SaaS build breakdowns. Launch your first AI app with Claude Code in 14 days: https://ailuke.short.gy/r2n7zi Generate Youtube scripts in Your Voice: https://ailuke.short.gy/YCNeXT --- Timestamps 00:00 Intro 00:22 ChatGPT 5.4 claims 00:44 Real code test begins 01:46 Flight simulator challenge 02:36 Build With Luke mention 03:11 Early impressions 04:08 Codex moves first 05:16 UI redesign progress 07:18 Flight simulator result 08:28 Claude finishes first 09:40 Landing page redesign results 10:56 ChatGPT landing page result 12:12 Verdict --- Contact: [email protected]
Have questions about this video?
Sign up to chat with AI and get deeper insights.
Sign up — 5 free creditsChatGPT 5.4 und Claude Opus 4.6 werden an echtem Code getestet, um ihre Benutzeroberfläche und Funktionalität für die App-Entwicklung zu vergleichen.
Bietet nützliche Einblicke, fehlt aber an tiefgreifenden technischen Vergleichen.
Entwickler, die an KI-basierten Codierungstools interessiert sind, würden von diesem Vergleich profitieren.
Diejenigen, die eine hochtechnische, detaillierte Bewertung suchen, finden möglicherweise nicht genügend Wert.
Es werden Erkenntnisse bereitgestellt, die jedoch tiefergehender und strukturierter sein könnten.
Der Titel reflektiert den tatsächlichen Inhaltsfokus auf den Vergleich von KI-Tools mit echtem Code.
- 1UI-Redesign — Bewertung der Fähigkeit der KI-Tools, eine Landing Page neu zu gestalten.
- 2Erstellung eines FlugSimulators — Test der KI-Fähigkeit, eine FlugSimulator-App zu erstellen.
- 3Aufforderungsinterpretation — Bewertung, wie gut jedes Modell auf vage Aufforderungen reagiert.
- 4Codeausführung — Beobachtung der KI-Ausgaben und Ausführungen bei echten Codierungsaufgaben.
- 5UI-Vergleich — Vergleich ästhetischer Unterschiede in den UI-Ergebnissen zwischen den KIs.
- ChatGPT 5.4 und Claude Opus 4.6 haben unterschiedliche Stärken im UI-Redesign und in der App-Entwicklung.
- Claude gestaltet die Benutzeroberfläche schnell neu und erstellt visuell ansprechende Ausgaben.
- ChatGPT 5.4 bietet gründliche und detaillierte Programmieranfragen, ist aber manchmal zu ausführlich.
- Autonome Agenten sollten vage Anweisungen idealerweise effektiv interpretieren können.
- AI Luke empfiehlt die Verwendung beider KI-Tools, um optimale Ergebnisse in verschiedenen Szenarien zu erzielen.
- 1Experimentiere mit ChatGPT und Claude für Designaufgaben.
- 2Tritt der Build with Look-Community bei, um weiter über KI-Tools zu lernen.
Plattform, um mehr über die Entwicklung von KI-Tools zu lernen.
tutorial
mixed
intermediate
moderate
Entwickler, die sich für KI-Tools und UI/UX-Design interessieren
"Ich denke, deine KI muss schlecht sein."
Kritik an der Unfähigkeit der KI, vage Benutzeranweisungen richtig zu interpretieren.
Claude Opus 4.6 UI ist überlegen.
Subjektive Meinung des Präsentators; die Erfahrungen der Zuschauer können variieren.