ChatGPT 5.4 is vs Claude Opus 4.6 - Test on real code
Show description
ChatGPT 5.4 is out, so I put it head-to-head against Claude Code on real design tasks. In this video, I test both tools on actual codebases to redesign my SaaS landing page, then throw in a one-shot flight simulator app challenge to see how well they handle vague prompts, UI decisions, and real-world coding tasks. No benchmark fluff. Just real outputs, real apps, and a straight comparison of which one actually feels more useful when you're building. I also share my honest thoughts on bad prompts, why that matters for so-called autonomous AI tools, and which model I’d actually trust more for design-heavy workflows right now. If you're building apps, SaaS, or AI tools with Claude Code, check out Build With Luke. I’m rebuilding it right now with lessons on shipping your first AI tool, better web design prompts, Claude skills, and real SaaS build breakdowns. Launch your first AI app with Claude Code in 14 days: https://ailuke.short.gy/r2n7zi Generate Youtube scripts in Your Voice: https://ailuke.short.gy/YCNeXT --- Timestamps 00:00 Intro 00:22 ChatGPT 5.4 claims 00:44 Real code test begins 01:46 Flight simulator challenge 02:36 Build With Luke mention 03:11 Early impressions 04:08 Codex moves first 05:16 UI redesign progress 07:18 Flight simulator result 08:28 Claude finishes first 09:40 Landing page redesign results 10:56 ChatGPT landing page result 12:12 Verdict --- Contact: [email protected]
Have questions about this video?
Sign up to chat with AI and get deeper insights.
Sign up — 5 free creditsChatGPT 5.4 y Claude Opus 4.6 son probados en código real, comparando su UI y funcionalidad para el desarrollo de aplicaciones.
Proporciona ideas útiles pero carece de comparaciones técnicas profundas.
Los desarrolladores interesados en herramientas de codificación basadas en IA se beneficiarían de esta comparación.
Aquellos que buscan una revisión técnica muy detallada pueden no encontrar suficiente valor.
Se proporcionan percepciones, pero podrían ser más profundas y estructuradas.
El título refleja el enfoque real del contenido en la comparación de herramientas de IA con código real.
- 1Rediseño de UI — Evaluando la capacidad de las herramientas de IA para rediseñar una página de aterrizaje.
- 2Creación de Simulador de Vuelo — Probando la capacidad de IA para crear una aplicación de simulador de vuelo.
- 3Interpretación de Prompts — Evaluando cuán bien cada modelo responde a indicaciones vagas.
- 4Ejecución de Código — Observando las salidas de IA y la ejecución en tareas de código real.
- 5Comparación de UI — Comparando diferencias estéticas en los resultados de UI entre las IAs.
- ChatGPT 5.4 y Claude Opus 4.6 tienen fortalezas distintas en el rediseño de UI y desarrollo de aplicaciones.
- Claude rediseña UI de manera ventajosa y crea resultados visualmente atractivos.
- ChatGPT 5.4 proporciona respuestas de código completas y detalladas, aunque a veces extensas.
- Los agentes autónomos deberían interpretar idealmente instrucciones vagas de manera efectiva.
- AI Luke aconseja el uso de ambas herramientas de IA para obtener resultados óptimos en diferentes escenarios.
- 1Experimentar con ChatGPT y Claude para tareas de diseño.
- 2Unirse a la comunidad Build with Look para aprender más sobre herramientas de IA.
Plataforma para aprender sobre el desarrollo de herramientas de IA.
tutorial
mixed
intermediate
moderate
Desarrolladores interesados en herramientas de IA y diseño UI/UX
"Creo que tu IA debe ser mala."
Crítica sobre la incapacidad de la IA para interpretar correctamente instrucciones vagas del usuario.
La UI de Claude Opus 4.6 es superior.
Opinión subjetiva del presentador; las experiencias de los espectadores pueden variar.