ChatGPT 5.4 is vs Claude Opus 4.6 - Test on real code
Show description
ChatGPT 5.4 is out, so I put it head-to-head against Claude Code on real design tasks. In this video, I test both tools on actual codebases to redesign my SaaS landing page, then throw in a one-shot flight simulator app challenge to see how well they handle vague prompts, UI decisions, and real-world coding tasks. No benchmark fluff. Just real outputs, real apps, and a straight comparison of which one actually feels more useful when you're building. I also share my honest thoughts on bad prompts, why that matters for so-called autonomous AI tools, and which model I’d actually trust more for design-heavy workflows right now. If you're building apps, SaaS, or AI tools with Claude Code, check out Build With Luke. I’m rebuilding it right now with lessons on shipping your first AI tool, better web design prompts, Claude skills, and real SaaS build breakdowns. Launch your first AI app with Claude Code in 14 days: https://ailuke.short.gy/r2n7zi Generate Youtube scripts in Your Voice: https://ailuke.short.gy/YCNeXT --- Timestamps 00:00 Intro 00:22 ChatGPT 5.4 claims 00:44 Real code test begins 01:46 Flight simulator challenge 02:36 Build With Luke mention 03:11 Early impressions 04:08 Codex moves first 05:16 UI redesign progress 07:18 Flight simulator result 08:28 Claude finishes first 09:40 Landing page redesign results 10:56 ChatGPT landing page result 12:12 Verdict --- Contact: [email protected]
Have questions about this video?
Sign up to chat with AI and get deeper insights.
Sign up — 5 free creditsChatGPT 5.4 и Claude Opus 4.6 тестируются на реальном коде, сравнивая их интерфейс и функциональность для разработки приложений.
Предоставляет полезные инсайты, но недостаточно глубоких технических сравнений.
Разработчики, интересующиеся инструментами ИИ для кодирования, получат выгоду от этого сравнения.
Тем, кто ищет высокотехнический, глубокий обзор, может не хватить ценности.
Предоставлены инсайты, но они могут быть более глубокими и структурированными.
Название отражает фактический фокус контента на сравнении инструментов ИИ с реальным кодом.
- 1Редизайн интерфейса — Оценка способности инструментов ИИ редизайнировать целевую страницу.
- 2Создание симулятора полетов — Тестирование способности ИИ создавать приложение Симулятор полетов.
- 3Интерпретация подсказок — Оценка того, насколько хорошо каждая модель отвечает на нечеткие подсказки.
- 4Исполнение кода — Наблюдение за выводами ИИ и исполнением реальных задач кода.
- 5Сравнение интерфейсов — Сравнение эстетических различий в результатах интерфейса между ИИ.
- ChatGPT 5.4 и Claude Opus 4.6 имеют разные сильные стороны в редизайне интерфейса и разработке приложений.
- Claude эффективно редизайнирует интерфейс быстро и создает визуально привлекательные результаты.
- ChatGPT 5.4 предоставляет тщательные и детализированные ответы на код, хотя иногда бывает многословным.
- Автономные агенты должны эффективно интерпретировать нечеткие инструкции.
- ИИ Люк рекомендует использовать оба инструмента ИИ для достижения оптимальных результатов в разных сценариях.
- 1Экспериментируйте с ChatGPT и Claude для задач дизайна.
- 2Присоединяйтесь к сообществу Build with Look для дальнейшего обучения инструментам ИИ.
Платформа для обучения разработке инструментов ИИ.
tutorial
mixed
intermediate
moderate
Разработчики, интересующиеся инструментами ИИ и дизайном интерфейсов
"Я думаю, ваш ИИ должен быть плохим."
Критика неспособности ИИ правильно интерпретировать нечеткие инструкции пользователей.
Интерфейс Claude Opus 4.6 лучше.
Субъективное мнение ведущего; опыт зрителей может различаться.