
5:49
Codex ЛУЧШЕ чем Claude Code. Вот почему
Евгений Пантела
Overview
В этом видео автор сравнивает две нейросетевые модели для написания кода: Codex и Claude. Несмотря на активный маркетинг Claude и его популярность среди инфлюенсеров, автор утверждает, что Codex превосходит Claude по многим параметрам, особенно в задачах, связанных с доведением работы до конца и интеграцией с терминалом. Также упоминаются проблемы с доступом к Claude из России и более высокая стоимость его подписки. Автор рекомендует Codex как более практичное и интуитивное решение для разработчиков.
How was this?
Save this permanently with flashcards, quizzes, and AI chat
Chapters
- Claude активно продвигается в медиа, создавая впечатление превосходства над другими моделями.
- Многие блогеры и инфлюенсеры, включая автора ранее, рекомендовали Claude.
- Существует контраст между рекламным образом Claude и реальными проблемами его использования.
Понимание маркетинговых стратегий помогает критически оценивать информацию и делать осознанный выбор инструментов.
Рекламные ролики с успешными людьми на яхтах и самолетах, которые якобы достигли успеха благодаря переходу на Claude.
- Недавние массовые блокировки аккаунтов (около 1.5 млн) затрудняют использование Claude.
- Пользователи из России часто сталкиваются с банами, даже при покупке подписки.
- Потеря денег и времени из-за блокировки делает использование Claude нецелесообразным для российских пользователей.
Технические и географические ограничения могут сделать самый разрекламированный инструмент недоступным или ненадежным для конкретного пользователя.
Множество комментариев от подписчиков автора с жалобами на блокировку аккаунтов ('бан, бан, бан').
- GPT-4.5 (Codex) показывает 82.7% в Terminal Benchmark 2.0, в то время как Claude Opus 4.7 - около 70%.
- Разница в 12% является значительной и указывает на превосходство GPT-4.5 в задачах, связанных с терминалом и полным циклом разработки.
- Terminal Benchmark оценивает способность модели выполнять комплексные задачи, включая работу с терминалом, планирование и итерации, а не только написание кода.
Объективные метрики производительности, такие как Terminal Benchmark, помогают понять, какая модель лучше справляется с реальными, комплексными задачами разработчика.
Официальные данные OpenAI, показывающие 82% для GPT-4.5 против 69% для Claude Opus в Terminal Bench.
- GPT-4.5 (Codex) демонстрирует большую 'агентность', самостоятельно доводя задачи до конца.
- Пользователь может поставить задачу и отойти, получив результат через некоторое время (например, 20 минут).
- Claude требует постоянного присмотра и часто выдает результат быстрее (2 минуты), но с необходимостью дальнейшего контроля.
Способность ИИ самостоятельно завершать задачи экономит время разработчика и повышает его продуктивность, позволяя фокусироваться на других аспектах работы.
Codex может выполнить задачу за 20 минут, пока пользователь занимается другими делами, в то время как Claude требует немедленного вмешательства после 2 минут работы.
- В бенчмарке Sve Bench Pro, оценивающем именно написание кода, Claude Opus все еще лидирует.
- Однако, вайпкодинг включает больше, чем просто написание кода; он требует комплексного подхода.
- Для чисто архитектурных задач и написания самого кода Claude может быть предпочтительнее, но для общего использования Codex лучше.
Разные модели могут иметь сильные стороны в разных аспектах, и выбор зависит от конкретных потребностей пользователя.
Claude лучше строит архитектуру и пишет сам код, но Codex лучше справляется с доведением задачи до конца в целом.
- Codex значительно дешевле Claude по подписке.
- Интерфейс Codex более интуитивен, с четким отображением лимитов и встроенными инструментами.
- Codex интегрирован с генерацией изображений и доступен на мобильных устройствах как часть подписки ChatGPT.
Экономическая эффективность, удобство использования и интеграция с другими функциями делают Codex более привлекательным комплексным решением.
Возможность использовать генерацию изображений, верстку в Codex и продолжить работу с телефона в рамках одной подписки ChatGPT.
Key takeaways
- Не доверяйте слепо маркетингу; проверяйте реальную производительность инструментов.
- Проблемы с доступом и блокировками могут сделать даже самый разрекламированный сервис непригодным для использования.
- Codex превосходит Claude в задачах, требующих самостоятельного доведения до конца и интеграции с терминалом.
- Terminal Benchmark является ключевым показателем эффективности ИИ в комплексных задачах вайпкодинга.
- Codex предлагает более выгодное соотношение цены и качества, а также более интуитивный пользовательский опыт.
- Единая подписка на ChatGPT/Codex с генерацией изображений и мобильным доступом является мощным преимуществом.
- Выбор инструмента должен основываться на конкретных задачах и практической пользе, а не на популярности.
Key terms
CodexClaudeGPT-4.5Claude OpusTerminal Benchmark 2.0вайпкодинг (wycoding)агентность (agentic)Sve Bench ProOpenAI
Test your understanding
- Почему, по мнению автора, Codex лучше Claude для повседневных задач разработчика?
- Как проблемы с доступом к Claude из России влияют на его практическую применимость?
- Что такое Terminal Benchmark и почему он важен для оценки ИИ в вайпкодинге?
- В чем заключается преимущество 'агентности' ИИ-модели при выполнении задач?
- Какие дополнительные преимущества предлагает Codex по сравнению с Claude, помимо производительности?