Codex ЛУЧШЕ чем Claude Code. Вот почему

Евгений Пантела

6 chapters7 takeaways9 key terms5 questions

Overview

В этом видео автор сравнивает две нейросетевые модели для написания кода: Codex и Claude. Несмотря на активный маркетинг Claude и его популярность среди инфлюенсеров, автор утверждает, что Codex превосходит Claude по многим параметрам, особенно в задачах, связанных с доведением работы до конца и интеграцией с терминалом. Также упоминаются проблемы с доступом к Claude из России и более высокая стоимость его подписки. Автор рекомендует Codex как более практичное и интуитивное решение для разработчиков.

How was this?

Save this permanently with flashcards, quizzes, and AI chat

Chapters

Claude активно продвигается в медиа, создавая впечатление превосходства над другими моделями.
Многие блогеры и инфлюенсеры, включая автора ранее, рекомендовали Claude.
Существует контраст между рекламным образом Claude и реальными проблемами его использования.

Понимание маркетинговых стратегий помогает критически оценивать информацию и делать осознанный выбор инструментов.

Рекламные ролики с успешными людьми на яхтах и самолетах, которые якобы достигли успеха благодаря переходу на Claude.

Недавние массовые блокировки аккаунтов (около 1.5 млн) затрудняют использование Claude.
Пользователи из России часто сталкиваются с банами, даже при покупке подписки.
Потеря денег и времени из-за блокировки делает использование Claude нецелесообразным для российских пользователей.

Технические и географические ограничения могут сделать самый разрекламированный инструмент недоступным или ненадежным для конкретного пользователя.

Множество комментариев от подписчиков автора с жалобами на блокировку аккаунтов ('бан, бан, бан').

GPT-4.5 (Codex) показывает 82.7% в Terminal Benchmark 2.0, в то время как Claude Opus 4.7 - около 70%.
Разница в 12% является значительной и указывает на превосходство GPT-4.5 в задачах, связанных с терминалом и полным циклом разработки.
Terminal Benchmark оценивает способность модели выполнять комплексные задачи, включая работу с терминалом, планирование и итерации, а не только написание кода.

Объективные метрики производительности, такие как Terminal Benchmark, помогают понять, какая модель лучше справляется с реальными, комплексными задачами разработчика.

Официальные данные OpenAI, показывающие 82% для GPT-4.5 против 69% для Claude Opus в Terminal Bench.

GPT-4.5 (Codex) демонстрирует большую 'агентность', самостоятельно доводя задачи до конца.
Пользователь может поставить задачу и отойти, получив результат через некоторое время (например, 20 минут).
Claude требует постоянного присмотра и часто выдает результат быстрее (2 минуты), но с необходимостью дальнейшего контроля.

Способность ИИ самостоятельно завершать задачи экономит время разработчика и повышает его продуктивность, позволяя фокусироваться на других аспектах работы.

Codex может выполнить задачу за 20 минут, пока пользователь занимается другими делами, в то время как Claude требует немедленного вмешательства после 2 минут работы.

В бенчмарке Sve Bench Pro, оценивающем именно написание кода, Claude Opus все еще лидирует.
Однако, вайпкодинг включает больше, чем просто написание кода; он требует комплексного подхода.
Для чисто архитектурных задач и написания самого кода Claude может быть предпочтительнее, но для общего использования Codex лучше.

Разные модели могут иметь сильные стороны в разных аспектах, и выбор зависит от конкретных потребностей пользователя.

Claude лучше строит архитектуру и пишет сам код, но Codex лучше справляется с доведением задачи до конца в целом.

Codex значительно дешевле Claude по подписке.
Интерфейс Codex более интуитивен, с четким отображением лимитов и встроенными инструментами.
Codex интегрирован с генерацией изображений и доступен на мобильных устройствах как часть подписки ChatGPT.

Экономическая эффективность, удобство использования и интеграция с другими функциями делают Codex более привлекательным комплексным решением.

Возможность использовать генерацию изображений, верстку в Codex и продолжить работу с телефона в рамках одной подписки ChatGPT.

Key takeaways

1Не доверяйте слепо маркетингу; проверяйте реальную производительность инструментов.
2Проблемы с доступом и блокировками могут сделать даже самый разрекламированный сервис непригодным для использования.
3Codex превосходит Claude в задачах, требующих самостоятельного доведения до конца и интеграции с терминалом.
4Terminal Benchmark является ключевым показателем эффективности ИИ в комплексных задачах вайпкодинга.
5Codex предлагает более выгодное соотношение цены и качества, а также более интуитивный пользовательский опыт.
6Единая подписка на ChatGPT/Codex с генерацией изображений и мобильным доступом является мощным преимуществом.
7Выбор инструмента должен основываться на конкретных задачах и практической пользе, а не на популярности.

Key terms

CodexClaudeGPT-4.5Claude OpusTerminal Benchmark 2.0вайпкодинг (wycoding)агентность (agentic)Sve Bench ProOpenAI

Test your understanding

1Почему, по мнению автора, Codex лучше Claude для повседневных задач разработчика?
2Как проблемы с доступом к Claude из России влияют на его практическую применимость?
3Что такое Terminal Benchmark и почему он важен для оценки ИИ в вайпкодинге?
4В чем заключается преимущество 'агентности' ИИ-модели при выполнении задач?
5Какие дополнительные преимущества предлагает Codex по сравнению с Claude, помимо производительности?