「我創造了我自己？」令開發者也感到驚訝的「自我進化 AI」GPT-5.3-Codex 誕生

想像一下在平靜的早晨上班路上，抵達辦公室沖泡一杯熱咖啡的短暫時間。這期間，你用輕鬆的口氣向 AI 下達指令：「聽說我們購物中心 App 突然出現支付錯誤，能不能幫我找出原因並修好？」

如果是以前，AI 可能只會建議說「請檢查這段程式碼」。但現在不同了。AI 會親自翻遍包含數千行程式碼的儲存庫 (Repository)，並直接開啟終端機 (Terminal) 輸入指令。在找出導致錯誤的元兇並修復後，它甚至會自行完成測試，確認修復後的程式碼運作完美。當你喝下第一口咖啡時，AI 已經報告說：「修復已完成，並通過了測試。」 [GPT-5.3-Codex

Jaymon’s Blog - stomx.net](https://www.stomx.net/posts/openai-gpt-5-3-codex)

這不是科幻電影中的情節。2026年2月5日，OpenAI 向世界公開了將這種「自主性」作為核心武器的新型 AI 模型：GPT-5.3-Codex。GPT-5.3-Codex

這為什麼很重要？從「助手」變為「同事」的 AI

到目前為止，我們使用的 AI 編碼工具更像是「百科全書」或「秘書」，當你說「幫我寫這段程式碼」時，它們會顯示程式碼片段。將結果移至實際電腦並執行，仍然是人類的工作。然而，GPT-5.3-Codex 旨在開創一種名為 「代理式編碼 (Agentic Coding)」 的新範式。GPT-5.3-Codex: OpenAI’s Autonomous Coding Agent Redefines …

簡單來說，這是一個不只是動動嘴皮子的助手，而是能親自動手完成工作的「現場專家」AI。所謂「代理式編碼」，是指 AI 能夠自主理解目標，直接選擇並執行所需的工具，如果結果不如預期，它還會自行修正計畫，直到任務圓滿完成。[GPT-5.3-Codex

Jaymon’s Blog - stomx.net](https://www.stomx.net/posts/openai-gpt-5-3-codex) 現在，開發者可以從重複且繁瑣的工作中解脫出來，專注於服務的核心企劃與創意設計。

輕鬆理解：新人職員與「攜帶工具箱的專家」

如果將 GPT-5.3-Codex 的實力比喻成我們身邊的人，情況會是這樣的。

如果現有的 AI 是 「理論紮實但不會操作實際電腦，只能在旁邊指點的新人職員」，那麼 GPT-5.3-Codex 就如同 「提著裝滿電腦、終端機和複雜錯誤修復工具（除錯工具）的工具箱，親自坐下來解決問題的資深開發者」。

該模型不僅僅是生成程式碼，還能同時處理以下高難度任務：GPT-5.3-Codex

海量儲存庫搜尋：在數萬行程式碼堆中精準找出那根有問題的「針」。
直接執行指令：在終端機輸入指令執行程式，親眼確認其是否真的運作良好。
智慧型除錯 (Debugging)：當程式停止運作時，思考「為什麼不行？」，並自行建立假設來修復程式碼。

隨著 AI 能夠直接操作工具，過去人類必須逐一複製貼上程式碼並向 AI 解釋執行結果的低效過程已完全消失。GPT-5.3-Codex: OpenAI’s Autonomous Coding Agent Redefines …

創造自己的 AI：「我修理我自己」

這次發表中最令世界震驚的部分是，OpenAI 在完成這個模型的過程中，直接投入了 GPT-5.3-Codex 本人。GPT-5.3-Codex

OpenAI 表示，該模型是「首個在自身開發過程中發揮核心作用的人工智慧」。GPT‑5.3‑Codex 介紹 - OpenAI 開發團隊利用該模型的早期版本來找出學習過程中發現的複雜錯誤、管理軟體發佈過程，並分析龐大的測試結果。GPT‑5.3‑Codex 介紹 - OpenAI

這就像是一個木匠用一把粗糙的錘子造出了更精緻的錘子，再用那把精緻的錘子打造出世界上最完美的錘子。AI 開始利用自己的智慧為創造更好的自己做出貢獻。這證明了技術發展的速度有可能超越人類極限，呈現指數級增長。GPT-5.3-Codex: OpenAI’s Autonomous Coding Agent Redefines …

性能如何？用數字看實力

GPT-5.3-Codex 的設計旨在壓倒其強大對手 Anthropic 的「Claude Opus 4.6」。GPT-5.3-Codex 從實際性能測量試驗（基準測試）結果來看，差異非常明顯。

無可比擬的速度：比競爭對手 Claude Opus 4.6 快了整整 25%。 GPT-5.3-Codex 這將轉化為開發時間大幅縮短的實質收益。

電腦操作能力 (Terminal-Bench)：獲得了 77.3% 的高分。[Codex 5.3 Released: Full Benchmark Results & Analysis

Feb …](https://claude5.ai/ko/news/codex-53-released-benchmark-analysis-2026) 這個數值證明了 AI 不僅能寫字，還能多麼熟練地操作電腦系統。

實戰問題解決能力 (SWE-Bench Pro)：達到了 56.8%。[Codex 5.3 Released: Full Benchmark Results & Analysis

Feb …](https://claude5.ai/ko/news/codex-53-released-benchmark-analysis-2026) 意味著它能獨立完美解決一半以上複雜的實際軟體工程問題。

作業系統理解度 (OSWorld)：獲得了 64.7% 的分數，顯示在操作 Windows 或 Mac 等各類作業系統時毫無障礙。GPT-5.3-Codex: OpenAI’s Autonomous Coding Agent Redefines …

這些結果得益於巧妙地結合了專精於編碼模型的專業性，以及像人類一樣推理的通用模型的優點。[GPT-5Chat - API Pricing & Providers

OpenRouter](https://openrouter.ai/openai/gpt-5-chat)

現狀：誰可以使用，如何使用？

目前這款強大的工具主要提供給 ChatGPT Pro 訂閱者。使用價格約為 每月 200 美元（約 27 萬韓元），比起一般的對話型聊天機器人，更傾向於專業辦公工具。GPT-5.3-Codex

使用者可以透過專屬 App「Codex app」或網頁版與這款 AI 見面，不久後也計畫開放 API（連接通道），以便一般開發者能直接將其連接到自己的服務中。GPT-5.3-Codex 此外，在 2 月 12 日，OpenAI 還公開了僅需文字輸入即可輕鬆使用的研究版本 「GPT-5.3-Codex-Spark」，備受研究人員期待。GPT-5.3-Codex

未來會如何？軟體世界的劇變

GPT-5.3-Codex 的出現正在改變我們開發軟體的基本方式。如果過去的開發者在煩惱「如何逐行編寫程式碼？」，未來的開發者將專注於更高層次的策略：「該要求 AI 解決什麼問題？」GPT-5.3-Codex: OpenAI’s Autonomous Coding Agent Redefines …

現在 AI 已經開始自我改進並直接操作工具，從我們手機上的 App 到巨大的企業系統，所有數位工具的發展速度都將達到前所未有的水準。[GPT-5.3-Codex

Jaymon’s Blog - stomx.net](https://www.stomx.net/posts/openai-gpt-5-3-codex) 在我們不知不覺中，AI 已經在逐一自行修復支撐我們世界的程式碼。

AI 記者的觀點：跨越「自我進化」的門檻

GPT-5.3-Codex 不僅僅是技術升級，它標誌著 AI 脫胎換骨，從「智慧助手」蛻變為「自主執行者」。特別值得關注的是 AI 親自參與了提升自身性能的工作。這暗示著技術已進入所謂「自我進化」的循環，開始自我加速。未來的軟體開發將不再是人類親手打造，而更接近於一種藝術：人類提出意圖，AI 則雕琢出最完美的成果。

參考資料

GPT-5.3-Codex
Gemini 3.1 Pro vs GPT-5.3-Codex 在編碼工作流程中的比較
GPT-5.3-Codex 教科書
GPT-5.3Chat 發佈：更少的幻覺，更自然…
[GPT-5Chat - API 定價與供應商 OpenRouter](https://openrouter.ai/openai/gpt-5-chat)
GPT‑5.3‑Codex 介紹 - OpenAI
[GPT-5.3-Codex Jaymon’s Blog - stomx.net](https://www.stomx.net/posts/openai-gpt-5-3-codex)
[Codex 5.3 發佈：完整基準測試結果與分析 2 月 …](https://claude5.ai/ko/news/codex-53-released-benchmark-analysis-2026)
GPT-5.3-Codex: OpenAI 的自主編碼代理重新定義軟體工程 …
OpenAI 發佈 GPT‑5.3‑Codex，比以前快 25%
[什麼是 OpenAI？ChatGPT、GPT-5 等的歷史… Taskade 部落格](https://www.taskade.com/blog/openai-chatgpt-history)

Share this article: