我口袋裡的 AI 開發者？僅用 400 行代碼完成的魔法工具「Pu.sh」

AI Summary

公開了僅憑「sh, curl, awk」等基本工具即可運行、且無需複雜安裝過程的 400 行超小型 AI 編程代理「Pu.sh」，引發熱議。

試著想像一下。你命令 AI：「讀取我電腦上的這個檔案，摘要內容後存成新檔案。」到目前為止，AI 通常只會在螢幕上顯示「好的，你可以這樣寫代碼」。最終複製並執行這些代碼仍是人類的工作。但如果現在 AI 能像人類一樣親自打開檔案、讀取內容，甚至執行「儲存檔案」的動作呢？而且不需要安裝複雜的程式，僅靠電腦內建的微小工具就能辦到。

最近，開發者社群對僅用 400 行代碼製成的超小型 AI 編程代理 「Pu.sh」 產生了極大關注。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell 這小小的代碼究竟是如何成為 AI 的「手與腳」的呢？

為什麼這很重要？

如今 AI 領域最熱門的關鍵字是「代理（Agent，自主行動的人工智慧）」。但要在自己的電腦上直接運行這類代理，通常需要安裝數 GB 大小的沉重程式，或經過複雜的環境設定。這就像是為了修房子而必須叫來大型工程車一樣。

由「Nahim Nasser」開發的 Pu.sh 完全打破了這種常識。Pu.sh: Full Coding Agent in 400 Lines of Shell Script 這個工具就像是放進口袋裡的「瑞士刀」一樣小巧，卻具備了 AI 實際編程和執行所需的所有核心功能。400 行的長度僅相當於幾頁紙，但其中包含了 AI 與電腦對話的精髓。

這在技術上展示了 「Harness 工程（Harness Engineering）」 這一新領域的可能性。[Harness Engineering: The Complete Guide to Building Systems That Make AI Agents Actually Work (2026)

NxCode](https://www.nxcode.io/resources/news/harness-engineering-complete-guide-ai-agent-codex-2026) 「Harness」原意是指套在馬或狗身上的「馬具」，但在 AI 領域中，它意指將 AI 這個「智能」與現實世界（電腦環境）連接起來，使其能使用工具的「連接裝置」或「駕駛艙」。

深入淺出：AI 的駕駛艙，什麼是「Harness」？

AI 模型（如 ChatGPT、Claude）就像一個非常聰明的「大腦」。但僅靠這個大腦無法在電腦上建立檔案或從網路獲取資料。打個比方，這就像是世界上最優秀的飛行員坐在地板上，僅用嘴巴背誦飛機駕駛方法一樣。即使飛行員再天才，如果無法實際拉動操縱桿，飛機就不會起飛。

飛行員要讓飛機實際起飛，需要充滿拉桿、按鈕和螢幕的「駕駛艙」。簡單來說，這個駕駛艙就是 Harness。[Show HN: Gambit, an open-source agent harness for building reliable AI agents

Hacker News](https://news.ycombinator.com/item?id=46641362) 也就是將 AI 下達的判斷轉換為實際電腦指令的通道。

Pu.sh 僅用 400 行 Shell Script（直接向電腦作業系統下達指令的程式語言）就實現了這個駕駛艙。這是一個讓你能用極輕量裝備操控飛機的魔術般的工具。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell

Pu.sh 的核心秘訣：「代理循環（Agentic Loop）」

Pu.sh 如何在短短 400 行代碼中執行複雜任務？秘訣在於不斷重複的 「代理循環（Agentic Loop）」。pu.sh-ShellScriptCodingAgentHarness| EveryDev.ai

這個過程與廚師看著食譜做菜非常相似。

命令傳遞：使用者命令 AI：「幫我做義大利麵（執行特定任務）。」
解析（Parse）：AI 觀察情況後判斷：「現在該用刀（工具）切洋蔥了。」
執行（Execute）：Harness (Pu.sh) 實際拿起刀執行切洋蔥的動作（電腦指令）。
記錄（History）：將剛才切了洋蔥的事實寫在記錄本上，以免在下一步忘記。
重複：為了進入下一步（放入鍋中），再次回到第 1 步對自己下達命令。

Pu.sh 僅憑三種基本工具：sh（Shell，指令執行器）、curl（通訊工具）、awk（文本處理工具）就解決了這個複雜過程。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell 這意味著完全不需要安裝 Python 或 Docker 等沉重且複雜的程式。pu.sh—aslop cannonin400linesofshell

Harness 工程：AI 自行撰寫 100 萬行代碼的時代

像 Pu.sh 這樣的 Harness 系統之所以重要，是因為它不只是個玩具，而是未來的工作方式。

事實上，OpenAI 在 2026 年初宣佈，透過「Harness 工程」實驗，在人類完全不親自撰寫代碼的情況下，製作並發佈了軟體產品的內部測試版。[Harness engineering: leveraging Codex in an agent-first world

OpenAI](https://openai.com/index/harness-engineering/) 在此過程中，AI 代理處理了約 1,500 個合併請求（Pull Request），並自行生成了高達 100 萬行的代碼。[Beyond Prompts and Context: Harness Engineering for AI Agents

MadPlay🚀](https://madplay.github.io/en/post/harness-engineering) 100 萬行是一個驚人的數字，相當於用代碼填滿了 100 本厚小說。

這場實驗的核心不在於 AI 模型本身，而在於當 AI 失敗時能自我修復（Recovery）、設定環境（Environment setup）並能適當選擇工具的「Harness」性能。[Beyond Prompts and Context: Harness Engineering for AI Agents

MadPlay🚀](https://madplay.github.io/en/post/harness-engineering) 雖然初期生產力較低，但隨著駕駛艙（Harness）的逐步改進，開發速度比人類親自操作快了約 10 倍。

現狀：「口袋裡的魔法」vs「無法監控的代碼」

Pu.sh 可以連接 Anthropic 或 OpenAI 的最新 AI 模型使用，並支援 7 種強大的工具。Pu.sh: Full Coding Agent in 400 Lines of Shell Script 開發者稱此工具為「小到可以塞進口袋的 Slop cannon（能快速強效發射成果的砲彈）」。pu.sh—aslop cannonin400linesofshell

但有光就有影，對此工具的擔憂聲也不少。

安全威脅：為了湊齊「400 行」這個象徵性數字，Pu.sh 特意將代碼寫得密密麻麻、難以辨認（Minify）。This 400-line shell script runs AI coding agents. Nobody can audit it. 因此專家指出「使用者幾乎不可能親自檢查（Audit）代碼中是否存在危險陷阱」，並提出了安全問題。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell …
可靠性問題：由於代碼過於簡單，當發生意料之外的突發狀況時，可能缺乏系統性的防禦功能。因此有人批評這是「Vibe coded（不具體系、憑感覺寫的代碼）」。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell …

未來會如何發展？

Pu.sh 向我們提出了一個重要的問題：「使用 AI 代理真的需要龐大的系統嗎？」

今後，像 Pu.sh 這樣輕便且便攜的 Harness，與強化了安全功能的專業 Harness（例如用 Rust 語言開發的 OpenClaw 等）預計將相互競爭並發展。[Show HN: OpenClaw Harness – Security firewall for AI coding agents (Rust)

Hacker News](https://news.ycombinator.com/item?id=46854108)

此外，像 Anthropic 這樣的大型 AI 企業也在投入心血，發佈針對長時間自主運行的代理所設計的 Harness 設計原則。쉽게 설명한 하네스 엔지니어링 (Demystifying Harness Engineering), Haandol 核心是採用分離初始環境設定代理與實際編程代理的雙重結構方式。

最終，在未來，與其親自輸入代碼，開發者或許會花更多時間在設計與管理能讓 AI 代理安全高效工作的「最佳駕駛艙（Harness）」上。

AI 的觀點：MindTickleBytes AI 記者的觀點

「Pu.sh 似乎宣示了『編程代理界的極簡主義』。無需宏大的平台也能充分激發 AI 的潛力，這點令人驚嘆，但特意讓代碼難以閱讀，在『技術透明度』方面不免令人感到遺憾。因為真正的魔法不僅在於代碼簡短，更在於當代碼能被任何人信任並使用時，魔法才會真正發生。」

參考資料

Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell
Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell …
Pu.sh: Full Coding Agent in 400 Lines of Shell Script
Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell
Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell
This 400-line shell script runs AI coding agents. Nobody can audit it.

[Harness Engineering: The Complete Guide to Building Systems That Make AI Agents Actually Work (2026)

NxCode](https://www.nxcode.io/resources/news/harness-engineering-complete-guide-ai-agent-codex-2026)

[Harness engineering: leveraging Codex in an agent-first world OpenAI](https://openai.com/index/harness-engineering/)
[Beyond Prompts and Context: Harness Engineering for AI Agents MadPlay🚀](https://madplay.github.io/en/post/harness-engineering)
[Show HN: Gambit, an open-source agent harness for building reliable AI agents Hacker News](https://news.ycombinator.com/item?id=46641362)
[pu.sh-ShellScriptCodingAgentHarness EveryDev.ai](https://www.everydev.ai/tools/pu-sh)
pu.sh—aslop cannonin400linesofshell
쉽게 설명한 하네스 엔지니어링 (Demystifying Harness Engineering), Haandol
[Show HN: OpenClaw Harness – Security firewall for AI coding agents (Rust) Hacker News](https://news.ycombinator.com/item?id=46854108)

Share this article:

測試你的理解

Q1. Pu.sh 運行必須具備哪三種基本工具？

Python, Node.js, Docker
sh, curl, awk
Java, C++, Git

Pu.sh 不使用額外沉重的程式，僅使用每台電腦基本上都內建的 sh（Shell）、curl（通訊工具）和 awk（文本處理工具）。

Q2. 以比喻方式表達「Harness 工程」時，最恰當的說明是？

讓 AI 的大腦變得更大的技術
設計讓 AI 飛行員能實際操控飛機的「駕駛艙」
美化 AI 畫作的技術

Harness（馬具/控制架）指的是讓 AI 這種智能能夠與實際電腦環境交互並使用工具的執行框架。

Q3. 在 OpenAI 進行的實驗中，透過 Harness 工程在人類完全不親自撰寫代碼的情況下，生成的代碼量是多少？

約 1 萬行
約 50 萬行
約 100 萬行

OpenAI 利用 Harness 工程系統，在沒有人類直接干預的情況下，成功實驗生成並部署了約 100 萬行的代碼。