我口袋裡的 AI 開發者?僅用 400 行代碼完成的魔法工具「Pu.sh」

電腦終端螢幕上流動著簡約的代碼,旁邊是一個拿著編程工具的小機器人。
AI Summary

公開了僅憑「sh, curl, awk」等基本工具即可運行、且無需複雜安裝過程的 400 行超小型 AI 編程代理「Pu.sh」,引發熱議。

試著想像一下。你命令 AI:「讀取我電腦上的這個檔案,摘要內容後存成新檔案。」到目前為止,AI 通常只會在螢幕上顯示「好的,你可以這樣寫代碼」。最終複製並執行這些代碼仍是人類的工作。但如果現在 AI 能像人類一樣親自打開檔案、讀取內容,甚至執行「儲存檔案」的動作呢?而且不需要安裝複雜的程式,僅靠電腦內建的微小工具就能辦到。

最近,開發者社群對僅用 400 行代碼製成的超小型 AI 編程代理 「Pu.sh」 產生了極大關注。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell 這小小的代碼究竟是如何成為 AI 的「手與腳」的呢?

為什麼這很重要?

如今 AI 領域最熱門的關鍵字是「代理(Agent,自主行動的人工智慧)」。但要在自己的電腦上直接運行這類代理,通常需要安裝數 GB 大小的沉重程式,或經過複雜的環境設定。這就像是為了修房子而必須叫來大型工程車一樣。

由「Nahim Nasser」開發的 Pu.sh 完全打破了這種常識。Pu.sh: Full Coding Agent in 400 Lines of Shell Script 這個工具就像是放進口袋裡的「瑞士刀」一樣小巧,卻具備了 AI 實際編程和執行所需的所有核心功能。400 行的長度僅相當於幾頁紙,但其中包含了 AI 與電腦對話的精髓。

這在技術上展示了 「Harness 工程(Harness Engineering)」 這一新領域的可能性。[Harness Engineering: The Complete Guide to Building Systems That Make AI Agents Actually Work (2026) NxCode](https://www.nxcode.io/resources/news/harness-engineering-complete-guide-ai-agent-codex-2026) 「Harness」原意是指套在馬或狗身上的「馬具」,但在 AI 領域中,它意指將 AI 這個「智能」與現實世界(電腦環境)連接起來,使其能使用工具的「連接裝置」或「駕駛艙」。

深入淺出:AI 的駕駛艙,什麼是「Harness」?

AI 模型(如 ChatGPT、Claude)就像一個非常聰明的「大腦」。但僅靠這個大腦無法在電腦上建立檔案或從網路獲取資料。打個比方,這就像是世界上最優秀的飛行員坐在地板上,僅用嘴巴背誦飛機駕駛方法一樣。即使飛行員再天才,如果無法實際拉動操縱桿,飛機就不會起飛。

飛行員要讓飛機實際起飛,需要充滿拉桿、按鈕和螢幕的「駕駛艙」。簡單來說,這個駕駛艙就是 Harness。[Show HN: Gambit, an open-source agent harness for building reliable AI agents Hacker News](https://news.ycombinator.com/item?id=46641362) 也就是將 AI 下達的判斷轉換為實際電腦指令的通道。

Pu.sh 僅用 400 行 Shell Script(直接向電腦作業系統下達指令的程式語言)就實現了這個駕駛艙。這是一個讓你能用極輕量裝備操控飛機的魔術般的工具。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell

Pu.sh 的核心秘訣:「代理循環(Agentic Loop)」

Pu.sh 如何在短短 400 行代碼中執行複雜任務?秘訣在於不斷重複的 「代理循環(Agentic Loop)」pu.sh-ShellScriptCodingAgentHarness| EveryDev.ai

這個過程與廚師看著食譜做菜非常相似。

  1. 命令傳遞:使用者命令 AI:「幫我做義大利麵(執行特定任務)。」
  2. 解析(Parse):AI 觀察情況後判斷:「現在該用刀(工具)切洋蔥了。」
  3. 執行(Execute):Harness (Pu.sh) 實際拿起刀執行切洋蔥的動作(電腦指令)。
  4. 記錄(History):將剛才切了洋蔥的事實寫在記錄本上,以免在下一步忘記。
  5. 重複:為了進入下一步(放入鍋中),再次回到第 1 步對自己下達命令。

Pu.sh 僅憑三種基本工具:sh(Shell,指令執行器)、curl(通訊工具)、awk(文本處理工具)就解決了這個複雜過程。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell 這意味著完全不需要安裝 Python 或 Docker 等沉重且複雜的程式。pu.sh—aslop cannonin400linesofshell

Harness 工程:AI 自行撰寫 100 萬行代碼的時代

像 Pu.sh 這樣的 Harness 系統之所以重要,是因為它不只是個玩具,而是未來的工作方式。

事實上,OpenAI 在 2026 年初宣佈,透過「Harness 工程」實驗,在人類完全不親自撰寫代碼的情況下,製作並發佈了軟體產品的內部測試版。[Harness engineering: leveraging Codex in an agent-first world OpenAI](https://openai.com/index/harness-engineering/) 在此過程中,AI 代理處理了約 1,500 個合併請求(Pull Request),並自行生成了高達 100 萬行的代碼。[Beyond Prompts and Context: Harness Engineering for AI Agents MadPlay🚀](https://madplay.github.io/en/post/harness-engineering) 100 萬行是一個驚人的數字,相當於用代碼填滿了 100 本厚小說。
這場實驗的核心不在於 AI 模型本身,而在於當 AI 失敗時能自我修復(Recovery)、設定環境(Environment setup)並能適當選擇工具的「Harness」性能。[Beyond Prompts and Context: Harness Engineering for AI Agents MadPlay🚀](https://madplay.github.io/en/post/harness-engineering) 雖然初期生產力較低,但隨著駕駛艙(Harness)的逐步改進,開發速度比人類親自操作快了約 10 倍。

現狀:「口袋裡的魔法」vs「無法監控的代碼」

Pu.sh 可以連接 Anthropic 或 OpenAI 的最新 AI 模型使用,並支援 7 種強大的工具。Pu.sh: Full Coding Agent in 400 Lines of Shell Script 開發者稱此工具為「小到可以塞進口袋的 Slop cannon(能快速強效發射成果的砲彈)」。pu.sh—aslop cannonin400linesofshell

但有光就有影,對此工具的擔憂聲也不少。

  1. 安全威脅:為了湊齊「400 行」這個象徵性數字,Pu.sh 特意將代碼寫得密密麻麻、難以辨認(Minify)。This 400-line shell script runs AI coding agents. Nobody can audit it. 因此專家指出「使用者幾乎不可能親自檢查(Audit)代碼中是否存在危險陷阱」,並提出了安全問題。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell …
  2. 可靠性問題:由於代碼過於簡單,當發生意料之外的突發狀況時,可能缺乏系統性的防禦功能。因此有人批評這是「Vibe coded(不具體系、憑感覺寫的代碼)」。Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell …

未來會如何發展?

Pu.sh 向我們提出了一個重要的問題:「使用 AI 代理真的需要龐大的系統嗎?」

今後,像 Pu.sh 這樣輕便且便攜的 Harness,與強化了安全功能的專業 Harness(例如用 Rust 語言開發的 OpenClaw 等)預計將相互競爭並發展。[Show HN: OpenClaw Harness – Security firewall for AI coding agents (Rust) Hacker News](https://news.ycombinator.com/item?id=46854108)

此外,像 Anthropic 這樣的大型 AI 企業也在投入心血,發佈針對長時間自主運行的代理所設計的 Harness 設計原則。쉽게 설명한 하네스 엔지니어링 (Demystifying Harness Engineering), Haandol 核心是採用分離初始環境設定代理與實際編程代理的雙重結構方式。

最終,在未來,與其親自輸入代碼,開發者或許會花更多時間在設計與管理能讓 AI 代理安全高效工作的「最佳駕駛艙(Harness)」上。

AI 的觀點:MindTickleBytes AI 記者的觀點

「Pu.sh 似乎宣示了『編程代理界的極簡主義』。無需宏大的平台也能充分激發 AI 的潛力,這點令人驚嘆,但特意讓代碼難以閱讀,在『技術透明度』方面不免令人感到遺憾。因為真正的魔法不僅在於代碼簡短,更在於當代碼能被任何人信任並使用時,魔法才會真正發生。」

參考資料

  1. Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell
  2. Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell …
  3. Pu.sh: Full Coding Agent in 400 Lines of Shell Script
  4. Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell
  5. Show HN: Pu.sh - a full coding-agent harness in 400 lines of shell
  6. This 400-line shell script runs AI coding agents. Nobody can audit it.
  7. [Harness Engineering: The Complete Guide to Building Systems That Make AI Agents Actually Work (2026) NxCode](https://www.nxcode.io/resources/news/harness-engineering-complete-guide-ai-agent-codex-2026)
  8. [Harness engineering: leveraging Codex in an agent-first world OpenAI](https://openai.com/index/harness-engineering/)
  9. [Beyond Prompts and Context: Harness Engineering for AI Agents MadPlay🚀](https://madplay.github.io/en/post/harness-engineering)
  10. [Show HN: Gambit, an open-source agent harness for building reliable AI agents Hacker News](https://news.ycombinator.com/item?id=46641362)
  11. [pu.sh-ShellScriptCodingAgentHarness EveryDev.ai](https://www.everydev.ai/tools/pu-sh)
  12. pu.sh—aslop cannonin400linesofshell
  13. 쉽게 설명한 하네스 엔지니어링 (Demystifying Harness Engineering), Haandol
  14. [Show HN: OpenClaw Harness – Security firewall for AI coding agents (Rust) Hacker News](https://news.ycombinator.com/item?id=46854108)
測試你的理解
Q1. Pu.sh 運行必須具備哪三種基本工具?
  • Python, Node.js, Docker
  • sh, curl, awk
  • Java, C++, Git
Pu.sh 不使用額外沉重的程式,僅使用每台電腦基本上都內建的 sh(Shell)、curl(通訊工具)和 awk(文本處理工具)。
Q2. 以比喻方式表達「Harness 工程」時,最恰當的說明是?
  • 讓 AI 的大腦變得更大的技術
  • 設計讓 AI 飛行員能實際操控飛機的「駕駛艙」
  • 美化 AI 畫作的技術
Harness(馬具/控制架)指的是讓 AI 這種智能能夠與實際電腦環境交互並使用工具的執行框架。
Q3. 在 OpenAI 進行的實驗中,透過 Harness 工程在人類完全不親自撰寫代碼的情況下,生成的代碼量是多少?
  • 約 1 萬行
  • 約 50 萬行
  • 約 100 萬行
OpenAI 利用 Harness 工程系統,在沒有人類直接干預的情況下,成功實驗生成並部署了約 100 萬行的代碼。