介紹一款擴充功能『peerd』,它能在瀏覽器環境中直接執行 AI 代理,無需後端伺服器或傳輸個人資訊,即可自動化執行網頁任務。
試想一下,如果每天早上進公司後,那些重複瀏覽多個網站、確認資料並整理內容的例行工作,有人能幫你完成,那會是什麼樣的情景?以往為了自動化這些任務,必須使用複雜的程式或雲端服務,過程中難免擔心寶貴的個人資訊被傳送到外部伺服器。但現在,一位直接在你的瀏覽器這間「私人工作室」工作的 AI 代理誕生了。它就是『peerd』。
為什麼這很重要? (Why It Matters)
隨著 AI 技術的發展,透過網頁瀏覽器自主執行任務的「AI 代理」正受到關注。然而,傳統方法在安全與隱私方面往往有不足之處,因為使用者必須將瀏覽器資料傳輸至外部雲端伺服器,或者對於非技術背景的一般使用者而言,設定過於複雜。
『peerd』徹底改變了這一趨勢。這款擴充功能不透過任何後端伺服器,也就是說,它不會將資料傳輸至外部,AI 僅在使用者瀏覽器內進行思考與行動。在不暴露含有登入資訊或敏感工作階段 (Session) 資料的瀏覽器環境下,即可享受強大的工作自動化功能,這對使用者而言,提供了巨大的心理安全感與便利性。出處: GitHub - NotASithLord/peerd
輕鬆理解 (The Explainer)
要理解 peerd,需要了解「瀏覽器代理工具 (Browser Agent Harness)」這個概念。『Harness』原本是指登山時保護身體安全的掛鉤設備,這裡的工具則扮演著安全且靈活的導航角色,協助 AI 在瀏覽器這間「工作室」中自由穿梭。
簡單來說,若將過去的 AI 代理比喻為在外部遠端遙控的機械手臂,peerd 就如同聘請了一位直接進入你的瀏覽器、坐在你身旁的「聰明秘書」。這位秘書可以直接點擊標籤頁、輸入鍵盤內容,甚至直接在瀏覽器內部啟動小型電腦(如 JavaScript 筆記本或 WASM Linux 虛擬機器等)進行複雜的資料計算。出處: GitHub - NotASithLord/peerd
由於所有過程都在本地環境中發生,執行速度既快速又安全,宛如親自進行網頁瀏覽一般。
目前狀況 (Where We Stand)
目前 peerd 以 Chrome 及 Firefox 瀏覽器擴充功能的形式提供。使用者需自行輸入 API 金鑰 (BYOK, Bring Your Own Key) 來使用,資料控制權完全掌握在使用者手中。出處: GitHub - NotASithLord/peerd
不過,由於這項技術尚處於初期階段,使用者可能需要自行準備 API 金鑰,手續稍顯繁瑣。此外,由於代理是在瀏覽器環境中直接進行推論並執行迴圈,需注意它會消耗一定的 CPU 或記憶體資源。
未來展望 (What’s Next)
展望未來,基於瀏覽器的 AI 代理技術預計將會更加精緻。對於將資料保護視為首要任務的企業或個人而言,像 peerd 這樣直接在本地環境執行的方法,將成為必備選擇。
我們即將跨越僅僅「瀏覽」網頁的時代,邁向可以對 AI 秘書說:「幫我整理現在瀏覽器中需要確認的資料,並製作成報告」的新紀元。這款小小的擴充功能究竟能將工作效率提升到什麼程度,非常值得期待。
AI 的視角 (AI’s Take)
MindTickleBytes AI 記者觀點:擺脫傳統伺服器依賴模式,試圖在瀏覽器這個本地環境中解決所有問題的嘗試令人振奮。真正的 AI 秘書應在使用者最親近的空間,保護隱私的同時並肩作戰。peerd 已經邁出了第一步。
參考資料
- GitHub - NotASithLord/peerd: The first AI agent harness native to the browser. A Chrome/Firefox extension that runs the agent loop in your browser — drives your tabs, spins up sandboxed compute (JS notebooks, WASM Linux VMs, client-side apps), and shares what it builds peer-to-peer. BYOK · no backend · no telemetry.
-
[Show HN: Browser Harness – Gives LLM freedom to complete any browser task Hacker News](https://news.ycombinator.com/item?id=47890841) -
[Show HN: Open-source browser for AI agents Hacker News](https://news.ycombinator.com/item?id=47336171) - Review of Browser Harness — Giving AI Agents the Keys to Your Browser
-
[Browser Harness: Give AI Agents Your Real Browser (Not a … NeuralStackly](https://neuralstackly.com/blog/browser-harness-cdp-ai-agents) -
[Browser Harness: Why Your AI Agent Needs Direct Browser Control (Not Another Framework) Flowtivity](https://flowtivity.ai/blog/browser-harness-why-your-ai-agent-needs-direct-browser-control/) -
[Exploratory QA with AI Agents: Building a Site-Agnostic Harness alexop.dev](https://alexop.dev/posts/exploratory-qa-ai-agents-site-agnostic-harness/)
- 在雲端伺服器上運作
- 直接在瀏覽器內執行代理迴圈
- 免費提供所有 API
- 高效能 GPU 伺服器
- 使用者自行準備的 API 金鑰 (BYOK)
- 具有管理員權限的帳號
- 瀏覽器標籤頁操作、沙盒環境執行、內容共享
- 作業系統重灌
- 中斷網際網路連線