在我的瀏覽器中直接工作的智慧秘書,『peerd』帶來的改變

概念圖:網頁瀏覽器介面上方的 AI 代理圖示已啟動,正在操作標籤頁。
AI Summary

介紹一款擴充功能『peerd』,它能在瀏覽器環境中直接執行 AI 代理,無需後端伺服器或傳輸個人資訊,即可自動化執行網頁任務。

試想一下,如果每天早上進公司後,那些重複瀏覽多個網站、確認資料並整理內容的例行工作,有人能幫你完成,那會是什麼樣的情景?以往為了自動化這些任務,必須使用複雜的程式或雲端服務,過程中難免擔心寶貴的個人資訊被傳送到外部伺服器。但現在,一位直接在你的瀏覽器這間「私人工作室」工作的 AI 代理誕生了。它就是『peerd』。

為什麼這很重要? (Why It Matters)

隨著 AI 技術的發展,透過網頁瀏覽器自主執行任務的「AI 代理」正受到關注。然而,傳統方法在安全與隱私方面往往有不足之處,因為使用者必須將瀏覽器資料傳輸至外部雲端伺服器,或者對於非技術背景的一般使用者而言,設定過於複雜。

『peerd』徹底改變了這一趨勢。這款擴充功能不透過任何後端伺服器,也就是說,它不會將資料傳輸至外部,AI 僅在使用者瀏覽器內進行思考與行動。在不暴露含有登入資訊或敏感工作階段 (Session) 資料的瀏覽器環境下,即可享受強大的工作自動化功能,這對使用者而言,提供了巨大的心理安全感與便利性。出處: GitHub - NotASithLord/peerd

輕鬆理解 (The Explainer)

要理解 peerd,需要了解「瀏覽器代理工具 (Browser Agent Harness)」這個概念。『Harness』原本是指登山時保護身體安全的掛鉤設備,這裡的工具則扮演著安全且靈活的導航角色,協助 AI 在瀏覽器這間「工作室」中自由穿梭。

簡單來說,若將過去的 AI 代理比喻為在外部遠端遙控的機械手臂,peerd 就如同聘請了一位直接進入你的瀏覽器、坐在你身旁的「聰明秘書」。這位秘書可以直接點擊標籤頁、輸入鍵盤內容,甚至直接在瀏覽器內部啟動小型電腦(如 JavaScript 筆記本或 WASM Linux 虛擬機器等)進行複雜的資料計算。出處: GitHub - NotASithLord/peerd

由於所有過程都在本地環境中發生,執行速度既快速又安全,宛如親自進行網頁瀏覽一般。

目前狀況 (Where We Stand)

目前 peerd 以 Chrome 及 Firefox 瀏覽器擴充功能的形式提供。使用者需自行輸入 API 金鑰 (BYOK, Bring Your Own Key) 來使用,資料控制權完全掌握在使用者手中。出處: GitHub - NotASithLord/peerd

不過,由於這項技術尚處於初期階段,使用者可能需要自行準備 API 金鑰,手續稍顯繁瑣。此外,由於代理是在瀏覽器環境中直接進行推論並執行迴圈,需注意它會消耗一定的 CPU 或記憶體資源。

未來展望 (What’s Next)

展望未來,基於瀏覽器的 AI 代理技術預計將會更加精緻。對於將資料保護視為首要任務的企業或個人而言,像 peerd 這樣直接在本地環境執行的方法,將成為必備選擇。

我們即將跨越僅僅「瀏覽」網頁的時代,邁向可以對 AI 秘書說:「幫我整理現在瀏覽器中需要確認的資料,並製作成報告」的新紀元。這款小小的擴充功能究竟能將工作效率提升到什麼程度,非常值得期待。

AI 的視角 (AI’s Take)

MindTickleBytes AI 記者觀點:擺脫傳統伺服器依賴模式,試圖在瀏覽器這個本地環境中解決所有問題的嘗試令人振奮。真正的 AI 秘書應在使用者最親近的空間,保護隱私的同時並肩作戰。peerd 已經邁出了第一步。

參考資料

  1. GitHub - NotASithLord/peerd: The first AI agent harness native to the browser. A Chrome/Firefox extension that runs the agent loop in your browser — drives your tabs, spins up sandboxed compute (JS notebooks, WASM Linux VMs, client-side apps), and shares what it builds peer-to-peer. BYOK · no backend · no telemetry.
  2. [Show HN: Browser Harness – Gives LLM freedom to complete any browser task Hacker News](https://news.ycombinator.com/item?id=47890841)
  3. [Show HN: Open-source browser for AI agents Hacker News](https://news.ycombinator.com/item?id=47336171)
  4. Review of Browser Harness — Giving AI Agents the Keys to Your Browser
  5. [Browser Harness: Give AI Agents Your Real Browser (Not a … NeuralStackly](https://neuralstackly.com/blog/browser-harness-cdp-ai-agents)
  6. [Browser Harness: Why Your AI Agent Needs Direct Browser Control (Not Another Framework) Flowtivity](https://flowtivity.ai/blog/browser-harness-why-your-ai-agent-needs-direct-browser-control/)
  7. [Exploratory QA with AI Agents: Building a Site-Agnostic Harness alexop.dev](https://alexop.dev/posts/exploratory-qa-ai-agents-site-agnostic-harness/)
測試你的理解
Q1. peerd 的最大特點是什麼?
  • 在雲端伺服器上運作
  • 直接在瀏覽器內執行代理迴圈
  • 免費提供所有 API
peerd 是一款擴充功能,無需額外後端,直接在使用者的網頁瀏覽器中執行 AI 代理迴圈。
Q2. 使用 peerd 需要什麼?
  • 高效能 GPU 伺服器
  • 使用者自行準備的 API 金鑰 (BYOK)
  • 具有管理員權限的帳號
採用使用者自行輸入 API 金鑰 (BYOK, Bring Your Own Key) 的方式。
Q3. peerd 可以執行哪些功能?
  • 瀏覽器標籤頁操作、沙盒環境執行、內容共享
  • 作業系統重灌
  • 中斷網際網路連線
peerd 可操作瀏覽器標籤頁,支援 JavaScript 筆記本或基於 WASM 的虛擬機器等沙盒運算環境,並可透過 P2P 共享結果。