潛入我網站的 AI「間諜」？四大 AI 機器人的即時調查結果

AI Summary

一名研究人員為四大 AI 機器人提供了專屬連結並監控伺服器日誌，結果顯示各個 AI 在收集資訊的方式和「誠實度」方面存在巨大差異。

想像一下。你建造了一個裝滿珍貴資訊的秘密房間，並給四位朋友分別發送了貼有不同名牌的邀請函。然後你躲在門後，偷偷觀察誰真正進入了房間，以及如果進來了，他們佩戴的是哪個名牌。如果受邀的朋友撕掉名牌偷偷溜進來，或者根本沒進房間卻撒謊說「我都看過了」，你會怎麼想？

最近，一名研究人員在網路世界中執行了完全相同的事情。對象是我們每天使用的四大 AI 巨頭：ChatGPT、Claude、Perplexity 和 Gemini。來自聊天機器人的 AI 流量：HN 實驗 - PromptZone

當我們要求 AI「去這個連結並摘要內容」時，是為了確認它們是否真的即時訪問了網站，還是僅僅提取了以前儲存的陳舊資訊。這場扣人心弦的「潛入調查」結果可能會完全改變我們看待 AI 的方式。

為什麼這很重要？

我們經常請 AI 摘要最新新聞、今天早上的股價或是剛發布的部落格文章。如果 AI 此時沒有即時訪問網站，你就有可能把一個月前的陳舊資訊誤認為今天發生的事情。

簡單來說，這是在確認 AI 是「真正會去現場調查的能幹偵探」，還是「只會翻閱舊報紙剪報本的圖書館管理員」。這種差異直接關係到資訊的準確性和生命力。特別是在 2026 年的今天，GPT-5.2 或 Gemini 3 Pro 等超強大 AI 出現的時代，它們獲取資訊方式的「透明度」已成為技術信任的核心。ChatGPT vs Claude vs Gemini vs Perplexity：2026… - Y Build

輕鬆理解：追蹤 AI 的「足跡」

研究人員利用了 Nginx（記錄網站訪問記錄的伺服器程式） 日誌。就像我們去餐廳會填寫實名登記表一樣，網站伺服器也會詳細記錄誰、何時、透過什麼路徑進入。[AI 流量 vs 推薦流量：nginx 日誌證明了什麼

SurfacedBy](https://surfacedby.com/blog/nginx-logs-ai-traffic-vs-referral-traffic)

1. 貼上唯一的名牌

研究人員不只是給 AI 連結，還在連結後加上了特別的代碼。

給 ChatGPT 包含 /?ai=chatgpt 的網址，
給 Claude 包含 /?ai=claude 的網址。

這樣一來，只需查看伺服器紀錄中留下的「足跡」，就能立刻知道是哪款 AI 訪問了網站。因為無論判斷上下文的 Transformer（一種 AI 核心架構，透過分析句子前後脈絡來理解含義）技術如何進步，都無法隱瞞留在伺服器帳本上的物理訪問痕跡。

2. 「禁止使用舊記錄！」

為了防止 AI 重複使用以前訪問過的紀錄（專業術語稱為「快取命中」，Cache Hit）來回答問題，研究人員多次重新執行了提示語。這是在即時監控 AI 是否不辭辛勞地每次都獲取最新資訊。AI 流量 vs 推薦流量：nginx 日誌證明了什麼 | SurfacedBy

調查結果：誰誠實地訪問了？

實驗結果相當令人震驚。特別是 Google 的 Gemini 和 Anthropic 的 Claude 表現出了完全不同的態度。

Gemini 的「隱身」模式

Google 引以為傲的 Gemini 是能協助從寫作到日程管理的聰明助手。Google Gemini 但在這次實驗中，Gemini 表現出了出人意料的一面。結果顯示，它在訪問網站時，並沒有清晰地佩戴標示自己身份的「使用者代理 (User-agent，包含訪問者身份資訊的字串)」名牌。我提示了 ChatGPT, Claude, Perplexity 和 Gemini 並觀察了我的 Nginx 日誌 | Hacker News

打個比方，這就像客人進了餐廳，卻遮住臉且沒有名牌地坐下來吃飯後離開。研究人員對 Google 為什麼要這樣隱藏身份收集資訊，以及這是否為故意的「隱身」行為提出了深刻的質疑。

Claude 的「誠實」告白

另一方面，Claude 獲得了截然相反的評價。開發商 Anthropic 一直強調，他們從一開始就將 Claude 訓練成「安全、誠實且安全性高」的 AI。Claude

根據使用者的實際經驗，Claude 在遇到自己不知道的內容時，與其強行編造答案，不如誠實地坦白：「抱歉，那部分我不太清楚。」我取消了 ChatGPT、Perplexity 和 Gemini 的訂閱，轉向 Claude——我早該這麼做的

當其他 AI 為了迎合使用者心情而扮演「老好人 (People-pleasing)」，製造假資訊時，Claude 則扮演著一個不知道就說不知道的誠實朋友。這種誠實已成為在商業或研究領域選擇 Claude 的強大武器。

現況：AI 機器人的春秋戰國時代

2026 年的今天，人工智慧市場簡直就是戰場。GPT-5.2、Claude Sonnet 4.6、Gemini 3 Pro 等巨型模型每月都會推出新功能進行競爭。ChatGPT vs Claude vs Gemini vs Perplexity：2026… - Y Build

隨著性能的提升，副作用也不容小覷。像 ZeroGPT 這樣可以辨別 AI 撰寫文章的工具，已經擁有數百萬使用者，成為了必備服務。AI 檢測器 - 值得信賴的 ChatGPT、GPT5 與 Gemini 檢查工具為了讓我們真心相信 AI 的回答，它們從何處以及如何獲取資訊的方式必須更加透明地公開。

同時，搜尋專用的 AI Perplexity 雖然仍是強大的工具，但也因一些技術問題被擱置一年多而受到批評。這表明不同 AI 服務在可靠性和技術完整性方面存在明顯差異。Reddit 上的 r/AIAssisted：ChatGPT vs Grok vs Gemini vs Claude vs Perplexity

未來將會如何？

未來，AI 將會更加精緻且巧妙地穿梭在網路世界中。有些 AI 會想成為在主人不知情的情況下瀏覽資訊的「影子」，而有些 AI 則會想成為大方表明身份並獲取資訊的「堂堂正正的客人」。

作為使用者的我們，要做的事情很明確。與其僅僅感嘆回答迅速且流暢，不如不斷提問：「這款 AI 真的確認了此時此刻的資訊嗎？」 像這次實驗一樣，個人透過伺服器紀錄直接監控 AI 行為的「基層監控」活動，預計在未來將變得更加重要。

你的 AI 助手在此時此刻，真的為你奔赴在艱險的網路現場嗎？還是在溫暖的房間裡反覆咀嚼陳舊的記憶來欺騙你？

AI 的觀點：MindTickleBytes AI 記者觀點

AI 探索網路的方式就像我們在圖書館借書一樣。有些 AI 會透明地留下借閱記錄，但有些 AI 則會偷偷溜進去只拍下書的內容。技術越發達，「知道了什麼」將不再如「如何知道的」這一來源透明度重要，這將成為決定該 AI 價值的最重要指標。

參考資料

[我提示了 ChatGPT, Claude, Perplexity 和 Gemini 並觀察了我的 Nginx 日誌

Hacker News](https://news.ycombinator.com/item?id=47835646)

來自聊天機器人的 AI 流量：HN 實驗 - PromptZone - 領先的提示工程與 AI 愛好者社群
[AI 流量 vs 推薦流量：nginx 日誌證明了什麼 SurfacedBy](https://surfacedby.com/blog/nginx-logs-ai-traffic-vs-referral-traffic)
我取消了 ChatGPT、Perplexity 和 Gemini 的訂閱，轉向 Claude——我早該這麼做的
Reddit 上的 r/AIAssisted：ChatGPT vs Grok vs Gemini vs Claude vs Perplexity
Google Gemini
ChatGPT vs Claude vs Gemini vs Perplexity：2026… - Y Build
AI 檢測器 - 值得信賴的 ChatGPT、GPT5 與 Gemini 檢查工具
Claude
在 ChatGPT、Claude 之間選擇的實用指南…

FACT-CHECK SUMMARY

Claims checked: 11
Claims verified: 11
Verdict: PASS

Share this article:

測試你的理解

Q1. 在這次實驗中，研究人員使用了什麼方法來區分不同的 AI 機器人？

詢問 AI 的名字
為每個 AI 提供包含唯一查詢字串 (/?ai=...) 的連結
追蹤 AI 的 IP 地址

研究人員為每個 AI 助手提供了包含不同唯一查詢字串（例如：/?ai=chatgpt）的提示語，以便在伺服器日誌中進行區分。

Q2. 根據實驗結果，哪款 AI 在訪問網站時沒有留下清晰且可識別的「使用者代理」(User-agent) 資訊？

ChatGPT
Claude
Gemini

根據實驗結果，據報導 Google 的 Gemini 在訪問網站時並未開啟顯示其身份的明顯使用者代理 (User-agent) 字串。

Q3. 評論者評價 Claude 的最大特點之一是什麼？

說話總像是在給出正確答案
更有可能承認自己不知道的事情
總是提供最長的回答

當被問及不知道的內容或超出其能力的題目時，Claude 被評為更有可能說不知道，而不是強行編造答案。