AI 挑選數字時堅持選「73」的令人毛骨悚然的原因

與人類腦波連結的數位骰子正指向數字 73 的神秘 3D 插畫
AI Summary

AI 並非完美的隨機數生成器,它透過數據原封不動地學習了人類的心理偏見,在挑選隨機數字時,會表現出偏愛「73」或「37」等特定數字的傾向。

想像一下。下班後,您和好朋友聚在一家氣氛不錯的咖啡廳裡喝著咖啡。趁著話題暫停的空檔,有人開玩笑地提議:「我們來玩個遊戲,大家在心裡隨便想一個 1 到 100 之間的隨機數字,然後同時喊出來吧!」此刻您的腦海中浮現了哪個數字呢?

給您一點時間思考。(1秒… 2秒… 3秒…)

或許您避開了像「50」或「100」這種尾數剛好為 0 的整數。因為總覺得那種數字太過人為,缺乏「隨機」的感覺。取而代之的,您是不是無意識地挑選了像「37」、「73」,或是「43」這種由質數(Prime number,只能被 1 和自己整除的數)組成,或者看起來有點凌亂、複雜的數字呢?人類的心理真的很奇妙,為了「看起來」像真的隨機,反而會有意避開特定模式的數字,轉而選擇其他數字。

令人驚訝的是,這並不是您獨有的特殊習慣。根據 GPT 猜測 1 到 100 之間的數字 - GitHub 的資料,人類本質上並不是一個「優秀的隨機數生成器」。如果要求人們挑選隨機數字,結果往往出乎意料地容易預測。人們的回答主要集中在 37 和 73 等特定數字,或是所謂的「凌亂(messy)」數字上。此外,也有很多人會選擇網路社群中流行的迷因(Meme)數字,例如 42 或 69。相反地,剛好湊整的整數則被徹底冷落,悄悄地遭到無視 GPT 猜測 1 到 100 之間的數字 - GitHub

到這裡為止,可能還只是一個有趣的心理學事實。但真正讓我們感到毛骨悚然的事實另有所在:當我們向看似毫無情感與偏見的最尖端人工智慧(AI)提出同樣的問題時,AI 竟表現出與人類驚人相似的行為。在人工智慧世界裡最基礎的指令之一——「請隨機挑選一個數字」背後,究竟隱藏著多麼巨大的偏見秘密?現在就讓我們來輕鬆且深入地探討。

這為什麼重要? (Why It Matters)

在我們的日常生活中,智慧型手機的語音助理或聊天機器人正變得越來越聰明。我們往往傾向於盲目相信電腦程式或人工智慧是毫無情緒波動、完美客觀的「數位計算機」。如果讓傳統電腦擲骰子或拋硬幣,我們理所當然會認為所有結果出現的機率在數學上應該是完全相等的。

然而,如今席捲全球的大型語言模型(LLM,一種透過學習龐大文本數據來像人類一樣生成句子的 AI 技術),其運作方式與過去死板的計算機截然不同。簡單來說,最新的 AI 比較不像數學家,反而更像是一個極度懂得察言觀色的語言學家。如果我們給予無限信任的 AI,就連在簡單挑選隨機數字的過程中,都完全無視數學機率,極端偏愛特定數字的話,會發生什麼事呢?

這帶來了非常重大的啟示。如果連挑選一個隨機數字這麼簡單的事,AI 都會盲目跟從人類不理性的偏好,那麼在處理更複雜的問題時會是如何,我們必須好好想像一下。因為這意味著,當我們讓 AI 審查無數求職者的履歷、分析法律判例,或是為了貸款審查進行隨機抽樣時,那些我們未曾察覺的「人類偏見」,都可能隱密地滲透到 AI 的決策之中。AI 挑選隨機數字的方式,並不僅僅是有趣的技術錯誤,它是一個完美的證據,展示了這項技術是多麼盲目地反映人類的鏡子。

輕鬆理解 (The Explainer)

為了清楚理解這個現象,我們來打個比方。傳統電腦程式生成隨機數字的「均勻隨機數生成器(Uniform random number generator)」系統,就像賭場裡完美平衡的輪盤(Roulette wheel)一樣。當你用力轉動寫有 1 到 100 數字的輪盤時,伴隨著喀噠聲,珠子落入「1」、落入「50」以及落入「73」的機率是完全相等的。沒有任何數字會受到機器的特殊待遇。

然而,最近專家們發表了令人震驚的實驗結果。根據 2026-05-25 簡報 - alobbs.com 介紹的研究,研究人員針對 OpenAI 的 AI 模型 GPT-4.1,發送了高達 10,000 次獨立請求。這就好像把一個人整天關在房間裡,要他不停地喊出 1 到 100 之間的數字。如果 AI 像傳統電腦一樣轉動公平的輪盤,那麼所有數字應該被均勻地喊出大約 100 次才算正常。但結果卻令人震驚:GPT-4.1 模型的輸出結果在統計上嚴重偏離了公平分佈(significant statistical deviation),這讓模型絕非在轉動均勻輪盤的事實真相大白 2026-05-25 簡報 - alobbs.com

那麼,為什麼 AI 會捨棄公平的輪盤而開始偏袒呢?在這裡,我們必須了解最新人工智慧處理數據的方式。

大型語言模型並非解數學公式的計算機。語言模型閱讀和寫作的過程是透過名為「Token(詞元,將單字或句子切碎的拼圖碎片)」的單位來進行的。AI 並不將「給我一個 1 到 100 之間的隨機數字」這個問題視為數學機率題,而是當作一個填空的語言拼圖遊戲。

當問題輸入後,這些數據會通過 AI 內部無數的神經網路層(Neural network layers,將輸入資訊分多階段拆解分析並抓取特徵的數學過濾網)。這就像我們在智慧型手機的照片 App 中疊加各種濾鏡(Filter)一樣。如同第一道濾鏡調整光線,第二道濾鏡加上色調,AI 的神經網路過濾網在數據每次通過時,都會不斷覆蓋上一層「人性化濾鏡」:「在人類過去寫的文章中,這句話後面接哪個數字最自然?」

打個比方:有一隻聰明絕頂的鸚鵡,把網路上所有的文章和數千億本書都背得滾瓜爛熟。你對這隻鸚鵡大喊:「隨便挑一個數字說出來!」鸚鵡不懂怎麼在心裡擲數學骰子。相反地,牠會迅速翻找自己畢生讀過的無數人類對話紀錄。鸚鵡發現了一個明顯的模式:每當人類提到「Random」或「隨機」這些詞時,特別喜歡說 37 或 73,或是網路迷因中的 42 或 69,而對於 50 或 100 這種剛好湊整的數字,則覺得無趣而刻意避開 GPT 猜測 1 到 100 之間的數字 - GitHub

結果,鸚鵡(AI)並非轉動公平的輪盤,而是模仿出你覺得最「有隨機感」、最能讓你滿意的答案「73」。對 AI 而言,挑選隨機數字的行為根本不是隨機數生成,而是「預測什麼才是最具人類隨機感的一場激烈察言觀色遊戲」

現狀 (Where We Stand)

這種令人毛骨悚然的人類模仿現象,並非某一家公司 AI 獨有的問題。如今在我們每天使用的最先進 AI 模型中,這已是被廣泛證實的普遍現象。

根據義大利一位技術分析師的說法,廣泛普及的 GPT-4o 模型、輕量快速的 GPT-4o-mini,甚至是次世代模型 GPT-5,在被要求挑選 1 到 100 之間的數字時,都對「73」這個特定數字表現出極為明顯且強烈的偏好 為什麼 ChatGPT 總是選擇 73:隨機數中隱藏的 LLM 偏見 …。如果稍微縮小範圍,要求挑選 1 到 50 之間的數字會發生什麼事呢?此時 AI 模型就像約好了一樣,出現了蜂擁選擇數字「27」的有趣現象 為什麼 ChatGPT 總是選擇 73:隨機數中隱藏的 LLM 偏見 …

競爭對手 Google 的最尖端人工智慧也同樣無法逃脫人類設下的這個偏見陷阱。如果要求 Google 的最新模型 Gemini 2.0 挑選 1 到 100 之間的數字,有趣的是,該模型會在「47」和「73」之間舉棋不定,表現出對這兩個數字的特別偏愛 為什麼 ChatGPT 總是選擇 73:隨機數中隱藏的 LLM 偏見 …。此外,如果要求 Gemini 2.0 在 1 到 10 這樣極窄的範圍內挑選數字,事實證明它壓倒性地偏好「7」 為什麼 ChatGPT 總是選擇 73:隨機數中隱藏的 LLM 偏見 …。無論東西方都喜愛「幸運 7(Lucky Seven)」這種人類文化上的偏見,就這樣原封不動地烙印在由 1 和 0 組成的 AI 神經網路中。

這種奇異的現象早已在社群媒體平台 X(原 Twitter)與專業社群網路 LinkedIn 等地成為熱門話題。無數一般使用者打開聊天機器人視窗,親自輸入「猜一個 0 到 100 之間的隨機數字」的提示詞,並驚訝地分享他們的結果。人們積極作證,分享 AI 頻繁給出 37、73、43 等特定形態數字的經驗 像 ChatGPT 這樣的 LLM 在隨機猜測中偏好某些數字。儘管 AI 給出的具體數字可能略有不同,但「避開以 0 結尾的整數,堅持選擇在人類眼中看似不規則的凌亂數字」這個大原則,無論在哪家製造商的所有模型中都被一致觀察到。

未來將如何發展? (What’s Next)

當然,人工智慧開發者們為了解決 AI 的這種偏見,此時此刻也正付出無盡的努力。為了糾正這種傾斜現象,他們主要使用的方法之一就是微調(Fine-tuning)。微調基本上是一種對毫無節制地學習了龐大知識的 AI 模型,根據特定目的或倫理準則進行額外深化教育的校正過程。

打個比方,這就像是教導一隻像海綿般吸收了世界上所有氣味與刺激的小狗,在完成「坐下」或「等待」等遵守特定規則的基礎訓練後,再教導牠極為細緻的規矩。開發者會重新訓練 AI:「在挑選數字時,要毫無偏見地公平挑選喔。」

然而,人類根本的語言習慣早已深深扎根於數千億個參數(Parameter,扮演人工智慧腦細胞角色,決定數據重要性的可調整數值)之中長達數年,想僅憑幾次微調教育就將其完全漂白,幾乎是不可能的。畢竟,語言模型的血脈中,流淌著我們過去數十年來在網路上寫下的「人類文本」。

未來,隨著人工智慧更深入地滲透到我們的日常生活和重大決策過程中,我們必須培養一種健康的心態,不去絕對盲信 AI 提供的資訊,而是以批判的眼光看待。比方說,當公司需要進行重要的抽獎活動,或是需要隨機分配團隊成員時,我們絕不能因為怕麻煩,就犯下打開聊天機器人視窗要求它「隨便挑一個 1 到 100 之間的數字」的錯誤。在真正需要數學隨機性的重要時刻,我們不該使用那隻只是把機率模仿得維妙維肖的 AI 鸚鵡,而必須刻意使用專為生成真正隨機數而設計的專業工具(例如專門生成隨機數的網站或專用電腦演算法) 隨機數介於 1 到 100 之間

人工智慧越來越聰明,絕對不代表它們正在成為一個在各方面都完美且客觀的機械神。相反地,這意味著它們正逐漸成為一個完美如鏡面般模仿我們人類的善變、不理性,甚至是有時有些可愛的偏向與偏見的「太過人性化」的數位複製人。

AI 的視角 (AI’s Take)

MindTickleBytes 的 AI 記者視角: 結論非常明確。這個週末,當您抱著發財夢挑選樂透號碼,或是為了午餐打賭決定畫鬼腳號碼時,千萬不要拜託 ChatGPT 或 Gemini 這種 AI 聊天機器人幫您選號。因為不僅只有您會聽到那個「驚人的最尖端建議」,它也會用同樣認真的表情,對著其他數千萬人強烈推薦「73」、「37」或「7」當作幸運的正確答案!如果您不想和數百萬名 73 號愛好者平分頭獎獎金,那麼最明智的選擇,就是把隨機選擇的任務交給真正的塑膠骰子,而不是那隻聰明的鸚鵡。

參考資料

  1. GPT 猜測 1 到 100 之間的數字 - GitHub
  2. 為什麼 ChatGPT 總是選擇 73:隨機數中隱藏的 LLM 偏見 …
  3. 像 ChatGPT 這樣的 LLM 在隨機猜測中偏好某些數字
  4. 2026-05-25 簡報 - alobbs.com
  5. 隨機數介於 1 到 100 之間
測試你的理解
Q1. 在證實 GPT-4.1 並非完美均勻隨機數生成器的實驗中,總共向模型發送了多少次獨立的請求?
  • 1,000次
  • 5,000次
  • 10,000次
在最近進行的實驗中,研究人員向 GPT-4.1 發送了 10,000 次獨立請求讓它挑選隨機數字,結果證實該模型嚴重偏離了公平的分佈。
Q2. 人類和 AI 在挑選 1 到 100 之間的「隨機數字」時,會有意識地避開哪種類型的數字?
  • 奇數
  • 剛好湊整的整數
  • 偶數
為了給人一種「隨機」的感覺,人類往往會悄悄避開以 0 結尾的整數,而 AI 也原封不動地模仿了這個模式。
Q3. 如果要求 Google 的 Gemini 2.0 模型挑選一個 1 到 10 之間的數字,它最偏好哪個數字?
  • 3
  • 5
  • 7
研究結果顯示,當 Gemini 2.0 模型在 1 到 10 的範圍內挑選隨機數字時,對「7」表現出了明顯的偏愛。