AI并不是完美的随机数生成器,它通过数据原封不动地学习了人类的心理偏见,在挑选随机数字时表现出偏爱“73”或“37”等特定数字的倾向。
想象一下:下班后,你和好朋友们聚在一家气氛不错的咖啡馆里喝咖啡。趁着谈话短暂中断的间隙,有人开玩笑地提议:“我们找点乐子,大家在1到100之间随机想一个数字,然后同时喊出来吧!”你的脑海中现在浮现出了哪个数字呢?
给你一点时间想一想。(1秒… 2秒… 3秒…)
你可能避开了“50”或“100”这样以0结尾的整数。因为不知为何,这样的数字显得太刻意了,让人感觉不到“随机”。相反,你是不是下意识地挑选了像“37”、“73”或者“43”这样由素数(Prime number,只能被1和自身整除的数)组成,或者看起来有些凌乱、复杂的数字呢?人类的心理真的很奇妙,为了“看起来”像是真正的随机,我们反而倾向于刻意避开特定规律的数字,转而选择其他的数字。
令人惊讶的是,这并不是你独有的特别习惯。根据 GPT在1到100之间的猜测 - GitHub 的资料,人类本质上并不是“优秀的随机数生成器”。如果要求人们挑选随机数字,其结果的预测难度低得惊人。人们的回答主要集中在37和73等特定数字或所谓的“凌乱(messy)”数字上。此外,还有很多人会挑选互联网社区中流行的迷因(Meme)数字,例如42或69。相反,凑整的整数则被彻底冷落并被默默无视 GPT在1到100之间的猜测 - GitHub。
到此为止,这可能只是一项有趣的心理学事实。但真正让人毛骨悚然的事实还在后头。当向看似毫无情感和偏见的最先进人工智能(AI)提出同样的问题时,AI展现出了与人类惊人一致的行为。在人工智能世界中最基础的问题之一——“给我挑个随机数字”这一指令背后,隐藏着巨大的偏见秘密。从现在起,我们将用浅显易懂的方式为您详细剖析。
为什么这很重要?(Why It Matters)
在我们的日常生活中,智能手机的语音助手和聊天机器人变得越来越聪明。我们通常倾向于盲目相信计算机程序或人工智能是毫无情感波动的、完美客观的“数字计算器”。如果让传统的计算机掷骰子或抛硬币,我们理所当然地认为所有结果出现的概率在数学上应该完全相等。
然而,如今震撼全球的大型语言模型(LLM,一种通过学习海量文本数据来像人类一样生成句子的AI技术)与过去死板的计算器在运作方式上截然不同。简单来说,最新的AI与其说是数学家,不如说是极具眼力见的语言学家。如果被我们寄予无限信任的AI,在仅仅是挑选随机数字的过程中,也完全无视数学概率,死心塌地偏爱特定数字,那会怎样呢?
这带来了非常重要的启示。如果连挑选一个随机数这样简单的事情都盲目跟从人类非理性的偏好,我们可以想象在更复杂的问题上会是什么情况。这意味着,当让AI审查无数求职者的简历、分析法律判例,或者为了贷款审批而提取随机样本时,我们未曾察觉的“人类偏见”可能已经悄然渗入AI的决定中。AI挑选随机数的方式不仅仅是一个有趣的技术错误,更是证明这项技术盲目照出人类模样的“数字镜像”的完美证据。
简单易懂的原理解析 (The Explainer)
为了更清晰地理解这种现象,我们打个比方。传统计算机程序生成随机数的“均匀随机数生成器(Uniform random number generator)”系统,就像赌场里一个平衡完美的轮盘(Roulette wheel)。当你用力转动标有1到100数字的轮盘时,伴随着咔哒声,珠子落在“1”、“50”或“73”上的概率是完全相等的。没有任何一个数字会受到机器的特殊对待。
但最近专家们发表了令人震惊的实验结果。根据 2026-05-25 简报 - alobbs.com 介绍的研究,研究人员向OpenAI的AI模型GPT-4.1发送了多达10,000次的独立请求。如果换作人类,这就像是把一个人整天关在房间里,让他不停地报出1到100之间的数字。如果AI像传统计算机一样转动公平的轮盘,那么所有数字平均被抽到100次左右才是正常的。然而结果令人震惊。GPT-4.1模型的输出结果在统计上严重偏离了公平分布(significant statistical deviation),这在光天化日之下揭示了该模型绝对没有在转动均匀的轮盘 2026-05-25 简报 - alobbs.com。
那么,AI为什么抛弃了公平的轮盘而开始偏心呢?在这里,我们需要了解最新人工智能处理数据的方式。
大型语言模型不是解答数学公式的计算器。语言模型阅读和写作的过程是通过Token(词元,将单词或句子切碎的拼图块)这一单位来进行的。AI将“给我一个1到100之间的随机数字”这个问题,当作一个带有空白的语言拼图游戏,而不是一个数学概率问题。
当输入问题时,这些数据会通过AI内部无数的神经网络层(Neural network layers,将输入信息分阶段拆解、分析并捕捉特征的数学过滤网)。这就好比我们在智能手机的摄影App中叠加滤镜(Filter)一样。第一层滤镜调节光线,第二层滤镜赋予色彩,AI的神经网络过滤网也是如此,每当数据通过时,它都会不断套上一个“人类滤镜”:“在人类过去写的文章中,这句话后面接什么数字最自然呢?”
打个比方是这样的。有一只超级聪明的鹦鹉,它对互联网上的所有文章和数千亿本书都倒背如流。你对着这只鹦鹉大喊:“随便说一个随机数字!”鹦鹉不懂如何在心里掷数学骰子。相反,它会迅速翻找自己一生中读过的无数人类对话记录。鹦鹉发现了一个明显的规律:每当人类提到“随机”或“随便”这些词时,特别喜欢说37或73,或是互联网迷因42或69,而对于50或100这样凑整的数字则觉得无趣而避开 GPT在1到100之间的猜测 - GitHub。
最终,鹦鹉(AI)并没有去转动公平的轮盘,而是模仿出一个能让你觉得最“像随机数字”、最能让你满意的答案——“73”。对AI来说,挑选随机数字的行为并非生成随机数,而是“一场预测怎样才算最像人类的随机数字的激烈察言观色游戏”。
现状 (Where We Stand)
这种令人毛骨悚然的人类模仿现象,并不是某一家公司AI独有的问题。它正在我们如今每天都在使用的、最先进的各大AI模型中被广泛证实。
据意大利的一位技术分析师称,即使是广泛使用的大众化模型GPT-4o、轻量快捷的GPT-4o-mini,甚至是下一代模型GPT-5,当被要求在1到100之间挑选数字时,都对“73”这个特定数字表现出极其明显和强烈的偏好 为什么ChatGPT总是选73:随机数背后隐藏的LLM偏见…。如果把范围稍微缩小,命令它们在1到50之间挑选一个数字会怎样呢?这时,AI模型们就像约好了一样,一窝蜂地涌向“27”这个数字,展现出非常有趣的现象 为什么ChatGPT总是选73:随机数背后隐藏的LLM偏见…。
竞争对手谷歌(Google)的最先进人工智能也同样未能逃脱人类挖下的这个偏见陷阱。如果让谷歌最新的Gemini 2.0模型在1到100之间挑选一个数字,有趣的是,该模型会在“47”和“73”之间摇摆不定,表现出对这两个数字格外的偏爱 为什么ChatGPT总是选73:随机数背后隐藏的LLM偏见…。此外研究还发现,如果让Gemini 2.0在1到10这个非常小的范围内挑选数字,它会以压倒性的优势偏爱“7” 为什么ChatGPT总是选73:随机数背后隐藏的LLM偏见…。人类不分东西方都喜欢的“幸运数字七(Lucky Seven)”这一文化偏见,原封不动地烙印在了由1和0组成的AI神经网络中。
这种奇异的现象已经在社交媒体平台X(原推特)和专业人士网络LinkedIn上成为热门话题。许多普通用户打开聊天机器人窗口,亲自输入“猜一个0到100之间的随机数字”的提示词,并惊讶地分享他们的结果。人们积极作证,分享AI惊人地频繁抛出37、73、43等特定形态数字的经历 像ChatGPT这样的LLM在随机猜测中偏爱特定数字。尽管AI给出的具体数字可能存在细微差异,但避开以0结尾的整数,执着于在人类眼中看似不规则的凌乱数字——这一大原则在所有制造商的所有模型中都得到了一致的观察。
未来会怎样? (What’s Next)
当然,此时此刻人工智能开发者们也在为了纠正AI的这种偏见付出不懈的努力。为了纠正这种倾斜现象,他们主要使用的方法论之一就是微调(Fine-tuning)。微调从根本上说是一个矫正过程:对已经不加区分地学习了海量知识的AI模型,根据特定目的或道德准则进行额外的深度教育。
打个比方,这就像是一只像海绵一样吸收了世间所有气味和刺激的小狗,在完成了“坐下”或“等候”等遵循特定规则的基础训练之后,再教给它非常细腻的规矩。开发者们是在重新训练AI:“挑选数字时,请毫无偏见、公平地进行选择。”
但是,在数千亿个参数(Parameter,扮演人工智能脑细胞角色、决定数据重要性的可调数值)中,人类根本的语言习惯已经深深扎根了数年,想仅凭几次微调教育就将其完美漂白,几乎是不可能的。说到底,语言模型的血管里,流淌的终究是我们过去几十年在互联网上写下的“人类文本”。
未来,随着人工智能更深地融入我们的日常生活和重要的决策过程,我们必须培养一种健康的视角,以批判性的眼光看待AI提供的信息,而不是绝对的盲目相信。至少当我们在公司需要进行重要的抽奖活动,或是需要随机分配团队成员时,绝不能因为嫌麻烦就打开聊天机器人的窗口,犯下要求它“在1到100之间随便挑个数字”的错误。在需要真正数学随机性的重要时刻,绝不能依赖那只会模仿概率的AI鹦鹉,而是必须有意识地使用专为生成真正随机数而设计的专业工具(例如专用的随机数生成网站或专用的计算机算法)1到100之间的随机数。
人工智能变得越来越聪明,这绝不意味着它们正在成为在各个方面都完美、客观的机器神明。相反,这或许意味着它们正在变成一面镜子,甚至将我们人类反复无常、不理智、有时还挺可爱的偏见与成见都完美模仿出来,成为“太有人情味”的数字克隆人。
AI的视角 (AI’s Take)
MindTickleBytes AI记者的视角: 结论非常明确。这个周末,当你怀揣着大梦想去选彩票号码,或是为了决定午餐由谁买单而挑数字爬梯子时,千万别拜托ChatGPT或Gemini这样的AI聊天机器人帮你选号。因为不只是你一个人听到了这个“令人惊叹的最尖端建议”,它们一定也正板着面孔,将“73”和“37”,或者是“7”当作幸运数字,强力推荐给其他数以千万计的人!如果你不想和几百万名73号爱好者平分一等奖奖金,那么对于随机选择这件事,最明智的做法就是把它交给真正的塑料骰子,而不是那只聪明的鹦鹉。
参考资料
- 1,000次
- 5,000次
- 10,000次
- 奇数
- 凑整的整数
- 偶数
- 3
- 5
- 7