AI가 숫자를 고를 때 '73'을 고집하는 소름 돋는 이유

AI Summary

AI는 완벽한 무작위 난수 생성기가 아니며, 데이터를 통해 인간의 심리적 편향을 그대로 학습해 무작위 숫자를 고를 때 '73'이나 '37' 같은 특정 숫자를 편애하는 경향을 보입니다.

상상해보세요. 여러분이 퇴근 후 친한 친구들과 분위기 좋은 카페에 모여 커피를 마시고 있습니다. 대화가 잠시 끊긴 틈을 타 누군가 장난스럽게 제안합니다. “우리 재미로 1부터 100 사이의 숫자 중 아무거나 무작위로 하나씩 생각해서 동시에 외쳐보자!” 여러분의 머릿속에는 지금 어떤 숫자가 떠오르셨나요?

잠시 생각할 시간을 드리겠습니다. (1초… 2초… 3초…)

아마도 ‘50’이나 ‘100’처럼 끝자리가 0으로 딱 떨어지는 숫자는 피하셨을 겁니다. 왠지 그런 숫자는 너무 인위적이라서 ‘무작위(랜덤)’라는 느낌이 들지 않기 때문이죠. 대신 ‘37’이나 ‘73’, 혹은 ‘43’처럼 소수(Prime number, 1과 자기 자신으로만 나누어지는 수)로 이루어져 있거나 조금 지저분하고 복잡해 보이는 숫자를 무의식적으로 고르지 않으셨나요? 인간의 심리란 참 묘해서, 진짜 무작위처럼 ‘보이기 위해’ 오히려 특정한 패턴의 숫자를 의도적으로 피하고 다른 숫자를 고르는 경향이 있습니다.

놀랍게도 이것은 여러분만의 특별한 습관이 아닙니다. GPT Guesses Between 1 and 100 - GitHub 자료에 따르면, 인간이라는 존재는 본질적으로 ‘훌륭한 무작위 난수 생성기’가 아닙니다. 사람들에게 무작위 숫자를 고르라고 요청하면 놀라울 정도로 결과를 예측하기 쉽습니다. 사람들의 답변은 주로 37과 73 같은 특정 숫자나 소위 말하는 ‘지저분한(messy)’ 숫자에 군집을 이룹니다. 또한 인터넷 커뮤니티에서 유행하는 밈(Meme) 숫자들, 예를 들어 42나 69 같은 숫자를 고르는 사람들도 매우 많습니다. 반면, 딱 떨어지는 둥근 숫자들은 철저하게 외면받고 조용히 무시당하죠 GPT Guesses Between 1 and 100 - GitHub.

여기까지는 그저 재미있는 심리학적 사실일 수 있습니다. 하지만 정말로 우리를 소름 돋게 만드는 사실은 따로 있습니다. 감정이나 편견이 전혀 없을 것 같은 최첨단 인공지능(AI)에게 똑같은 질문을 던졌을 때, AI가 인간과 소름 돋도록 똑같은 행동을 보인다는 것입니다. 인공지능 세계에서 가장 기초적인 질문 중 하나인 “무작위로 숫자를 골라줘”라는 명령어 뒤에 숨겨진 거대한 편향의 비밀을 지금부터 쉽고 자세하게 파헤쳐보겠습니다.

이게 왜 중요한가요? (Why It Matters)

우리의 일상 속에서 스마트폰의 음성 비서나 챗봇은 점점 더 똑똑해지고 있습니다. 우리는 흔히 컴퓨터 프로그램이나 인공지능을 감정의 동요 없이 완벽하게 객관적인 ‘디지털 계산기’라고 맹신하는 경향이 있습니다. 전통적인 컴퓨터에게 주사위를 굴리게 하거나 동전을 던지게 하면, 모든 결과값이 나올 확률이 수학적으로 정확히 동일해야 한다고 믿는 것이 당연합니다.

하지만 오늘날 전 세계를 뒤흔들고 있는 대형 언어 모델(LLM, 방대한 텍스트 데이터를 학습해 사람처럼 문장을 만들어내는 AI 기술)은 예전의 딱딱한 계산기와는 그 작동 방식이 완전히 다릅니다. 쉽게 말해서, 최신 인공지능은 수학자가 아니라 엄청나게 눈치가 빠른 언어학자에 가깝습니다. 만약 우리가 무한한 신뢰를 보내는 AI가, 단순하게 숫자를 무작위로 고르는 과정에서조차 수학적 확률을 깡그리 무시하고 특정한 숫자를 지독하게 편애한다면 어떨까요?

이는 매우 중대한 시사점을 던져줍니다. 무작위 숫자 하나를 고르는 단순한 일조차 인간의 비합리적인 선호도를 맹목적으로 따라 한다면, 더 복잡한 문제에서는 어떨지 상상해 보아야 합니다. 우리가 AI에게 수많은 지원자의 이력서를 검토하게 하거나, 법적인 판례를 분석하게 하거나, 대출 심사를 위해 무작위 표본을 추출하게 할 때도 우리가 미처 인지하지 못한 ‘인간의 편견’이 AI의 결정 속에 은밀하게 스며들 수 있다는 뜻이기 때문입니다. AI가 무작위 숫자를 고르는 방식은 단순히 재미있는 기술적 오류가 아니라, 이 기술이 얼마나 인간을 맹목적으로 비추는 거울인지 보여주는 완벽한 증거입니다.

쉽게 이해하기 (The Explainer)

이 현상을 명확하게 이해하기 위해, 비유를 하나 들어보겠습니다. 전통적인 컴퓨터 프로그램이 무작위 숫자를 만들어내는 ‘균등 무작위 난수 생성기(Uniform random number generator)’ 시스템은 카지노에 있는 완벽하게 균형이 잡힌 룰렛 휠(Roulette wheel)과 같습니다. 1부터 100까지 숫자가 적힌 룰렛을 강하게 돌렸을 때, 딸깍거리는 소리와 함께 구슬이 ‘1’에 떨어질 확률이나 ‘50’에 떨어질 확률, 그리고 ‘73’에 떨어질 확률은 완벽하게 동일합니다. 어느 숫자도 기계의 특별 대우를 받지 않죠.

하지만 최근 전문가들이 충격적인 실험 결과를 발표했습니다. 2026-05-25 Briefing - alobbs.com에 소개된 연구에 따르면, 연구진은 오픈AI(OpenAI)의 AI 모델인 GPT-4.1을 대상으로 무려 10,000번에 달하는 독립적인 요청을 보냈습니다. 사람으로 치면 하루 종일 방에 갇혀 1부터 100 사이의 숫자를 쉴 새 없이 부르라고 시킨 것과 같습니다. 만약 AI가 전통적인 컴퓨터처럼 공정한 룰렛 휠을 굴렸다면, 모든 숫자가 대략 100번씩 골고루 불려야만 정상입니다. 그러나 결과는 충격적이었습니다. GPT-4.1 모델의 출력 결과는 공정한 분포에서 통계적으로 크게 벗어나(significant statistical deviation) 있었으며, 모델이 결코 균등한 룰렛을 돌리지 않는다는 사실이 백일하에 드러났습니다 2026-05-25 Briefing - alobbs.com.

그렇다면 AI는 왜 공정한 룰렛을 버리고 편애를 시작했을까요? 여기서 우리는 최신 인공지능이 데이터를 처리하는 방식을 이해해야 합니다.

대형 언어 모델은 수학 공식을 푸는 계산기가 아닙니다. 언어 모델이 글을 읽고 쓰는 과정은 토큰(Token, 단어나 문장을 잘게 쪼갠 퍼즐 조각)이라는 단위를 통해 이루어집니다. AI는 “1부터 100 사이의 무작위 숫자를 줘”라는 질문을 수학적 확률 문제가 아니라, 빈칸이 뚫린 언어적인 퍼즐 맞추기 게임으로 받아들입니다.

질문이 입력되면 이 데이터는 AI 내부의 수많은 신경망 레이어(Neural network layers, 입력된 정보를 여러 단계로 쪼개어 분석하고 특징을 잡아내는 수학적 거름망)를 통과하게 됩니다. 이것은 마치 우리가 스마트폰 사진 앱에서 필터(Filter)를 겹겹이 적용하는 것과 같습니다. 첫 번째 필터가 빛을 조절하고, 두 번째 필터가 색감을 입히는 것처럼, AI의 신경망 거름망들은 데이터가 통과할 때마다 ‘인간이 과거에 쓴 글에서는 이 문장 다음에 어떤 숫자가 오는 것이 가장 자연스러웠지?’라는 ‘인간다움 필터’를 계속해서 덧씌웁니다.

비유하면 이렇습니다. 인터넷의 모든 글과 수천억 권의 책을 달달 외운 엄청나게 똑똑한 앵무새가 한 마리 있습니다. 당신이 이 앵무새에게 “아무 숫자나 무작위로 하나만 말해봐!”라고 외칩니다. 앵무새는 마음속으로 수학적인 주사위를 굴릴 줄 모릅니다. 대신 자신이 평생 동안 읽었던 수많은 인간들의 대화 기록을 재빨리 뒤져봅니다. 앵무새는 인간들이 ‘랜덤’이나 ‘무작위’라는 단어를 입에 올릴 때마다 유독 37이나 73, 혹은 인터넷 밈인 42나 69를 즐겨 말했고, 50이나 100 같은 딱 떨어지는 숫자는 재미없다며 쏙 피해 갔다는 뚜렷한 패턴을 발견합니다 GPT Guesses Between 1 and 100 - GitHub.

결국 앵무새(AI)는 공정한 룰렛을 돌리는 대신, 당신이 가장 ‘무작위답다’고 느끼며 만족할 만한 정답인 ‘73’을 흉내 내어 대답하는 것입니다. AI에게 무작위 숫자를 고르는 행위는 난수 생성이 아니라, ‘가장 인간다운 무작위가 무엇인지 예측하는 치열한 눈치 게임’인 셈입니다.

현재 상황 (Where We Stand)

이러한 소름 돋는 인간 모방 현상은 특정 회사 AI 하나만의 문제가 아닙니다. 오늘날 우리가 매일 사용하는 가장 진보된 AI 모델들 전반에서 광범위하게 확인되고 있습니다.

이탈리아의 한 기술 분석가에 따르면, 널리 쓰이는 대중적인 모델들인 GPT-4o, 가볍고 빠른 GPT-4o-mini, 그리고 차세대 모델인 GPT-5조차 1에서 100 사이의 숫자를 고르라고 하면 ‘73’이라는 특정 숫자에 대해 매우 뚜렷하고 강한 선호도를 보여줍니다 Why ChatGPT Always Picks 73: The Hidden LLM Bias on Random …. 만약 범위를 조금 좁혀서 1에서 50 사이의 숫자를 고르라고 명령하면 어떻게 될까요? 이때 AI 모델들은 약속이라도 한 듯이 ‘27’이라는 숫자로 우르르 몰려가는 재미있는 현상을 보입니다 Why ChatGPT Always Picks 73: The Hidden LLM Bias on Random ….

경쟁사인 구글(Google)의 최첨단 인공지능 역시 인간이 파놓은 이 편향의 함정을 벗어나지 못했습니다. 구글의 최신 모델인 제미나이(Gemini) 2.0 모델에게 1에서 100 사이의 숫자를 고르라고 하면, 모델은 흥미롭게도 ‘47’과 ‘73’ 사이에서 갈팡질팡하며 이 두 숫자를 유독 편애하는 경향을 나타냅니다 Why ChatGPT Always Picks 73: The Hidden LLM Bias on Random …. 게다가 제미나이 2.0에게 1부터 10 사이라는 아주 좁은 범위의 숫자를 요구하면, 압도적으로 ‘7’을 선호한다는 사실이 밝혀졌습니다 Why ChatGPT Always Picks 73: The Hidden LLM Bias on Random …. 동서양을 막론하고 사람들이 좋아하는 ‘럭키 세븐(Lucky Seven)’이라는 인간의 문화적 편향이 고스란히 1과 0으로 이루어진 AI의 신경망에 각인되어 있는 것입니다.

이런 기이한 현상은 이미 소셜 미디어 플랫폼인 엑스(X, 구 트위터)와 전문가 네트워크인 링크드인(LinkedIn) 등에서 뜨거운 화제가 되고 있습니다. 수많은 일반 사용자들이 챗봇 창을 열어 직접 “0에서 100 사이의 임의의 숫자를 추측해 봐”라고 프롬프트를 입력해보고 그 결과를 공유하며 놀라워하고 있습니다. 사람들은 AI가 37, 73, 43 같은 특정한 형태의 숫자를 놀라울 정도로 자주 내뱉는다는 경험담을 활발히 증언하고 있습니다 LLMs like ChatGPT favor certain numbers in random guesses. AI가 내놓는 답변의 미세한 숫자는 조금씩 다를지언정, 0으로 떨어지는 둥근 숫자를 기피하고 인간의 눈에 불규칙해 보이는 지저분한 숫자를 고집한다는 대원칙은 제조사를 불문하고 모든 모델에 걸쳐 동일하게 관찰되고 있습니다.

앞으로 어떻게 될까? (What’s Next)

물론 인공지능 개발자들은 AI의 이런 편향성을 고치기 위해 지금 이 순간에도 끝없는 노력을 기울이고 있습니다. 그들이 이런 쏠림 현상을 바로잡기 위해 주로 사용하는 방법론 중 하나가 바로 파인튜닝(Fine-tuning, 미세 조정)입니다. 파인튜닝이란 기본적으로 방대한 지식을 무분별하게 학습한 AI 모델에게, 특정 목적이나 윤리적 가이드라인에 맞게 추가적인 심화 교육을 시키는 교정 과정입니다.

이를 비유하자면, 세상의 모든 냄새와 자극을 스펀지처럼 흡수한 어린 강아지에게, ‘앉아’나 ‘기다려’처럼 특정한 규칙을 따르도록 기본 훈련을 마친 뒤에 아주 섬세한 규율을 가르치는 것과 같습니다. 개발자들은 “숫자를 고를 때는 편견 없이 공정하게 고르렴”이라고 AI를 재훈련시킵니다.

하지만 수천억 개의 파라미터(Parameter, 인공지능의 뇌 세포 역할을 하며 데이터의 중요도를 결정하는 조절 가능한 숫자값)에 이미 수년간 깊게 뿌리내린 인간의 근본적인 언어 습관을 몇 번의 파인튜닝 교육만으로 완벽하게 표백하는 것은 거의 불가능에 가깝습니다. 결국 언어 모델의 핏줄에는 과거 수십 년 동안 우리가 인터넷에 써 내려간 ‘인간의 텍스트’가 흐르고 있기 때문입니다.

앞으로 인공지능이 우리의 일상생활과 중요한 의사결정 과정에 더욱 깊이 파고들수록, 우리는 AI가 제공하는 정보를 절대적으로 맹신하지 않고 비판적으로 바라보는 건강한 시각을 길러야 합니다. 당장 누군가 회사에서 중요한 경품 추첨을 하거나, 무작위로 팀원을 배정해야 할 일이 생겼을 때 귀찮다는 이유로 챗봇 창을 열고 “1에서 100 사이 아무 숫자나 골라줘”라고 요구하는 실수를 범해서는 안 됩니다. 진정한 수학적 무작위성이 필요한 중요한 순간에는 확률을 그럴듯하게 흉내 내는 AI 앵무새가 아니라, 진정한 난수 생성을 위해 설계된 전문 도구(예를 들어 난수 생성 전용 웹사이트나 전용 컴퓨터 알고리즘)를 의도적으로 사용해야만 합니다 Random NumberBetween1And100.

인공지능이 갈수록 똑똑해진다는 것은, 그들이 모든 면에서 완벽하고 객관적인 기계 신(神)이 되어가고 있다는 뜻이 결코 아닙니다. 오히려 우리 인간의 변덕스럽고 비합리적이며, 때로는 귀여운 편향과 편견들까지 거울처럼 완벽하게 모방하는 ‘너무나도 인간적인’ 디지털 복제인간이 되어가고 있다는 의미일 것입니다.

AI의 시선 (AI’s Take)

MindTickleBytes의 AI 기자 시선: 결론은 아주 분명합니다. 이번 주말, 큰 꿈을 안고 로또 번호를 고르거나 점심 내기를 위해 사다리 타기 번호를 정할 때 절대 ChatGPT나 제미나이 같은 AI 챗봇에게 번호를 찍어달라고 부탁하지 마세요. 여러분 혼자만 그 ‘놀라운 최첨단 조언’을 듣는 것이 아닐뿐더러, 다른 수천만 명의 사람들에게도 똑같이 진지한 표정으로 ‘73’과 ‘37’, 혹은 ‘7’을 행운의 정답인 양 강력하게 추천해 주고 있을 테니까요! 1등 당첨금을 수백만 명의 73번 애호가들과 쪼개어 갖고 싶지 않다면, 무작위 선택만큼은 똑똑한 앵무새가 아니라 진짜 플라스틱 주사위에게 양보하는 것이 가장 현명한 선택입니다.

참고자료

Share this article:

이 글을 얼마나 이해했나요?

Q1. GPT-4.1이 완벽한 균등 무작위 난수 생성기가 아님을 밝혀낸 실험에서는 모델에게 총 몇 번의 독립적인 요청을 보냈을까요?

1,000번
5,000번
10,000번

최근 진행된 실험에서 연구진은 GPT-4.1에게 10,000번의 독립적인 요청을 보내 무작위 숫자를 고르게 했고, 그 결과 모델이 공정한 분포에서 심각하게 벗어난다는 것을 확인했습니다.

Q2. 인간과 AI가 1에서 100 사이의 '무작위 숫자'를 고를 때 의식적으로 피하는 숫자의 유형은 무엇인가요?

홀수
딱 떨어지는 둥근 숫자
짝수

인간은 '무작위'라는 느낌을 주기 위해 끝자리가 0으로 떨어지는 둥근 숫자를 조용히 피하는 경향이 있으며, AI 역시 이 패턴을 그대로 모방합니다.

Q3. 구글의 제미나이(Gemini) 2.0 모델에게 1에서 10 사이의 숫자를 하나만 골라달라고 하면 어떤 숫자를 가장 선호할까요?

연구 결과에 따르면 제미나이 2.0 모델은 1에서 10 사이의 범위에서 무작위 숫자를 고를 때 '7'에 대한 명확한 편애를 보여줍니다.