AI의 두 앙숙이 만났을 때: '결정 트리'와 '디퓨전'의 놀라운 통합

블록을 층층이 쌓아 올리는 계단식 구조와 부드럽게 흐르는 물결 모양이 하나의 빛나는 구슬 속에서 자연스럽게 융합되는 추상적인 3D 일러스트
AI Summary

물과 기름 같던 두 AI 모델 구조가 하나의 수학적 원리로 통합되면서, 복잡한 엑셀 표 같은 데이터를 기존보다 2배 더 빠르고 효율적으로 생성할 수 있게 되었습니다.

인공지능(AI)의 세계에는 수많은 종류의 ‘뇌’가 존재합니다. 어떤 뇌는 흑백이 뚜렷하게 논리적으로 차근차근 생각하는 것을 좋아하고, 어떤 뇌는 직관적이고 부드러운 흐름을 타는 것을 좋아합니다. 지금까지 AI를 연구하는 과학자들은 이 두 가지 뇌가 완전히 다른 언어를 사용한다고 굳게 믿어왔습니다.

상상해보세요. 한쪽에는 엄격한 규칙에 따라 서류를 ‘예’와 ‘아니오’로만 분류하는 꼼꼼하고 깐깐한 회계사가 있습니다. 다른 한쪽에는 캔버스 위에 자유롭게 물감을 흩뿌리며 경계선 없이 그림을 그리는 추상화 화가가 있습니다. 두 사람의 작업 방식은 도저히 하나의 교집합으로 합쳐질 수 없을 것만 같죠.

하지만 최근 AI 학계에서 놀라운 일이 벌어졌습니다. 이 두 사람이 사실은 무대 뒤에서 ‘완전히 똑같은 수학적 규칙표’를 보고 일하고 있었다는 사실이 밝혀진 것입니다. 이 놀라운 발견은 단순히 학문적인 호기심을 채우는 데 그치지 않고, 우리가 일상적으로 사용하는 방대한 데이터를 AI가 처리하는 속도를 비약적으로 끌어올리는 마법 같은 열쇠가 되었습니다. 과연 이 두 ‘앙숙’은 어떻게 하나가 되었을까요?

이게 왜 중요한가요?

요즘 AI가 멋진 그림을 그려주거나 진짜 같은 영상을 만들어낸다는 놀라운 뉴스를 자주 접하셨을 겁니다. 이렇게 무에서 유를 창조하는 최신 AI 기술의 심장 역할을 하는 것이 바로 ‘디퓨전 모델(Diffusion Model)’입니다. 반면, 은행에서 대출을 승인할지 말지 결정하거나, 병원에서 환자의 증상을 보고 병명을 빠르게 추론할 때는 ‘결정 트리(Decision Tree)’라는 아주 고전적이고 딱딱한 방식의 AI가 오랫동안 널리 쓰여 왔습니다.

여기서 중요한 현실적인 문제가 하나 발생합니다. 기업들이 실제로 매일 다루는 데이터의 90% 이상은 화려한 이미지나 영상이 아니라, 아주 지루하고 복잡해 보이는 엑셀 표 형식의 데이터(표 데이터, Tabular Data)라는 점입니다. 은행의 방대한 고객 정보, 쇼핑몰의 수백만 건 구매 이력 같은 것들이죠.

최근 AI 전문가들은 가장 똑똑한 최신 기술인 디퓨전 모델을 이 ‘표 데이터’를 다루는 데 적용해보려는 야심 찬 시도를 했습니다. ‘TabDDPM’이라는 모델이 그 대표적인 사례인데, 결과물 자체는 매우 훌륭했지만 치명적인 약점이 하나 있었습니다. 바로 컴퓨터가 계산해야 할 연산량이 너무 많아서, 전력과 서버 비용이 천문학적으로 깨진다는 것이었죠 [TreestoFlowsandBack:UnifyingDecisionTreesandDiffusion...](https://arxiv.org/pdf/2605.00414).

쉽게 말해서, 동네 슈퍼마켓에서 간단한 덧셈 뺄셈 영수증 처리를 하기 위해 수백억 원짜리 거대한 슈퍼컴퓨터를 켜야만 하는 황당한 상황이 벌어진 것입니다.

그런데 과학자들이 전혀 관련 없어 보이던 ‘결정 트리’와 ‘디퓨전 모델’ 사이에 숨겨져 있던 수학적인 연결고리를 찾아내면서 꽉 막혀있던 상황이 완전히 뚫렸습니다. 무겁고 비싼 디퓨전 모델이 해야 할 계산의 상당 부분을, 빠르고 가벼운 결정 트리의 방식을 빌려 건너뛰는 묘수를 알아낸 것입니다. 그 결과, 데이터를 처리하는 속도와 효율이 마치 고속도로를 뚫은 것처럼 비약적으로 치솟았습니다. 우리 눈에 보이지 않는 기업들의 거대한 데이터센터 서버 비용이 획기적으로 줄어들고, 더 빠르고 똑똑한 데이터 분석 서비스가 등장할 수 있는 탄탄한 토대가 마련된 셈입니다.

쉽게 이해하기: 계단과 미끄럼틀의 평행이론

이 혁신적인 발견의 원리를 제대로 이해하려면, 먼저 두 AI 모델의 전혀 다른 성격을 비교해 볼 필요가 있습니다.

첫째, 결정 트리(Decision Tree)입니다. 이 친구는 우리가 어릴 적 친구들과 하던 ‘스무고개’ 게임과 원리가 똑같습니다. “이 동물은 털이 있나요?”, “네”, “그럼 다리가 4개인가요?”, “아니오”. 이렇게 질문과 대답이 명확하게 툭툭 끊어지는 단계를 거쳐 최종 정답을 찾아냅니다. 그래서 전통적으로 이 모델은 계단처럼 툭툭 끊어지는 분절적(discrete)이고 위에서 아래로 내려오는 계층적인(hierarchical) 성격을 띤다고 알려져 있습니다 [Trees to Flows and Back: Unifying Decision Trees and ...](https://arxiv.org/abs/2605.00414).

둘째, 디퓨전 모델(Diffusion Model)입니다. 이 친구는 안개가 자욱하게 낀 흐릿한 사진에서 안개를 아주 서서히, 연속적으로 걷어내며 선명한 이미지를 만들어내는 방식을 씁니다. 중간에 어디서부터가 안개이고 어디서부터가 진짜 사물인지 칼로 무 자르듯 나눌 수 없습니다. 이 모델은 물결처럼 부드럽고 끊임없이 이어지는 연속적(continuous)이고 동적인(dynamic) 성격을 가집니다 [Trees to Flows and Back: Unifying Decision Trees and ...](https://papers.cool/arxiv/2605.00414).

겉보기엔 누가 봐도 이 둘은 극과 극의 성향입니다. 하나는 뚝뚝 끊어지는 거친 ‘계단’이고, 다른 하나는 부드럽게 흘러내리는 ‘미끄럼틀’이죠 [Trees to Flows and Back: Unifying Decision Trees and ...](https://www.alphaxiv.org/abs/2605.00414v1).

그런데 연구진은 아주 특정한 극한의 수학적 조건(수학 용어로는 극한 체제, limiting regimes)을 설정한 뒤, 이 계단을 엄청나게 미세하고 잘게 쪼개보았습니다. 그랬더니 놀랍게도 그 잘게 쪼개진 계단의 모습이 결국 미끄럼틀의 부드러운 곡선과 완벽하게 똑같아진다는 명쾌한 수학적 일치성(crisp mathematical correspondence)을 세계 최초로 증명해냈습니다 [Unifying Decision Trees and Diffusion Models Through ...](https://icanews.org/engineering-technology/decision-trees-diffusion-models-unification-2026).

비유하면 이렇습니다. 여러분이 거대한 산 정상에 오르는 방법은 두 가지가 있습니다. 돌계단을 한 칸 한 칸 확실하게 밟고 올라가거나(결정 트리), 경사진 흙길을 스윽 부드럽게 걸어 올라가는(디퓨전 모델) 것입니다. 걷는 방식은 완전히 다르지만, 위에서 내려다보면 결국 두 방법 모두 “가장 적은 에너지를 써서 꼭대기라는 동일한 목표 지점에 도달한다”는 하나의 공통된 길을 걷고 있었던 것입니다.

연구진은 이렇게 두 모델이 공유하고 있는 숨겨진 지도를 찾아내고, 이를 전역 궤적 점수 매칭(Global Trajectory Score Matching, GTSM)이라는 공통된 최적화 원리로 명명했습니다 [Trees to Flows and Back: Unifying Decision Trees and ...](https://www.emergentmind.com/papers/2605.00414). 쉽게 말해 두 AI가 같은 수학 점수판을 놓고 최고점을 받기 위해 싸우고 있었다는 뜻입니다.

여기서 더 놀라운 사실이 하나 더 밝혀집니다. 이 공통된 원리 안에서 살펴본 결과, AI를 학습시키는 데 오랫동안 쓰여 온 고전적인 비법인 ‘그래디언트 부스팅(Gradient Boosting)’이라는 기술이 사실 디퓨전 모델이 궁극적으로 도달하고자 하는 가장 완벽한 상태(수학 용어로 점근적 최적, asymptotic optimum)와 같다는 것이 증명된 것입니다 [Gradient Boosting Turns Out to BeDiffusion's Asymptotic Optimum](https://ai-brief.liziran.com/en/daily/2026-05-07-gradient-boosting-diffusion-optimum).

즉, 낡은 기술로 치부되던 ‘스무고개’를 끝없이 완벽하게 깎고 다듬었더니, 그것이 결국 요즘 가장 잘 나가는 최고의 예술가 AI가 그리는 부드러운 그림의 완성형과 수학적으로 같아졌다는 경이로운 뜻입니다.

현재 상황: ‘TreeFlow’의 탄생

이 아름답고 완벽한 수학적 발견은 단지 복잡한 논문 속의 차가운 공식으로만 끝나지 않았습니다.

연구진은 발견해 낸 이 이론적 바탕을 뼈대로 삼아, 기업들이 가장 많이 쓰는 ‘엑셀 표 형태의 데이터’를 빠르고 정교하게 생성해낼 수 있는 완전히 새로운 AI 설계도를 만들어냈습니다. 이 프레임워크의 이름이 바로 ‘TreeFlow(Tree-Conditioned Flow Matching)’‘DSM-Tree’입니다 [Trees to Flows and Back: Unifying Decision Trees and ...](https://www.emergentmind.com/papers/2605.00414).

과거에는 이런 표 데이터를 실감 나게 만들어내기 위해 엄청난 전기를 낭비하며 무겁고 둔탁한 디퓨전 모델 전체를 억지로 굴려야만 했습니다. 하지만 이제는 TreeFlow 기술을 통해, ‘결정 트리’가 가진 빠르고 가벼운 연산 방식의 장점을 그대로 가져오면서도 디퓨전 모델 특유의 뛰어나고 매끄러운 데이터 품질을 동시에 얻어낼 수 있게 되었습니다. 무겁고 거대한 짐을 가볍고 날렵한 최신 스포츠카에 싣고 쌩쌩 달릴 수 있게 된 셈입니다.

앞으로 어떻게 될까?

새로운 발견의 놀라운 성과는 이미 생생한 숫자로 증명되고 있습니다.

새로 개발된 TreeFlow 기술을 실제 데이터 생성 작업에 적용해 본 결과, 기존의 무거운 방식과 비교해 무려 2배 빠른 속도 향상(2x speedup)을 달성하는 데 성공했습니다 [Gradient Boosting Turns Out to BeDiffusion's Asymptotic Optimum](https://ai-brief.liziran.com/en/daily/2026-05-07-gradient-boosting-diffusion-optimum). 2배 빠르다는 것은 단순히 조금 빨라진 것이 아니라, 10시간 걸릴 데이터 분석을 5시간 만에 끝내고, 수천 대의 서버 유지 비용을 절반으로 뚝 자를 수 있다는 엄청난 의미입니다.

또한, 덩치가 큰 무거운 AI 모델의 똑똑한 지식을 가벼운 AI 모델로 압축해서 옮겨 심는 이른바 ‘증류(Distillation)’ 과정에서도 기적이 일어났습니다. DSM-Tree 기술은 원본 디퓨전 모델이 가진 훌륭한 성능을 거의 그대로 유지하면서, 오차율이 단 2% 이내(within-2% distillation)밖에 나지 않는 압도적인 효율과 정확도를 보여주었습니다 [Gradient Boosting Turns Out to BeDiffusion's Asymptotic Optimum](https://ai-brief.liziran.com/en/daily/2026-05-07-gradient-boosting-diffusion-optimum).

앞으로 은행, 대형 병원 의료 기관, 그리고 수천만 명의 고객을 보유한 대형 이커머스 기업들은 이 기술을 두 팔 벌려 환영할 수밖에 없습니다. 왜냐하면 최근 강화된 개인정보 보호법 때문에 진짜 고객의 민감한 데이터를 함부로 AI 분석에 사용할 수 없기 때문입니다. 그 대안으로 진짜와 똑같이 생긴 가상의 ‘가짜 고객 데이터’를 빠르고 정교하게 만들어 내는 기술이 필수적인데, 기존에는 비용이 너무 많이 들었습니다.

하지만 이번 놀라운 통합 발견 덕분에, 기업들은 훨씬 적은 컴퓨팅 비용과 전력을 소모하면서도 빠르고 안전하게 고품질의 가상 데이터를 대량으로 찍어낼 수 있게 되었습니다.

MindTickleBytes AI의 시선

서로 가는 길이 달라 평생 교차할 일이 없어 보이던 두 기술이, 가장 깊고 본질적인 ‘수학’이라는 근원의 영역에서 극적으로 만날 때 이전에 없던 놀라운 효율성이 탄생합니다. 눈에 당장 보이는 화려한 응용 기술에만 매달리지 않고, 사물의 본질을 파고드는 순수 기초 과학과 융합적 사고가 AI 최적화에 있어서 얼마나 강력하고 위대한 무기가 될 수 있는지를 다시 한번 명확하게 증명한 훌륭한 사례입니다. 스무고개와 물결이 만나 이루어 낸 이 혁신은 앞으로 우리 삶의 보이지 않는 곳들을 더욱 빠르고 스마트하게 바꿔놓을 것입니다.

참고자료

  1. Trees to Flows and Back: Unifying Decision Trees and …
  2. Trees to Flows and Back: Unifying Decision Trees and …
  3. Trees to Flows and Back: Unifying Decision Trees and …
  4. Unifying Decision Trees and Diffusion Models Through …
  5. Trees to Flows and Back: Unifying Decision Trees and …
  6. Gradient Boosting Turns Out to BeDiffusion’s Asymptotic Optimum
  7. TreestoFlowsandBack:UnifyingDecisionTreesandDiffusion…
이 글을 얼마나 이해했나요?
Q1. 이전까지 AI 학계에서 '결정 트리'와 '디퓨전 모델'을 바라보던 관점으로 가장 알맞은 것은 무엇인가요?
  • 완전히 동일한 수학적 기반을 가진 형제 모델로 여겼다.
  • 하나는 분절적이고 다른 하나는 연속적이어서 전혀 다른 모델군으로 보았다.
  • 결정 트리가 디퓨전 모델을 대체할 수 있을 것이라 믿었다.
전통적으로 결정 트리는 분절적(discrete)이고 계층적인 반면, 디퓨전 모델은 연속적(continuous)이고 동적인 특성을 가져 전혀 다른 모델군으로 취급되었습니다.
Q2. 본문에서 언급된 'TabDDPM'과 같은 기존 디퓨전 모델이 엑셀 표 같은 데이터(Tabular data)를 다룰 때 가졌던 가장 큰 문제점은 무엇인가요?
  • 성능은 좋지만 컴퓨터 연산 비용(컴퓨팅 파워)이 너무 많이 들었다.
  • 데이터의 형태를 전혀 인식하지 못했다.
  • 디퓨전 모델은 표 데이터에 아예 적용할 수 없었다.
기존의 TabDDPM 모델 등은 표 데이터 생성에 강력한 성능을 보였지만, 연산 비용(computational costs)이 너무 높다는 치명적인 단점이 있었습니다.
Q3. 두 모델을 통합하여 만들어진 'TreeFlow' 프레임워크가 달성한 속도 향상 수준은 어느 정도인가요?
  • 기존 대비 5배 속도 향상
  • 기존 대비 2배 속도 향상 (2x speedup)
  • 처리 속도는 같지만 화질이 개선됨
결정 트리와 디퓨전 모델의 장점을 결합한 TreeFlow 모델은 기존 대비 2배의 속도 향상(2x speedup)을 달성했습니다.
AI의 두 앙숙이 만났을 때: '결정 트리'와 '...
0:00