최첨단 AI에게 '1995년 감성'을 주입하다: 내 노트북에서 나만의 AI 비서 만들기

AI Summary

거대 언어 모델(LLM)에 작고 가벼운 어댑터를 붙이는 파인튜닝 기술을 활용하면, 개인 노트북에서도 AI를 원하는 도메인 전문가로 완벽하게 변신시킬 수 있습니다.

상상해보세요. 어느 날 아침, 스마트폰의 인공지능 비서에게 “내가 새로 만든 앱의 사용 설명서 좀 써줘”라고 부탁합니다. 보통이라면 매끄럽고 세련된 현대적인 문장으로 척척 답을 내놓겠죠. 그런데 이 AI가 마치 타임머신을 타고 온 것처럼, 1990년대 윈도우 95 시절의 뻣뻣하고 투박한 문체로 글을 쏟아낸다면 어떨까요? “플로피 디스크를 드라이브에 삽입한 후 실행을 누르십시오” 같은 레트로 감성으로 말입니다.

놀랍게도 누군가가 이 재미있고 엉뚱한 상상을 현실로 만들었습니다. 최근 한 개발자가 1980~90년대의 소프트웨어 기술 문서 작성자(Technical writer)처럼 글을 쓰도록 최신 인공지능을 훈련시키는 실험에 성공했습니다 [Fine-tuning an LLM to write docs like it’s 1995 - vuink.com]. 이 이야기는 단순히 옛날 감성을 되살렸다는 흥미로운 에피소드가 아닙니다. 인공지능 기술이 거대 기업의 손을 떠나, 이제 평범한 우리의 일상과 통제권 안으로 얼마나 깊숙이 들어왔는지를 보여주는 결정적인 장면입니다.

우리의 상상 속 인공지능 개발은 늘 웅장했습니다. 으리으리한 IT 기업의 비밀 연구소나, 엄청난 열기를 뿜어내는 수천 대의 컴퓨터 서버 방에서만 가능한 일이라고 생각했죠. 하지만 이 놀라운 ‘1995년 감성의 AI 비서’를 만드는 마법은, 여러분이 카페에서 커피를 마시며 무릎 위에 올려두고 쓰는 평범한 개인용 노트북 위에서 일어났습니다. 도대체 어떻게 이런 일이 가능해진 걸까요?

이게 왜 중요한가요? (Why It Matters)

우리는 보통 챗GPT 같은 거대한 인공지능을 ‘모든 것을 다 아는 만물박사’라고 생각합니다. 하지만 기업이나 개인이 진짜 일상과 업무에서 원하는 것은, 모든 분야를 70점 정도로 적당히 아는 ‘둥글둥글한 AI’가 아닙니다. 우리가 진정으로 갈망하는 것은 내 업무의 특성을 완벽하게 이해하고, 나처럼 생각하며, 내 스타일대로 일해주는 ‘나만의 맞춤형 전문가 AI’입니다. 기성복 매장에서 산 옷이 아무리 좋아도, 내 몸에 딱 맞춰 재단한 맞춤복의 편안함을 이길 수 없는 것과 같습니다.

누구나 무료로 접근할 수 있는 오픈소스 대규모 언어 모델(LLM, 수많은 글을 읽고 학습해 인간처럼 언어를 이해하는 AI)을 우리 목적에 맞게 훈련시키는 과정은, 인공지능을 극도로 개인화할 수 있는 엄청난 잠재력을 열어줍니다 [Fine Tune an open-source LLM - ashutosh.dev].

예를 들어볼까요? 방대한 판례를 뒤져야 하는 변호사를 위해 까다로운 법률 용어만 쓰는 보조원, 내 코딩 버릇을 똑같이 흉내 내는 개발자 전용 도우미, 길고 지루한 회의록을 내 입맛에 맞게 요점만 딱 집어 줄여주는 비서까지. 이 모든 특급 전문가들을 내 손으로 직접 만들어낼 수 있습니다 [Fine Tune an open-source LLM - ashutosh.dev].

이 기술이 지니는 가장 큰 의미는 우리에게 인공지능에 대한 ‘완벽한 통제권’과 ‘일관성’, 그리고 깊이 있는 ‘전문성’을 제공한다는 점입니다 [Fine Tune an open-source LLM - ashutosh.dev]. 과거에는 수백억 원의 자본과 천재적인 연구원들이 있어야만 만들 수 있었던 ‘전용 AI’를 이제는 평범한 개인 개발자나 동네의 작은 중소기업도 충분히 만들어낼 수 있습니다. 이른바 인공지능 권력의 대이동이 시작된 것입니다.

쉽게 이해하기 (The Explainer)

이 모든 마법의 중심에는 ‘파인튜닝(Fine-tuning, 미세 조정)’이라는 핵심 기술이 자리 잡고 있습니다. 기술적인 용어라 조금 낯설게 들리겠지만, 그 원리는 놀랍도록 우리의 일상과 닮아있습니다. 쉽게 말해서 파인튜닝이란, 이미 방대한 일반 지식을 학습한 똑똑한 인공지능 기본 모델(Foundation LLM)을 특정 작업에 맞게 한 번 더 적응시키는 특별 훈련 과정입니다 [LLMs:Fine-tuning, distillation, and prompt engineering]. 흥미로운 점은 이 훈련을 거치면 특정 작업에 대한 AI의 성능은 비약적으로 좋아지면서도, 인공지능의 전체 크기는 뚱뚱해지지 않고 원래대로 날씬하게 유지된다는 것입니다 [LLMs:Fine-tuning, distillation, and prompt engineering].

비유하면 이렇습니다. 갓 다운로드받은 기본 AI는 명문 대학을 수석으로 졸업한 ‘아주 똑똑한 신입사원’과 같습니다. 이 신입사원은 인터넷에 있는 세상 온갖 지식을 두루 섭렵해 아는 것이 엄청나게 많습니다. 하지만 회사 생활은 처음이라서, 여러분 회사의 독특한 결재 서류 양식이나 선배들끼리 쓰는 특유의 은어는 전혀 모릅니다.

이때 이 똑똑한 신입사원을 책상에 앉혀두고 우리 회사의 과거 서류 1,000장을 보여주며 “기본 지식은 훌륭하니까 그대로 두고, 앞으로 글을 쓸 때는 딱 이 서류들의 스타일을 따라서 써야 해”라고 가르치는 직무 교육 과정. 이것이 바로 파인튜닝입니다. 앞서 이야기한 1995년 감성의 문서 작성 실험에서는, 이 신입사원에게 1980년대와 90년대의 낡고 딱딱한 기술 문서들을 잔뜩 읽히고 그 시대 사람처럼 말하도록 강도 높은 연기 수업을 시킨 셈이죠.

하지만 이 특훈 과정이 늘 순탄한 것만은 아닙니다. 컴퓨터로 모델을 학습시키는 과정 자체는 비교적 비용이 적게 들 수 있지만, 이 훈련의 성패를 가르는 가장 큰 장벽은 ‘고품질의 훈련 데이터’를 충분히 많이 모아야 한다는 점입니다 [Fine-tuninganLLMtowritedocslikeit’s1995– Fabrizio Ferri…]. 인공지능이 1990년대 사람처럼 자연스럽게 글을 쓰도록 개인화된 모델을 훈련시키려면, 그 시절 실제로 쓰였던 엄청난 양의 글(데이터)이 필수적으로 필요합니다 [Fine-tuning an LLM to write docs like it’s 1995 - vuink.com]. 질 좋은 교재를 만들어내는 일은 결코 쉽지 않으며, 설령 완벽한 교재를 구했더라도 이 내용을 찰떡같이 알아들을 수 있는 똑똑한 기본 모델을 신중하게 골라야 합니다 [Fine-tuninganLLMtowritedocslikeit’s1995– Fabrizio Ferri…].

여기에 컴퓨터의 역사를 바꾼 또 다른 놀라운 마법의 가루가 뿌려집니다. 바로 LoRA(Low-Rank Adaptation)라는 기법입니다. 언어 모델을 파인튜닝 할 때, 인공지능의 뇌세포 역할을 하는 수십억 개의 파라미터(Parameter, 조절 가능한 숫자값)를 전부 다 뜯어고치는 것은 비용도 많이 들고 컴퓨터에게 너무 무거운 짐을 지우는 일입니다 [[DoppelBot:Fine-tuneanLLMtoreplace your CEO

ModalDocs](https://modal.com/docs/examples/llm-finetuning)]. 대신 LoRA 기술은 원래 뇌세포를 건드리지 않고, 필요할 때 살짝 끼워 넣을 수 있는 아주 작고 가벼운 ‘어댑터’만 만들어냅니다 [[DoppelBot:Fine-tuneanLLMtoreplace your CEO

ModalDocs](https://modal.com/docs/examples/llm-finetuning)].

조금 더 와닿게 상상해 볼까요? 수만 페이지짜리 두꺼운 백과사전의 일부 내용을 내 업무에 맞게 고치고 싶다고 해보죠. 책 전체를 처음부터 다시 활자를 맞춰 인쇄하는 것은 끔찍하게 비효율적인 일입니다. 대신 LoRA 기술은 투명한 셀로판지나 얇은 ‘포스트잇’에 내가 원하는 메모를 적어 필요한 페이지 위에 살짝 붙여두는 것과 같습니다. 이 가벼운 포스트잇만 뗐다 붙였다 하면, 언제든 원래의 똑똑한 AI로 돌아갈 수도 있고 순식간에 90년대 타자기 감성의 직원으로 변신할 수도 있는 놀라운 유연성을 얻게 됩니다.

현재 상황 (Where We Stand)

그렇다면 이런 영화 같은 기술은 지금 우리의 현실 속에서 정확히 어디쯤 와 있을까요? 앞서 언급했던 1990년대 감성 기술 문서 작성 실험을 다시 들여다보겠습니다. 이 기발한 실험을 진행한 개발자는 목표를 달성하기 위해 ‘Llama 3.1 8B Instruct’와 ‘Qwen 2.5 7B Instruct’라는 두 가지 오픈소스 인공지능 모델을 훈련 모델로 선택했습니다 [[Fine-tuninganLLMtowritedocslikeit’s1995

Hacker News](https://news.ycombinator.com/item?id=48408442)].

여기서 모델 이름 뒤에 붙은 ‘8B’나 ‘7B’라는 숫자에 주목할 필요가 있습니다. 이는 인공지능 내부의 뇌세포(파라미터) 개수가 약 80억 개(8 Billion), 70억 개라는 뜻입니다. 대략 전 세계 인구수만큼의 어마어마한 숫자값들이 서로 복잡하게 얽히고설켜서 문맥을 이해하고 최적의 단어를 찾아내고 있다고 생각하면 됩니다.

불과 몇 년 전만 해도 이 전 세계 인구수만큼의 뇌세포를 가진 인공지능을 돌리려면, 요란한 냉각기가 돌아가는 거대한 데이터 센터와 집채만 한 서버 컴퓨터가 필요했습니다. 하지만 기술의 발전 속도는 눈이 부실 정도입니다. 파라미터 약 80억 개(8B) 수준에 달하는 이 무거운 모델들이 이제는 놀랍게도 우리가 카페나 도서관에서 흔히 쓰는 얇고 가벼운 노트북, 즉 ‘맥북 에어(MacBook Air)’에서도 아주 편안하고 부드럽게 돌아갑니다 [[Fine-tuninganLLMtowritedocslikeit’s1995

Hacker News](https://news.ycombinator.com/item?id=48408442)].

이는 인류 컴퓨터 역사에 기록될 엄청난 성취입니다. 비싼 클라우드 이용료를 내거나 억대의 장비를 사지 않아도, 누구나 자신의 개인용 랩톱에 무료 AI를 다운받아 앞서 설명한 마법의 포스트잇(LoRA)을 붙일 수 있습니다. 나만의 천재적인 AI 비서를 만들어낼 수 있는 완벽한 공장이 이미 우리 책상 위에 차려져 있다는 뜻입니다. 이제 남은 숙제는 단 하나뿐입니다. 똑똑한 AI에게 먹일 영양가 넘치고 맛있는 ‘데이터 교재’(예를 들어 1990년대 매뉴얼 모음집, 우리 회사만의 비밀 레시피 등)를 사람의 손으로 얼마나 정성껏 모아주느냐에 달려있습니다.

앞으로 어떻게 될까? (What’s Next)

앞으로 인공지능 산업의 미래는, 세상을 널리 이롭게 하는 ‘모두를 위한 범용 AI’와 내 방에 쏙 들어오는 ‘오직 나만을 위한 맞춤형 AI’라는 두 가지 거대한 물결로 나뉘어 폭발적으로 성장할 것입니다. 그중에서도 파인튜닝은 우리에게 인공지능의 결과물에 대한 일관성을 완벽하게 유지하면서 절대적인 통제권을 쥐여주는 가장 강력한 무기입니다 [Fine Tune an open-source LLM - ashutosh.dev].

머지않은 미래에 우리는 인터넷이 툭 끊긴 비행기 안이나 깊은 산속에서도, 내 스마트폰과 가벼운 노트북 안에서 나만의 비서들을 불러낼 수 있을 것입니다. 오직 나만의 독특한 말투를 구사하고, 내 직무의 1급 비밀 지식을 완벽하게 숙지한 작고 충성스러운 AI 비서들을 여러 명 거느리고 다니게 되겠죠. 1995년의 낡은 문서 작성자를 부활시킨 이번 실험처럼, 디자이너는 자신과 똑같은 까다로운 미감을 가진 디자인 평가 AI를 만들고, 소설가는 자신의 문체를 그대로 복제한 보조 작가 AI를 노트북 안에서 직접 ‘교육’시키는 마법. 그 기분 좋은 마법의 시대가 이미 우리 일상 속으로 조용히 스며들고 있습니다.

MindTickleBytes AI의 시선 (AI’s Take)

모든 위대한 기술이 궁극적으로 도달하는 종착지는 항상 ‘개인화’였습니다. 한때 한 도시를 가득 채우던 집채만 한 컴퓨터가 내 손목 위의 스마트워치가 된 것처럼 말입니다. 수백억 개의 두뇌를 가진 인공지능이 얇은 노트북 안으로 들어오고, ‘파인튜닝’이라는 강력한 교육 채찍이 평범한 개인의 손에 쥐어졌다는 사실은 무척 경이롭습니다.

이제 인공지능의 진정한 가치는 거대 IT 기업이 일방적으로 내려주는 ‘표준화된 정답’에 있지 않습니다. 내 삶의 목적과 취향에 맞게 AI를 얼마나 정교하고 애정 어리게 길들일 수 있느냐에 달려 있습니다. 여러분은 지금 책상 위 노트북에서 어떤 전문가를 여러분만의 든든한 동료로 길러내고 싶으신가요?

참고자료

Fine-tuninganLLMtowritedocslikeit’s1995– Fabrizio Ferri…
[Fine-tuninganLLMtowritedocslikeit’s1995 Hacker News](https://news.ycombinator.com/item?id=48408442)
[DoppelBot:Fine-tuneanLLMtoreplace your CEO ModalDocs](https://modal.com/docs/examples/llm-finetuning)
LLMs:Fine-tuning, distillation, and prompt engineering
Fine-tuning an LLM to write docs like it’s 1995 - vuink.com
Fine Tune an open-source LLM - ashutosh.dev

Share this article:

이 글을 얼마나 이해했나요?

Q1. 다음 중 파인튜닝(Fine-tuning)을 할 때 원본 언어 모델 전체를 무겁게 수정하는 대신, 작고 가벼운 어댑터만 만들어 병합하는 기술의 이름은 무엇인가요?

ChatGPT
LoRA
Llama 3.1

LoRA(Low-Rank Adaptation)는 기본 모델의 모든 파라미터를 수정하는 대신, 필요할 때 병합할 수 있는 작은 어댑터를 생성하여 효율적인 훈련을 가능하게 합니다.

Q2. 1980~90년대 소프트웨어 문서 작성자처럼 글을 쓰도록 모델을 훈련시키기 위해 가장 구하기 어려운 핵심 요소는 무엇이었나요?

집채만한 슈퍼컴퓨터
엄청난 양의 고품질 서면 자료(훈련 데이터)
수십억 원의 예산

파인튜닝 과정 자체는 저렴하지만, 모델을 훈련시키기 위해서는 목표로 하는 스타일의 수많은 서면 자료(고품질 훈련 데이터)를 확보하는 것이 가장 어렵습니다.

Q3. 최근 실험에서 파라미터 약 80억 개(8B) 크기의 모델들을 무리 없이 실행하는 데 사용된 기기는 무엇인가요?

아마존 데이터 센터
개인용 노트북(MacBook Air)
대형 메인프레임 서버

약 80억(8B) 개의 파라미터를 가진 이 언어 모델들은 맥북 에어(MacBook Air) 같은 일반적인 소비자용 개인 노트북에서도 아주 편안하게 실행될 수 있습니다.