혁명의 해부학 #10

모델: 해자의 이동

9편의 대지주가 깐 도구 위에서, 실제로 돌아가는 건 AI 모델입니다.
그런데 그 모델값이 해마다 10배씩 녹아내립니다.
같은 성능당 비용 (3년)
1/1,000
동일 성능 기준 연 10배씩, 3년에 1,000배 하락
모델 만드는 비용 (학습)
연 2.4~3.5×
역설: 쓰는 값은 녹는데 만드는 값은 매년 오른다
기업이 동시에 쓰는 모델 수
4.7개
세입자가 모델을 안 가린다, 모델은 교체 가능한 부품

어제의 최전선 성능이 1년 뒤엔 거의 공짜가 됩니다. 모델은 골드러시의 곡괭이가 아니라, 빠르게 흔해지는 소모품에 가까워졌습니다.
그렇다면 진짜 곡괭이는 어디로 갔을까요. 모델 위(유통)와 옆(응용)과 밑(자본)으로 옮겨가는 중입니다.

가격은 왜 녹는데 만드는 건 더 비싸지는가, 그리고 곡괭이는 어디로 옮겨갔는가

곡괭이를 다시 떠올려 봅니다. 누가 금을 캐든 반드시 거쳐야 하는 길목을 쥔 자, 그것이 이 시리즈가 매번 쓰는 핵심 비유입니다. 그 골드러시 유래와 좋은 곡괭이의 세 조건은 곡괭이를 판 자들에 정리해 두었습니다. 6편부터 9편까지, 우리는 그 곡괭이를 칩(6편)에서 실리콘(7편)으로, 컴퓨트(8편)에서 플랫폼(9편)으로 따라 내려왔습니다. 그리고 8편에서 한 문장을 얻었습니다. 곡괭이는 사라지지 않고 이동한다. 9편에서도 같은 일이 반복됐습니다. 날GPU 임대(IaaS)의 곡괭이가 그 위 도구(AI 플랫폼)로 옮겨갔죠.

1달러의 여정으로 다시 봅니다. 우리가 AI 서비스에 1달러를 쓰면, 그 돈은 칩(6편)과 실리콘(7편)과 컴퓨트(8편)와 플랫폼(9편)을 지나, 마침내 그 도구 위에서 실제로 돌아가는 무언가에 도착합니다. 그게 바로 AI 모델입니다. 여기서 파운데이션 모델이라는 용어가 처음 나옵니다. 파운데이션 모델(foundation model)이란 방대한 데이터로 한 번 크게 학습해 두고, 번역이든 코딩이든 요약이든 온갖 일에 두루 갖다 쓰는 거대 AI의 본체입니다. GPT, Claude, Gemini, Llama가 그것입니다. 9편 대지주의 도구 위에서 실제 노동을 하는 것이 이 모델입니다. 1달러의 여정에서 가장 윗층, 우리 눈에 보이는 AI에 가장 가까운 층입니다.

그런데 이 층에서는 8편과 9편이 겪지 않은 일이 벌어집니다. 9편의 마지막에 우리가 박아 둔 반증 조건이 하나 있었습니다. 오픈 모델과 표준이 AI 플랫폼 자체를 범용화하면, 곡괭이가 한 번 더 이동한다는 조건이었죠. 모델 계층에서는 그 일이 미래의 가정이 아니라 이미 벌어진 현실입니다. 모델값이 녹고 있기 때문입니다. 여기서 토큰과 그 단가라는 용어가 나옵니다. 토큰(token)이란 AI가 글을 처리하는 최소 단위로, 대략 단어 한 조각입니다. 그리고 토큰 100만 개를 처리하는 데 드는 값($/1M tokens)은 AI 모델을 쓰는 기본 요금입니다. 이 요금이 무너지고 있습니다.

이 편의 한 줄 논제를 먼저 박습니다. 결론부터 닻을 내리는 것입니다. 같은 성능을 내는 비용이 해마다 10배씩, 3년에 1,000배 떨어집니다. 모델은 곡괭이가 아닙니다. 해자는 모델 위의 유통과 옆의 응용으로 이동합니다. 8편과 9편에서 곡괭이는 옆 칸으로 이동했습니다. 칩에서 시스템으로, 땅에서 도구로요. 모델 계층에서는 이동의 양상이 한 단계 더 극단적입니다. 모델 자체가 곡괭이로 굳기도 전에 손에서 녹아 버립니다. 그래서 곡괭이는 모델을 떠나, 그 위(유통)와 옆(응용)과 밑(자본)으로 흩어집니다. 이 글은 그 다섯 장면을 차례로 봅니다. 가격이 녹는 증거(1장), 그런데 만드는 건 더 비싸지는 역설(2장), 모델에 자물쇠가 안 걸리는 이유(3장), 그래서 곡괭이가 어디로 갔는지(4장), 그리고 그 곡괭이를 누가 쥐었는지(5장)입니다.

📖 이 글을 읽는 법

이 글은 특정 종목을 추천하지 않습니다. AI의 두뇌인 파운데이션 모델 계층에서, 모델값이 왜 녹는지, 그런데도 만드는 비용은 왜 오르는지, 모델에 왜 자물쇠가 안 걸리는지, 그리고 곡괭이가 어디로 옮겨갔는지를 데이터로 추적합니다. 미국, 중국, 유럽을 가리지 않고, 상장과 비상장도 가리지 않습니다. 가격이 합리적인지(밸류에이션)는 이 글의 범위가 아니라, 발굴된 후보를 따로 종목 분석할 때 다룹니다.

1. 가격이 녹는다 (범용화의 증거)

모델 계층의 모든 이야기는 한 가지 사실에서 출발합니다. 모델을 쓰는 값이 무너지고 있다는 것입니다. 1장에서는 그 무너짐을 세 각도에서 확인합니다. 같은 성능의 값이 얼마나 빠르게 녹는지(1.1), 시장 전체가 그 사실을 한순간에 깨달은 날(1.2), 그리고 어제의 최전선이 오늘 무료로 풀린다는 증거(1.3)입니다.

1.1 같은 성능의 값이 해마다 10배씩 녹는다

결론부터 말합니다. 어제의 최전선 성능은 1년이면 거의 공짜가 됩니다. 모델값이 어떻게 녹는지를 가장 정확한 기준으로 봅니다.

여기서 LLMflation이라는 말이 나옵니다. LLMflation이란 한 벤처캐피털(a16z)이 붙인 이름으로, 인플레이션이 화폐 가치를 깎듯 같은 AI 성능의 값이 빠르게 깎이는 현상을 가리킵니다. 핵심 수치는 이렇습니다. 같은 성능(특정 시험 점수 기준)을 내는 데 드는 비용이 해마다 약 10배씩, 3년 동안 약 1,000배 떨어졌습니다 (a16z LLMflation).

구체적으로 봅니다. 2021년 말 GPT-3급 성능을 내려면 토큰 100만 개당 약 $60를 내야 했습니다. 3년 뒤인 2024년 말, 같은 성능을 내는 작은 오픈 모델의 값은 토큰 100만 개당 약 $0.06로 떨어졌습니다. 1,000분의 1입니다 (a16z LLMflation). 이 숫자가 중요한 이유는 측정 기준 때문입니다. 이건 성능을 똑같이 고정하고 잰 값입니다. 작년에 비싸게 주고 쓰던 그 성능을, 올해는 거의 공짜로 쓸 수 있다는 뜻입니다. 마치 작년에 최신형이었던 노트북이 1년 만에 헐값에 풀리는 것과 비슷하지만, 그 속도가 비교가 안 될 만큼 빠릅니다.

흔히 "모델값이 36개월에 12배 떨어졌다"는 말도 돌아다닙니다. 이건 다른 계산입니다. GPT-4의 출시 입력 요금(토큰 100만 개당 $30, 2023년 3월)이 GPT-5.4의 입력 요금($2.50, 2026년 4월)으로 떨어진 것을 잰 값입니다 (TLDL). 이건 성능을 고정한 게 아니라(GPT-5.4가 훨씬 셉니다) 입력 요금만 본 것이고, 출력 요금까지 보면 6배입니다. 즉 같은 모델 계열의 세대 간 요금이 12배 내린 것이고, 같은 성능 기준으로는 1,000배입니다. 어느 자로 재든 방향은 하나입니다. 모델값은 빠르게 녹습니다.

다른 기관도 같은 그림을 그립니다. 한 독립 연구소(Epoch AI)는 동일 성능 비용이 시험 종류에 따라 연 5배에서 50배까지, 중앙값으로 연 약 50배 떨어진다고 측정했습니다. 표준 지식 시험(MMLU 64.8점)에서 같은 답을 내는 값은 2022년 11월 토큰 100만 개당 $20.00에서 2024년 10월 $0.07로, 18개월 만에 약 280배 떨어졌습니다 (Epoch AI, Stanford AI Index 2025).

같은 성능(MMLU 42점)당 값: 3년에 약 1,000배 하락 (로그스케일)$60$6$0.6$0.062021.11202220232024.11$60 (GPT-3급)$0.06 (동급 오픈 모델)약 1,000배 하락입력가 세대 비교(GPT-4 $30 → GPT-5.4 $2.50): 12배(성능 고정 아님)성능을 고정하고 재면 3년에 1,000배. 어제의 최전선이 오늘 거의 공짜가 된다

출처: a16z LLMflation(MMLU 42점 고정 기준)·Epoch AI·Stanford AI Index 2025. 점선은 GPT-4에서 GPT-5.4 입력가 비교(성능 고정 아님). 개념적 시각화.

1.2 DeepSeek 충격: 시장이 한 번에 깨달은 날

이 범용화가 시장 전체를 한순간에 흔든 날이 있습니다. 2025년 1월 27일입니다. 중국의 작은 연구소 DeepSeek이 R1이라는 모델을 공개했는데, OpenAI의 최상급 추론 모델(o1)과 맞먹는 성능을 내면서 쓰는 값은 27배 쌌습니다 (IoT Analytics). 여기서 추론(inference)이라는 용어가 나옵니다. 추론이란 학습이 끝난 모델이 실제로 답을 만들어 내는 과정으로, 우리가 AI에 질문하고 답을 받을 때 일어나는 일입니다.

더 놀라운 건 만든 값이었습니다. DeepSeek은 R1의 학습에 약 $5.6M(약 560만 달러)이 들었다고 발표했습니다 (Stanford FSI). 단 이 숫자는 정확히 한정해야 합니다. 이건 마지막 학습을 한 번 돌리는 데 든 GPU 계산 비용만이고, 연구 인력, 실패한 실험, 데이터센터 운영비는 빠졌습니다. 한 독립 추정은 컴퓨트 전체로 $6~7M, 또 다른 분석은 보유한 GPU 자산 전체로 따지면 $1.6B(약 16억 달러)에 이른다고 반박했습니다. 즉 "560만 달러로 프론티어 모델을 만들었다"는 표현은 마지막 학습 한 번의 계산비만 가리킬 뿐, 전체 개발비가 아닙니다.

그럼에도 시장의 반응은 격렬했습니다. 발표 당일, AI 칩의 대명사 엔비디아 주가가 하루에 -18% 빠졌고, 시가총액 약 $589B(약 5,890억 달러)가 단 하루에 증발했습니다. 미국 증시 역사상 한 종목이 하루에 잃은 시가총액으로 최대 규모였습니다 (CBS News). 시장이 한순간에 깨달은 것입니다. 프론티어 성능이 더 이상 소수의 비싼 독점물이 아닐 수 있다는 사실을요. 참고로 엔비디아는 이튿날 약 9% 반등했고 이후 시총을 회복했습니다. 1장은 모델값의 범용화를 다루는 것이지 엔비디아의 향방을 다루지 않습니다. 컴퓨트 계층의 곡괭이는 8편에서 별도로 봤습니다.

1.3 어제의 최전선은 오늘의 무료 공개품

범용화의 결정적 증거는 오픈 모델이 클로즈드 모델을 바짝 따라잡았다는 데 있습니다. 여기서 오픈웨이트라는 용어가 나옵니다. 오픈웨이트(open-weight) 모델이란 학습이 끝난 모델의 핵심 파일을 누구나 내려받아 자기 서버에서 공짜로 돌릴 수 있게 공개한 모델입니다. 반대로 클로즈드 모델은 회사가 가진 모델을 API로만 빌려주고 핵심 파일은 안 줍니다.

오픈과 클로즈드의 성능 격차는 한때 거의 사라졌습니다. 두 진영의 실력 점수 차이를 보면, 2024년 10월에는 15~20포인트였다가 2025년 2월에는 단 4포인트까지 좁혀졌습니다 (BenchLM). 여기서 LMArena와 Elo라는 용어가 나옵니다. LMArena란 사람들이 두 모델의 답을 눈가림으로 비교 투표해 실력을 매기는 공개 순위판이고, Elo란 체스 등급처럼 상대 승률로 환산한 점수입니다. 4포인트 차이란 사실상 사람 눈으로는 우열을 가리기 어려운 수준입니다.

단 정직하게 둘 것이 있습니다. 그 격차는 2026년 초 다시 25~55포인트로 벌어졌습니다. 최전선 진영이 추론 특화 같은 새 역량으로 다시 앞서간 것입니다. 이 재확대는 2장의 핵심이므로 거기서 자세히 봅니다. 1장이 말하는 건 이것입니다. 작년의 최전선 성능은 올해 오픈 모델이 거의 따라잡아 공짜로 풀립니다. 단 올해의 새 최전선은 또 새로 벌어집니다.

실제 사용에서도 이게 보입니다. 개발자들이 모델을 골라 쓰는 한 중개 플랫폼(OpenRouter)에서, 1년간 처리된 토큰을 모델 제작사별로 줄 세우면 1위가 DeepSeek(14.37조 토큰), 2위가 Qwen(알리바바, 5.59조), 3위가 Meta의 Llama(3.96조)였습니다. 모두 오픈 모델입니다. 비싼 클로즈드 모델(OpenAI 1.65조)보다, 무료로 풀린 오픈 모델이 실제로 더 많이 돌아갔습니다 (OpenRouter State of AI). 특히 중국산 오픈 모델의 비중은 2026년 한때 61%까지 치솟았습니다 (Dataconomy).

단 이 순위는 "개발자가 가격 대비 성능으로 고른 토큰"이라는 한정된 창입니다. 엔터프라이즈가 돈을 더 쓰는 시장(2장과 3장에서 봅니다)에서는 여전히 클로즈드가 우위이고, 비싼 모델을 직접 접속하는 Anthropic 같은 곳은 이 중개 플랫폼 집계에 잘 안 잡힙니다. 그래도 방향은 분명합니다. 어제의 최전선이 오늘은 무료로 풀려 광범위하게 돌아갑니다.

개발자가 실제로 가장 많이 돌린 토큰: 상위가 오픈 모델 (1년 누적, 조 단위)
14.37조
5.59조
3.96조
1.65조
0.82조
DeepSeek (오픈)
Qwen·알리바바 (오픈)
Llama·Meta (오픈)
OpenAI (클로즈드)
Google (클로즈드)

출처: OpenRouter 2025 State of AI(100조 토큰 연구, 2024.11~2025.11). 개발자·스타트업 라우팅 기준이며 엔터프라이즈 직접접속·Anthropic 등 미반영

투자자에게 1장이 말하는 것은 이렇습니다. 모델값은 같은 성능 기준 연 10배, 3년 1,000배로 녹습니다. 어제의 최전선이 오늘 공짜가 됩니다. 그래서 모델 자체는 골드러시의 곡괭이가 되기 어렵습니다. 곡괭이라면 시간이 지나도 길목을 지켜야 하는데, 모델은 길목을 지키기 전에 흔해집니다.

1장 결론: 어제의 최전선 성능은 거의 공짜가 된다. 모델값은 같은 성능 기준 연 10배·3년 1,000배로 녹는다.

  • LLMflation: 같은 성능당 비용이 연 약 10배, 3년에 약 1,000배 하락($60에서 $0.06로, MMLU 42점 고정·a16z). 입력가 세대 비교로는 12배(GPT-4 $30에서 GPT-5.4 $2.50)지만 이건 성능 고정이 아니다. Epoch AI 중앙값 연 50배·MMLU 동급 18개월 280배.
  • DeepSeek 충격(2025.01.27): o1급 성능에 27배 싼 값. 발표 당일 엔비디아 -18%·시총 $589B 단일일 증발(미 증시 역대 최대). 단 학습비 $5.6M은 최종 런 GPU 계산비만이고 전체 개발비 아님(독립추정 $6~7M, 자산 기준 $1.6B).
  • 오픈이 클로즈드를 바짝 추격: Elo 격차 2024.10 15~20에서 2025.02 단 4포인트. 개발자 실사용 토큰 상위가 전부 오픈 모델(DeepSeek 14.37조·Qwen·Llama). 단 2026초 격차 재확대(2장).

2. 그런데 만드는 건 더 비싸진다 (진입장벽의 역설)

1장에서 모델 쓰는 값이 녹는 것을 봤습니다. 그런데 정반대 방향의 사실이 있습니다. 2장에서는 만드는 값이 오히려 매년 오르는 역설(2.1), 그 와중에도 최전선 프리미엄은 매 세대 다시 생긴다는 점(2.2), 그리고 단가는 녹어도 청구서는 오히려 늘 수 있다는 단서(2.3)를 봅니다.

2.1 쓰는 값은 녹는데, 만드는 값은 오른다 (역설)

결론부터 말합니다. 모델을 쓰는 값은 녹지만, 모델을 만드는 값은 해마다 오릅니다. 1장과 정반대 방향입니다. 이 역설이 모델 계층을 이해하는 열쇠입니다.

모델을 한 번 크게 학습하는 데 드는 비용은 매년 가파르게 오릅니다. 한 독립 연구소(Epoch AI)는 최전선 모델의 최종 학습 계산 비용이 2016년 이후 매년 약 2.4배씩(추정 범위로는 연 2.0~3.1배), 더 최근 기준으로는 연 3.5배씩 늘었다고 측정합니다. 약 7개월마다 두 배입니다 (Epoch AI Trends). 이 추세대로면 2027년 초에는 모델 하나를 만드는 데 $1B(10억 달러)를 넘길 전망입니다 (Epoch AI).

이 학습 비용은 계산법에 따라 숫자가 크게 달라집니다. 마지막 학습을 한 번 돌리는 계산비만 따지면 한 모델에 수천만 달러대이지만, 연구 인력과 실패한 실험과 데이터를 다 넣으면 수억 달러대로 뜁니다. 그래서 단일 모델의 정확한 금액보다, 그 비용이 매년 2.4배에서 3.5배로 불어난다는 추세와, 그 돈을 댈 수 있는 곳이 극소수라는 사실이 중요합니다.

그 극소수가 실제로 얼마를 조달하는지 보면 규모를 실감합니다. 2025년 한 해, OpenAI는 한 라운드에 $40B(약 40조 원)를 조달하며 기업가치 $300B를 인정받았고, Anthropic은 $13B를 조달하며 $183B, xAI는 주식과 부채로 약 $13.5B를 조달하며 $200B를 기록했습니다. 이 세 곳만 합쳐도 한 해 조달이 $63B(약 63조 원)를 넘습니다 (TechFundingNews). 모델을 쓰는 값은 거의 공짜로 떨어지는데, 그 모델을 만드는 입장권은 수십조 원짜리가 됐습니다.

모델 경제의 역설: 만드는 값은 매년 오르고, 쓰는 값은 매년 녹는다202120242027 (전망)학습 비용: 연 2.4~3.5배 ↑2027년 모델당 $1B 전망추론 가격: 같은 성능당 연 약 10배 ↓3년 1,000배비싸게 만들어, 빠르게 싸지는 상품입장권은 수십조 원, 결과물은 거의 공짜. 그래서 만든 자가 곧 곡괭이를 쥐는 건 아니다

출처: 본문 2장. Epoch AI Trends(학습비)·a16z LLMflation(추론가). 학습비는 계산법에 따라 단일 모델 절대액이 달라지므로 추세(배수) 기준. 개념적 시각화.

2.2 최전선 프리미엄은 매 세대 다시 생긴다

1장에서 오픈 모델이 클로즈드를 4포인트까지 따라잡았다고 했습니다. 그런데 그 격차는 2026년 초 다시 25~55포인트로 벌어졌습니다 (BenchLM). 따라잡힌 게 영구적이지 않았던 것입니다.

격차가 다시 벌어진 동력은 새 역량입니다. 최전선 진영(Anthropic·OpenAI·Google)이 추론 특화 모델을 내놓으면서, 어려운 문제일수록 격차가 커졌습니다. 실제로 최상위 실력 순위(LMArena)를 보면 상위 10개 중 6개를 한 회사(Anthropic)가, 나머지를 Google과 OpenAI가 나눠 가졌고, 오픈 모델은 최상단에서 밀려나 있습니다. 패턴은 이렇습니다. 작년의 최전선은 올해 오픈 모델이 따라잡아 공짜가 되지만, 올해의 새 최전선은 다시 비싼 프리미엄을 만듭니다. 최전선 프리미엄이 사라지는 게 아니라, 매 세대 자리를 옮겨 다시 생기는 것입니다.

이건 1장의 범용화와 모순이 아닙니다. 둘은 다른 층에서 동시에 참입니다. 흔해진 어제의 성능(범용화)과, 새로 벌어진 오늘의 최전선(프리미엄)이 같이 존재합니다. 단 투자 관점에서 중요한 건 이것입니다. 그 최전선 프리미엄은 한자리에 머무는 곡괭이가 아니라, 매 세대 갈아엎어지는 자리입니다. 작년 1등 모델이 올해도 1등이라는 보장이 없습니다.

오픈 vs 클로즈드 최전선 실력 격차 (Elo 포인트): 좁혀졌다 다시 벌어진다
15~20
거의 수렴
4
재확대
25~55
2024.10
2025.02 (최저)
2026 초

출처: BenchLM Leaderboard History·범용화 자료. 추론 특화 등 새 역량으로 최전선 프리미엄이 매 세대 재생성. 추정 범위

2.3 단서: 단가는 녹는데 청구서는 오히려 늘 수 있다

한 가지 반대 방향의 사실을 정직하게 둡니다. 모델 단가가 1,000분의 1로 녹았다고 해서 AI 비용 청구서가 1,000분의 1이 되는 건 아닙니다. 오히려 늘기도 합니다. 이유는 사용량 폭증입니다.

요즘 모델은 답하기 전에 혼자 길게 생각합니다(추론 특화 모델). 그 과정에서 눈에 안 보이는 생각 토큰을 잔뜩 씁니다. 한 추정에 따르면 이런 추론·자동작업형 모델은 일반 대화보다 토큰을 5~100배 더 소비합니다 (OpenRouter State of AI). 단가가 10분의 1로 떨어져도 사용량이 100배로 늘면, 총비용은 오히려 10배가 됩니다.

이건 이 장의 역설을 한 겹 더 보탭니다. 모델값(단가)은 녹지만, AI에 쓰는 총지출은 줄지 않습니다. 그래서 모델을 더 싸게, 더 효율적으로 돌리는 능력(밑에서 받쳐 주는 컴퓨트와 자본)은 오히려 더 중요해집니다. 이 단서가 4장에서 "곡괭이가 밑(자본)으로도 이동한다"는 이야기로 이어집니다.

투자자에게 2장이 말하는 것은 이렇습니다. 모델은 비싸게 만들어 빠르게 싸지는 상품입니다. 만드는 입장권은 수십조 원, 결과물은 거의 공짜입니다. 그래서 모델을 만든 자가 곧 곡괭이를 쥐는 건 아닙니다. 게다가 최전선 프리미엄은 한자리에 머물지 않고 매 세대 갈아엎어집니다. 작년 1등이 올해 1등이라는 보장이 없는 길목은 곡괭이로 약합니다. 그리고 한 가지 더. 모델값이 녹어도 추론 토큰 소비가 폭증해 AI 전체 지출은 줄지 않으니, 그 지출을 받는 밑단(컴퓨트와 자본)은 오히려 커집니다. 곡괭이가 밑으로도 이동하는 이유입니다(4장과 연결).

2장 결론: 쓰는 값은 녹는데 만드는 값은 오른다. 그리고 최전선 프리미엄은 매 세대 자리를 옮겨 다시 생긴다.

  • 역설: 최종 학습 컴퓨트 비용 연 2.4~3.5배 상승(약 7개월마다 2배), 2027년 모델당 $1B 전망. 프론티어 랩 3사(OpenAI·Anthropic·xAI) 2025년 조달 합계 $63B+. 입장권은 수십조 원, 결과물은 거의 공짜.
  • 프리미엄 재생성: 오픈-클로즈드 Elo 격차 2025.02 최저 4에서 2026초 25~55로 재확대. 추론 특화 등 새 역량으로 최전선이 다시 벌어진다. 작년 1등이 올해 1등 보장 없음.
  • 단서(양방향): 단가는 녹지만 추론 모델 토큰 소비 5~100배라 총지출은 줄지 않는다. 그래서 밑에서 받치는 컴퓨트·자본이 더 중요해진다(4장 자본 이동으로 연결).

3. 모델에 자물쇠가 안 걸린다 (락인 부재)

1장과 2장에서 모델이 녹고 만들기는 비싸진다는 것을 봤습니다. 그렇다면 한번 쓰기 시작한 모델에 자물쇠가 걸릴까요. 3장에서는 점착이 실재하지만 모델이 아니라 그 위에 붙는다는 것(3.1)과, 그럼에도 세입자가 모델을 안 가리는 균열이 더 크다는 것(3.2)을 봅니다.

3.1 점착은 있다, 단 모델이 아니라 그 위에 붙는다

결론부터 말합니다. 점착이 없는 건 아닙니다. 단 그 점착은 모델 자체가 아니라, 모델을 둘러싼 인증과 업무 흐름에 붙습니다. 먼저 그 점착이 실재한다는 증거부터 봅니다.

첫째, 규제 산업의 신뢰 점착입니다. 병원이나 은행이 AI를 도입하려면 까다로운 보안 인증이 전제입니다. 여기서 HIPAA와 SOC2라는 용어가 나옵니다. HIPAA란 미국에서 환자 의료정보를 보호하도록 강제하는 법규이고, SOC2란 한 회사가 고객 데이터를 안전하게 다룬다는 것을 외부 감사로 인증하는 체계입니다. 한 모델 회사가 이 인증들을 갖추자, 클리블랜드 클리닉이 그 모델을 120개 병원에 배포했습니다 (ClaudeReadiness). 한번 보안 검토를 통과해 깔리면, 다른 모델로 바꾸려면 그 검토를 처음부터 다시 받아야 합니다. 이게 점착을 만듭니다.

둘째, 실제 교체 행동을 보면 기업은 잘 안 바꿉니다. 한 조사에서 기업의 66%는 쓰던 회사의 더 새 모델로 업그레이드했고, 아예 다른 회사로 갈아탄 곳은 11%에 그쳤습니다 (Menlo Ventures). 한번 자리 잡은 공급사를 유지하려는 관성이 분명히 있습니다.

단 여기서 9편에서 배운 규율을 적용합니다. 이 점착이 모델 자체에 걸린 자물쇠인지, 아니면 모델을 둘러싼 인증과 업무 흐름에 걸린 자물쇠인지를 구분해야 합니다. 클리블랜드 클리닉을 잡은 건 그 모델이 천재라서가 아니라, 인증을 통과하고 병원 시스템에 박혔기 때문입니다. 즉 점착은 모델의 두뇌가 아니라 그 주변 장치에 붙습니다. 이 구분이 3.2의 출발점입니다.

3.2 그런데 세입자가 모델을 안 가린다 (균열이 더 크다)

점착의 반대편을 봅니다. 그리고 이쪽이 더 큽니다.

첫째, 기업은 한 모델에 다 걸지 않습니다. 기업이 실제로 동시에 쓰는 모델 수는 2024년 평균 2.8개에서 2025년 4.7개로 늘었고, 5개 이상을 동시에 운영하는 기업이 37%에 이릅니다 (Typedef.ai). 작업마다 가장 잘 맞고 싼 모델로 갈아 끼우는 게 표준이 됐습니다. 개발자 조사에서도 OpenAI(87%)와 Anthropic(68%)을 동시에 쓰는 게 일반적이라, 합산이 100%를 훌쩍 넘습니다 (Vercel).

둘째, 모델을 부품처럼 갈아 끼우게 해 주는 장치가 폭발적으로 퍼졌습니다. 여기서 멀티모델 라우팅이라는 용어가 나옵니다. 멀티모델 라우팅(multi-model routing)이란 여러 회사의 모델을 한 창구로 묶어 두고, 요청마다 가장 적합한 모델로 자동으로 보내 주는 중개 방식입니다. 모델을 갈아 끼워도 앱 코드는 거의 안 바꿔도 됩니다. 세 가지 장치가 이를 뒷받침합니다.

먼저, 한 중개 플랫폼(OpenRouter)이 처리하는 토큰은 6개월 만에 주당 5조에서 25조로 5배 늘었고, 기업가치는 1년에 2.6배($13억)가 됐습니다 (TechCrunch). 다음으로, 100개가 넘는 모델 공급사를 한 줄짜리 코드로 호출하게 해 주는 무료 도구(LiteLLM)는 개발자 사이에서 별 49,600개를 받았고, 넷플릭스 같은 기업이 씁니다 (LiteLLM GitHub). 마지막으로, 모델과 외부 도구를 잇는 공통 규격(MCP)도 폭발했습니다. 여기서 MCP라는 용어가 나옵니다. MCP(모델 연결 표준, Model Context Protocol)란 한 회사가 만든 모델이든 다른 회사 모델이든 똑같은 방식으로 도구에 연결하게 해 주는 공통 규격입니다. 이 규격을 따르는 서버 다운로드가 5개월 만에 10만에서 800만으로 80배 늘었고, OpenAI와 Google과 마이크로소프트가 전부 채택했습니다 (MCP Wikipedia).

정리하면 이렇습니다. 모델을 바꾸는 마찰은 점점 한 줄짜리 코드 수정 수준으로 떨어지고 있습니다. 세입자가 모델을 안 가립니다. 모델은 교체 가능한 부품이 됐습니다.

세입자가 모델을 안 가린다: 추상화 레이어가 모델을 부품으로 만든다내 앱코드는 거의 그대로멀티모델 라우팅 (OpenRouter · LiteLLM · MCP)1줄 코드로 교체GPTClaudeGeminiLlamaDeepSeek평균 4.7개 동시 사용 · 5개+ 37% · MCP 80배점착은 모델(부품)이 아니라 위 레이어(인증·워크플로우)에 붙는다

출처: 본문 3장. Typedef.ai·TechCrunch(OpenRouter)·LiteLLM GitHub·MCP Wikipedia. 개념적 시각화.

투자자에게 3장이 말하는 것은 이렇습니다. 모델 자체에는 자물쇠가 거의 안 걸립니다. 기업은 평균 4.7개 모델을 갈아 끼우고, 추상화 레이어가 교체를 한 줄 코드로 만듭니다. 점착은 분명 있지만 모델의 두뇌가 아니라 그 위(인증과 업무 흐름)에 붙습니다. 그래서 곡괭이를 찾으려면 모델이 아니라 그 위와 옆을 봐야 합니다. 그게 4장의 길입니다.

3장 결론: 세입자가 모델을 안 가린다. 모델은 교체 가능한 부품이고, 점착은 모델이 아니라 그 위에 붙는다.

  • 점착은 있다(강함 먼저): 엔터프라이즈 인증(HIPAA·SOC2)과 EHR 통합의 신뢰 점착(Cleveland Clinic 120병원). 같은 회사 모델로 업그레이드 66% vs 벤더 교체 11%. 단 이 점착은 모델의 두뇌가 아니라 인증·워크플로우에 붙는다.
  • 균열이 더 크다: 기업 평균 동시 사용 모델 2.8에서 4.7개, 5개+ 37%. 추상화 레이어가 교체를 1줄 코드로: OpenRouter 토큰 5배·밸류 2.6배, LiteLLM 49.6k stars·100개+ 공급사, MCP 서버 5개월 80배(OpenAI·Google·MS 채택).
  • 결론: 모델 교체 마찰은 한 줄 코드 수준으로 하락. 곡괭이를 찾으려면 모델이 아니라 위(유통)와 옆(응용)을 봐야 한다(4장).

4. 곡괭이는 어디로 갔나 (해자의 이동)

1장부터 3장까지 본 것은 분명합니다. 모델 자체는 빠르게 녹고, 자물쇠가 잘 안 걸립니다. 모델은 더 이상 남이 넘보지 못하게 막아 주는 경제적 해자가 되기 어렵다는 뜻입니다. 그렇다면 곡괭이는 모델을 떠나 어디로 갔을까요. 세 방향입니다. 모델 위(유통), 옆(응용), 밑(자본)입니다. 차례로 봅니다.

4.0 곡괭이는 모델을 떠나 어디로 갔나 (입구)

미리 하나만 일러둡니다. 곡괭이는 세 방향으로 흩어지지만, 그 세 자리의 주인은 상당 부분 같은 소수로 겹칩니다. 그래서 이 장을 읽다 보면 같은 회사 이름이 위에서도 밑에서도 반복해 나옵니다. 그게 우연이 아니라는 매듭은 4.5에서 짓습니다. 일단은 세 방향을 따라가 봅니다.

4.1 위로: 유통 채널 (디폴트 지위)

곡괭이가 간 첫 번째 방향은 모델 위, 유통 채널입니다. 모델이 아무리 똑똑해도 사용자에게 닿는 길목을 누군가 쥐고 있으면, 그 길목이 곡괭이가 됩니다.

가장 또렷한 증거는 Apple입니다. Apple은 자기 기기의 AI 기반을 구글의 Gemini 모델 위에 짓기로 하고, 그 대가로 연간 약 $10억(10억 달러)을 구글에 지불하는 것으로 보도됐습니다 (Windows Central). 여기서 디폴트 지위라는 말을 씁니다. 디폴트 지위란 누군가 돈을 내고 자기 제품의 기본값으로 그 모델을 채택해, 사용자가 따로 고르지 않으면 자동으로 그 모델이 돌아가는 자리입니다. 수십억 대 기기의 기본 AI 자리를, 한 모델 회사가 돈을 받고 차지한 것입니다.

여기서 잠깐, 규모와 락인은 다릅니다. ChatGPT가 월 사용자 10억 명을 모았다는 식의 숫자는 규모는 증명하지만 떠나기 어렵다는 것(락인)은 증명하지 않습니다. 사용자가 내일 다른 앱을 열면 그만이기 때문입니다. 그래서 이 장은 규모 지표가 아니라 락인 증거만 곡괭이로 셉니다. 락인 증거는 두 가지입니다. 하나가 방금 본 디폴트 지위이고, 다른 하나가 잠시 뒤(4.2) 볼 워크플로우 통합입니다. 둘 다 떠나려면 실제로 값을 치러야 하는 구조입니다.

그 디폴트 지위의 증거가 더 있습니다. 구글 검색 결과 맨 위에 AI가 요약을 띄우는 기능(AI Overviews)은 미국 검색 쿼리의 약 50%에 노출됩니다 (SEOScaleUp). 사람들이 검색하는 길목 절반에서, 어떤 모델의 답을 볼지가 이미 정해져 있습니다. 또 마이크로소프트는 Office에 AI 비서(Copilot)를 얹어 유료 좌석 1,500만 석을 팔았습니다 (Business of Apps). 사람들이 매일 쓰는 워드와 엑셀과 팀즈 안에서, 어떤 모델이 일을 거들지가 정해져 있습니다. 셋 다 떠나는 데 값이 드는 디폴트 지위이고, ChatGPT 사용자 수 같은 규모 지표와는 다릅니다.

유통 길목을 차별화하는 한 요소가 독점 데이터입니다. 모델이 부품이 됐어도, 남이 못 가진 데이터로 학습하면 같은 부품을 조금 다르게 만들 수 있습니다. 실제로 AI 학습용 데이터 라이선스 계약은 공개된 것만 2026년까지 약 91건 누적됐고, 한 모델 회사는 커뮤니티 데이터(Reddit) 한 곳에만 연 약 $70M(약 7천만 달러)을 냅니다 (CB Insights). 단 이건 별도 축이라기보다, 누가 그 데이터로 더 나은 유통과 응용을 만드느냐의 문제입니다. 데이터 자체보다 그 데이터를 어디에 박느냐가 곡괭이를 정합니다. 그래서 이 글은 독점 데이터를 위(유통)와 옆(응용)을 차별화하는 요소로 그 안에서 다룹니다.

4.2 옆으로: 응용 수직통합 (워크플로우 통합)

곡괭이가 간 두 번째 방향은 모델 옆, 응용입니다. 모델은 부품이 됐지만, 그 부품을 특정 업무에 딱 맞게 끼워 넣어 업무 흐름 자체를 잡은 회사들이 있습니다. 11편에서 본격적으로 다룰 "옆으로 간 곡괭이"의 미리보기입니다.

첫 번째 증거는 코딩입니다. Cursor라는 AI 코딩 도구는 1년여 만에 연간 반복 매출(ARR)이 $20억에 이르렀습니다 (GetPanto). 여기서 ARR이라는 용어가 나옵니다. ARR(연간 반복 매출, Annual Recurring Revenue)이란 구독처럼 매년 반복해서 들어오는 매출을 연 단위로 환산한 값입니다. Cursor는 모델을 직접 만들지 않습니다. 남의 모델을 가져다 개발자의 코딩 흐름에 딱 맞게 끼워 넣어 그 자리를 잡았습니다.

두 번째 증거가 락인을 더 또렷이 보여 줍니다. 의료 기록 받아쓰기 AI인 Abridge입니다. 여기서 EHR이라는 용어가 나옵니다. EHR(전자의무기록, Electronic Health Record)이란 병원이 환자 진료 내용을 전부 저장하고 다루는 핵심 시스템입니다. Abridge는 미국 병원이 가장 많이 쓰는 EHR(Epic) 안에 깊이 통합돼, Kaiser Permanente의 의사 약 2만 5천 명을 포함해 90개 이상의 헬스시스템에 들어갔습니다 (Sacra, FierceHealthcare). 이게 워크플로우 통합입니다. 의사의 진료 흐름과 병원 기록 시스템 안에 박혀서, 빼내려면 일하는 방식 전체를 다시 짜야 합니다. 모델은 갈아 끼워도 이 자리는 안 흔들립니다.

단 이 두 증거를 같은 강도로 묶으면 안 됩니다. 워크플로우 통합의 단단함이 둘은 크게 다릅니다. 의료(Abridge)는 진짜 단단합니다. 병원 기록 시스템(Epic) 안에 박히고 의료 규제를 통과하면, 다른 도구로 바꾸는 데 막대한 값이 듭니다. 반면 코딩(Cursor)은 의외로 헐겁습니다. 개발자들은 코딩 도구를 한 개만 쓰지 않고 여러 개(Cursor, Claude Code, Windsurf)를 같은 작업 폴더에서 동시에 번갈아 씁니다. 도구들이 디스크의 같은 파일을 편집하기 때문에, 오히려 갈아타는 비용이 낮습니다 (실사용 비교). 이건 3장에서 본 "모델은 한 줄 코드로 교체"와 같은 결입니다. 즉 코딩 응용의 락인은 약하고, 의료 응용의 락인은 강합니다. 같은 "응용 수직통합"이라도 코딩과 의료는 강도가 다릅니다.

핵심은 이것입니다. 응용 회사들은 대부분 모델을 직접 만들지 않습니다. 녹아내리는 부품(모델)을 가져다, 안 녹는 자리(업무 흐름)에 박습니다. 곡괭이가 모델에서 응용으로 옆으로 간 것입니다. 단 그 자리가 얼마나 안 녹는지는 업무마다 다릅니다(의료는 강, 코딩은 약).

단 정직하게 둘 것이 있습니다. 이 구분이 점점 흐려지고 있습니다. 두 방향에서 그렇습니다. 한쪽에서는 응용 회사가 모델까지 직접 만들기 시작했습니다. Cursor는 자체 코딩 모델(Composer)을 만들어, 코딩 작업에서 최상급 외부 모델보다 태스크당 10배에서 60배 싸게 돌립니다 (Cursor). 모델 공급사가 가격이나 토큰 계산 방식을 바꾸면 응용의 마진이 직접 흔들리는 종속을 끊으려는 움직임입니다. 반대쪽에서는 모델 랩이 응용으로 내려옵니다. 여기서 모델 랩이라는 말을 씁니다. 모델 랩(model lab)이란 프론티어 모델을 직접 만드는 회사로, OpenAI나 Anthropic 같은 곳입니다. 한 모델 랩(Anthropic)은 코딩 응용(Claude Code)으로 직접 그 시장에 진입했고, 이는 Cursor 같은 응용 회사와 정면으로 경쟁합니다 (Sacra). 즉 위(모델)와 옆(응용)의 경계가 양쪽에서 흐려지고 있습니다. 응용의 워크플로우 통합이 곡괭이라는 핵심은 유지되지만, 그 곡괭이가 모델 랩 자신에게 침범당할 수 있다는 긴장이 함께 있습니다. 이 긴장이 11편 「응용」의 출발점입니다.

여기서 3장의 한 가지 예외를 짚습니다. 3장에서 모델은 한 줄 코드로 갈아 끼우는 부품이라고 했는데, 응용 안에는 그렇지 않은 부분이 있습니다. 하네스입니다. 하네스(harness)란 모델을 실제 업무 도구로 감싸는 장치로, 도구 연결과 기억과 권한과 작업 순서 같은 것을 묶은 껍데기입니다. 같은 모델이라도 하네스를 잘 짜면 성능이 크게 달라집니다. 한 실험에서는 모델은 그대로 두고 하네스만 바꿔 어려운 작업 성공률이 약 13퍼센트포인트 올랐습니다 (UncoverAlpha). 게다가 모델은 특정 하네스에 맞춰 사후 학습(post-train)되기도 합니다. 여기서 사후 학습이라는 용어가 나옵니다. 사후 학습이란 모델을 다 만든 뒤 특정 사용 방식에 맞춰 추가로 길들이는 과정입니다. 모델이 한 하네스에 길들여지면, 낯선 하네스로 옮길 때 실수가 늘어 교체가 비싸집니다. 즉 하네스는 3장 "한 줄 교체"의 예외이고, 모델과 하네스를 둘 다 가진 곳(모델 랩)에 락인을 만듭니다. 단 이 글은 하네스를 별도 축으로 키우지 않고 옆(응용)의 하위로 봅니다. 그 단단함의 본격 측정은 11편 「응용」으로 넘깁니다.

4.3 밑으로: 자본과 스케일 (프론티어 재생산)

곡괭이가 간 세 번째 방향은 모델 밑, 자본입니다. 2장에서 봤듯 모델을 만드는 데 매년 더 큰 돈이 듭니다. 그 돈을 댈 수 있는 곳은 극소수의 거대 자본입니다.

그 거대 자본의 규모를 봅니다. 클라우드 거인 4사(Amazon·Google·Meta·Microsoft)가 2026년 한 해 시설에 쏟는 설비투자(CapEx)는 합쳐서 약 $6,050억(약 6,050억 달러)에 이릅니다 (Statista). 모델을 만들고 돌리는 데 필요한 데이터센터와 칩을 살 돈입니다. 프론티어 모델 회사들도 이 자본에 의존합니다. 한 모델 회사는 한 클라우드 거인과 10년간 컴퓨트를 쓰기로 약정하고 최대 5기가와트(원전 여러 기 분량)의 계산 용량을 확보했습니다 (Anthropic).

그리고 8편에서 본 컴퓨트의 곡괭이가 여기서 다시 교차합니다. 모델을 학습하고 돌리는 칩의 길목은 여전히 엔비디아가 쥐고 있습니다. 엔비디아의 데이터센터 부문 연매출은 약 $1,973억(약 1,973억 달러)에 이릅니다 (Futurum). 2장에서 본 "단가는 녹어도 사용량 폭증으로 총지출은 안 준다"는 단서가 여기로 흘러옵니다. 모델이 흔해질수록 더 많이 돌아가고, 더 많이 돌아갈수록 그 밑의 컴퓨트와 자본은 더 많이 필요해집니다. 곡괭이가 모델 밑으로도 이동하는 것입니다. 단 컴퓨트 계층의 곡괭이는 8편에서 정밀하게 다뤘고, 거기서 단일 GPU 독점이 흔들리는 변곡점도 함께 봤습니다. 추론만 전문으로 빠르게 돌리는 새 칩들, 예를 들어 Groq나 Cerebras 같은 회사도 이 밑단에서 떠오르는데, 이 추론 전용 칩 이야기도 컴퓨트를 다룬 8편의 영역입니다. 이 장은 그 교차만 짚습니다.

곡괭이는 어디로 갔나: 모델(중앙)에서 위·옆·밑으로 흩어진다단 세 자리의 주인은 같은 소수 빅테크로 수렴 (4.5)위: 유통 채널 (디폴트 지위) 🔒Apple $10억/년 · 검색 50% · Office 1,500만 좌석모델 (녹는다)범용화 · 자물쇠 부재옆: 응용 통합 🔒Cursor ARR $20억Abridge Epic EHR 90개+밑: 자본 · 스케일하이퍼스케일러 capex 약 $6,050억 · NVDA $1,973억이동은 확정. 단 위·옆 자물쇠가 얼마나 단단한지는 미정(5장에서 발굴, 검증은 종목 분석)흩어지지만 주인은 겹친다: 분산이 아니라 집중

출처: 본문 4장. 화살표는 해자 이동 방향(확정). 자물쇠는 디폴트 지위·워크플로우 통합(락인 증거). MAU 등 규모 지표는 락인 증거가 아니므로 제외. 개념적 시각화.

4.4 이동은 확정, 단단함은 미정

여기까지가 분명합니다. 곡괭이는 모델을 떠나 위(유통)와 옆(응용)과 밑(자본)으로 이동했습니다. Apple이 돈을 내고 채택한 디폴트 지위, Epic EHR 안에 박힌 응용, 수십조 원 규모의 자본은 데이터로 확인되는 도착지입니다. 이 편의 핵심 논제는 여기까지입니다.

다만 그 도착지의 자물쇠가 얼마나 단단할지는 아직 미정입니다. 단 미정이란 "약하다"가 아니라 "양쪽으로 열려 있다"는 뜻입니다. 두 가지를 양방향으로 봅니다. 첫째, 유통의 디폴트 지위는 계약입니다. Apple이 다른 모델로 갈아탈 수 있고 검색의 기본 모델도 바뀔 수 있어, 약해 보이기도 합니다. 그런데 반대 증거가 의외로 강합니다. 2025년 9월 미국 검색 반독점 판결(Mehta 판사)은 구글의 배타적 계약만 금지했을 뿐, 디폴트 자리에 돈을 지불하는 행위 자체는 합법으로 재확인했습니다. 그 결과 구글이 자기 검색을 Apple 기기의 기본으로 두는 대가로 내는 연간 약 $200억(약 200억 달러)의 디폴트 지불은 그대로 살아남았습니다 (AppleInsider). 즉 최대 규모 반독점 사건조차 디폴트 지불 구조를 깨지 못했습니다. 디폴트는 생각보다 단단할 수 있습니다. 여기서 수치 하나를 구분합니다. 이 $200억은 구글이 Apple에 내는 검색 디폴트 지불이고, 4.1에서 본 Apple이 구글에 내는 연 $10억은 Apple이 자기 AI 기반을 구글 모델 위에 짓는 대가입니다. 방향도 항목도 다른 별개 계약이니 혼동하지 않습니다.

둘째, 응용의 워크플로우 통합은 더 단단해 보이지만, 모델 랩이 직접 응용으로 내려와(4.2) 그 자리를 침범할 수 있습니다. 정리하면 이동은 확정이고, 그 새 자리의 단단함은 약함 일변도가 아니라 양방향으로 열려 있으며, 그 영속성은 종목 하나하나를 깊이 따져야 압니다. 이 분리가 5장 발굴의 전제입니다.

4.5 흩어지지만, 같은 소수에게로 수렴한다

한 가지를 분명히 해 둬야 독자가 헷갈리지 않습니다. 곡괭이는 위·옆·밑 세 방향으로 흩어지지만, 그 세 자리의 주인은 같은 소수 빅테크로 수렴하는 중력이 있습니다. 그래서 5장에서 발굴할 곡괭이 상위가 전부 같은 빅테크인 것은 모순이 아니라, 이 수렴의 증거입니다.

왜 수렴할까요. 세 방향의 주인이 겹치기 때문입니다. 위(유통)를 쥔 것도 구글·마이크로소프트·아마존이고, 밑(자본)을 쥔 것도 같은 빅테크(여기에 엔비디아)입니다. 옆(응용)에서 전진통합한 모델 랩(OpenAI·Anthropic)조차, 그 모델을 돌릴 컴퓨트와 자본을 그 빅테크에 의존합니다. 한 모델 랩은 한 클라우드 거인과 10년 컴퓨트를 약정했고, 빅테크들은 그 모델 랩 지분에서 회계상 평가이익을 거둡니다. 한 분기에 알파벳이 약 $368억, 아마존이 약 $168억, 마이크로소프트가 9개월간 약 $59억의 비현금 평가이익을 같은 소수 랩의 가치 상승에서 잡았습니다 (om.co). 여기서 비현금 평가이익이라는 용어가 나옵니다. 비현금 평가이익이란 실제로 현금이 들어온 게 아니라, 보유한 지분의 장부 가치가 올라 회계상으로만 잡히는 이익입니다.

게다가 그 결합은 협상으로 쉽게 풀 수 없는 기술적 포획입니다. 모델의 학습 파이프라인과 배포 구조가 특정 빅테크의 하드웨어와 함께 설계되면, 이탈 비용이 막대해져 사실상 되돌리기 어렵습니다 (Lexology). 여기서 포획이라는 표현을 씁니다. 포획이란 한쪽이 다른 쪽의 인프라에 깊이 얽혀 떠나려 해도 떠나기 어려운 종속 상태입니다.

그래서 모델 계층의 투자 함의는 "분산"이 아니라 "집중"입니다. 곡괭이가 세 방향으로 흩어진다는 본문의 그림은 도착지의 형태를 말한 것이고, 그 도착지의 소유권은 같은 소수에게로 모입니다. 단 이 집중은 강함이자 동시에 리스크입니다. 같은 소수에게 돈이 원형으로 도는 구조라, 한 곳이 약정을 줄이면 연쇄로 흔들릴 수 있습니다. 결론의 반증조건 3번에서 다룹니다. 또한 이 수렴이 곧 "그 주식이 싸다"를 뜻하지 않습니다. 5장의 3중 분리를 그대로 적용합니다.

투자자에게 4장이 말하는 것은 이렇습니다. 8편에서 곡괭이가 칩에서 시스템으로, 9편에서 땅에서 도구로 옆걸음했다면, 10편에서는 모델이 녹으면서 곡괭이가 위(유통)와 옆(응용)과 밑(자본)으로 흩어집니다. 이동은 데이터로 확정됩니다. 단 그 흩어진 세 자리의 주인은 같은 소수 빅테크로 수렴하므로, 투자 함의는 분산이 아니라 집중입니다. 그 새 자리의 자물쇠가 단단한지는 양방향으로 열려 있고, 검증이 종목 분석의 일입니다.

4장 결론: 곡괭이는 녹는 모델을 떠나 위(유통)·옆(응용)·밑(자본)으로 이동했다. 이동은 확정, 단단함은 미정.

  • 위(유통, 디폴트 지위는 락인 증거): Apple이 Gemini 기반에 연 $10억 지불·구글 검색 AI Overviews 미국 쿼리 50%·Office Copilot 유료 1,500만 좌석. 단 ChatGPT MAU 10억 같은 규모 지표는 락인 증거가 아니므로 분리.
  • 옆(응용, 워크플로우 통합은 락인 증거): Cursor ARR $20억·Abridge가 Epic EHR에 박혀 90개+ 헬스시스템(Kaiser 의사 2.5만). 응용은 모델을 안 만들고 안 녹는 자리(업무 흐름)에 박는다. 11편 본론 예고.
  • 밑(자본): 하이퍼스케일러 4사 capex 약 $6,050억·NVDA 데이터센터 $1,973억. 단가는 녹어도 사용량 폭증으로 컴퓨트·자본 수요는 커진다(2장 단서 연결, 8편 교차).
  • 세 축 안에서 다룬 것: 독점 데이터(Reddit $70M/년·라이선싱 91건)는 위(유통)·옆(응용)을 차별화하는 요소로, 추론 전용 칩(Groq·Cerebras)은 8편 컴퓨트와 교차로, 하네스(모델 감싸는 장치, 성능 +13%p·사후학습 락인)는 옆(응용) 안에서 다뤘다. 위·옆 경계는 흐려지는 중(Cursor 자체모델·모델 랩 응용 진입).
  • 분리: 이동(확정)과 그 자물쇠가 단단할지(미정, 단 양방향)를 분리. 디폴트 지위는 약해 보이나 2025.09 검색 반독점 판결조차 디폴트 지불($200억 구글에서 Apple로 가는 검색 지불)을 합법으로 재확인해 의외로 단단할 수 있다(이는 4.1의 Apple에서 구글로 가는 AI 기반 연 $10억과 별개 계약). 검증은 종목 분석의 몫(5장).
  • 흩어짐 vs 수렴: 곡괭이는 세 방향으로 흩어지지만 그 세 자리의 주인은 같은 소수 빅테크로 수렴(위=빅테크, 밑=빅테크+NVDA, 옆 모델 랩도 컴퓨트·지분으로 빅테크에 기술적 포획). 빅테크가 모델 랩 지분 평가이익을 booking(Alphabet $368억·Amazon $168억·MS 9개월 $59억). 그래서 투자 함의는 분산이 아니라 집중. 단 집중은 강함이자 순환 리스크(반증조건 3번).

5. 곡괭이를 쥔 자들 (발굴)

1장부터 4장까지, 우리는 모델이 녹고 곡괭이가 위와 옆과 밑으로 이동하는 것을 봤습니다. 이제 그 곡괭이를 누가 쥐었는지 데이터로 발굴합니다. 단 발굴 전에 세 가지를 못 박고(5.1), 네 갈래로 곡괭이를 발굴한 뒤(5.2), 가장 중요한 분리를 다시 새깁니다(5.3).

5.1 발굴 전 못 박을 것

발굴 전에 세 가지를 못 박습니다. 8편과 9편이 우리에게 남긴 규율입니다.

첫째, 발굴은 모델 자체가 아니라 그 주변을 봅니다. 모델은 녹는 부품이므로, 프론티어 모델만 가진 회사는 곡괭이로 약합니다. 강한 곡괭이는 유통이나 자본이나 응용의 길목을 함께 쥔 곳입니다.

둘째, 강도는 곡괭이(길목 장악력)의 강도이지 투자 매력도가 아닙니다. 단단한 곡괭이라고 주식이 싸지 않습니다.

셋째, 비상장 회사(OpenAI·Anthropic·Cursor·Abridge 등)는 길목과 노출 경로로만 이야기합니다. 사거나 팔 수 있는 주식이 아니고, 이 글은 종목 추천이 아닙니다.

5.2 발굴 결과 (네 갈래)

먼저 A갈래, 위(유통)와 밑(자본)을 함께 쥔 빅테크입니다. 가장 단단한 곡괭이는 모델 위(유통)와 밑(자본)을 함께 쥔 곳입니다.

마이크로소프트는 업무 소프트웨어라는 유통 길목(Office·Teams·GitHub에 박힌 Copilot 유료 1,500만 좌석)과, 모델을 돌릴 자본(클라우드와 OpenAI 지분)을 함께 쥡니다. 모델이 녹어도, 업무 흐름 안에 박힌 비서 자리는 안 녹습니다.

구글(알파벳)은 검색이라는 거대한 유통 길목(AI Overviews 미국 쿼리 50%)과 자체 모델(Gemini)과 자체 칩(TPU)과 거대 자본을 함께 쥡니다. Apple조차 구글 모델 위에 자기 AI를 짓고 돈을 냅니다. 단 검색 자체가 AI에 잠식당하는 역설(자기 잠식)을 안습니다.

아마존은 모델을 돌리는 자본(클라우드 1위)과 자체 칩(Trainium)을 쥐고, 프론티어 모델 회사(Anthropic)에 거대 투자로 묶입니다. 단 자체 소비자 모델 채널은 약합니다.

메타는 오픈 모델(Llama)을 무료로 풀어 생태계를 잡고, 거대한 소셜 유통(WhatsApp·Instagram·Facebook)을 쥡니다. 단 직접적인 유료 통행료 모델은 약하고, 거대 자본을 모델에 쏟는 만큼 회수 경로가 검증 대상입니다.

다음은 B갈래, 밑(컴퓨트 길목)입니다. 모델이 녹을수록 더 많이 돌아가고, 더 많이 돌아갈수록 그 밑의 칩이 더 필요합니다. 그 칩의 길목을 엔비디아가 쥡니다(데이터센터 연매출 $1,973억). 단 8편에서 본 대로 이 단일 GPU 독점은 자체 칩(TPU·Trainium)과 추론 전용 칩의 추격으로 흔들리는 변곡점에 있습니다. 컴퓨트 곡괭이의 정밀 분석은 8편의 몫입니다.

다음은 C갈래, 옆(응용 수직통합)입니다. 모델 옆에서 업무 흐름을 잡은 응용입니다. 코딩의 Cursor(ARR $20억), 의료 받아쓰기의 Abridge(Epic EHR 통합·90개+ 헬스시스템)가 대표입니다. 둘 다 비상장이라 길목으로만 짚습니다. 이 갈래의 본격 발굴은 11편의 주제입니다. 모델을 빌려다 안 녹는 자리(업무 흐름)에 박는 회사들이, 곡괭이가 옆으로 간 자리입니다.

단 이 갈래는 두 가지 긴장을 안습니다. 하나는 Cursor가 자체 코딩 모델(Composer)까지 만들며 응용과 모델의 경계를 스스로 넘는 것이고, 다른 하나는 모델 랩(Anthropic의 Claude Code)이 같은 응용으로 내려와 직접 경쟁하는 것입니다. 응용의 워크플로우 통합이 진짜 자물쇠인지, 아니면 모델 랩에게 먹히는 자리인지가 이 갈래의 핵심 검증 포인트입니다. 11편에서 측정합니다.

마지막으로 D갈래, 모델 랩입니다. 프론티어 모델을 만드는 회사들(OpenAI·Anthropic·Google)입니다. 여기서 한 가지를 정확히 나눠야 합니다. 원시 모델 자체(API로 빌려주는 두뇌)는 녹어서 약한 곡괭이입니다. 그러나 그것을 응용과 유통으로 전진통합한 모델 랩은 오히려 강해집니다. 여기서 전진통합이라는 용어가 나옵니다. 전진통합(forward integration)이란 원재료를 파는 회사가 그 원재료로 만든 완제품까지 직접 파는 것으로, 모델 회사가 모델뿐 아니라 그 모델을 쓴 응용 제품(코딩 도구·업무 비서)까지 직접 파는 것을 말합니다.

먼저 원시 모델이 약하다는 증거입니다. 엔터프라이즈 API 기준 점유율은 크게 출렁였습니다. OpenAI는 한때 50%에서 27%로 내렸고, Anthropic은 12%에서 40%로 올랐습니다 (Menlo Ventures). 한자리에 머무는 길목이 아니라 매 세대 순위가 바뀌는 자리입니다.

그런데 같은 시기, 모델 랩의 수익성은 정반대로 움직였습니다. 먼저 용어 하나를 둡니다. 이익률(그로스마진)이란 매출에서 그 매출을 내는 데 직접 든 원가(여기선 추론 컴퓨트 비용)를 뺀 이익의 비율입니다. 한 모델 랩(Anthropic)의 추론 이익률(그로스마진)은 1년 만에 38%에서 70%로 뛰었고, 연환산 매출(ARR)은 $9B에서 $44B 이상으로 폭증했습니다 (SemiAnalysis, Sacra). 1장에서 단가가 1,000분의 1로 녹는다고 했는데, 어떻게 파는 회사의 마진과 매출이 동시에 커질까요. 두 가지 이유입니다. 하나는 가격결정력입니다. 추론 원가가 가격보다 더 빨리 떨어지는데도 인하분을 고객에게 다 넘기지 않아, 그 차이가 마진으로 남습니다. 최전선 모델은 수요가 가격에 잘 안 줄어서(2장의 프리미엄 재생성) 능력 대비 비싸게 유지됩니다. 다른 하나가 핵심입니다. 모델 랩이 응용과 유통으로 전진통합해 그 자리에서 가치를 흡수합니다.

이 사실을 정직하게 둡니다. "모델은 약하다"의 표면적 반례처럼 보입니다. 그러나 자세히 보면 우리 논제의 또 다른 증거입니다. 모델 랩이 매출과 마진을 키우는 방식이 바로 응용과 유통으로의 전진통합이기 때문입니다. 예를 들어 한 모델 랩의 코딩 응용 제품(Claude Code)은 출시 반년여 만에 연환산 매출이 $1B에서 $2.5B로 뛰었고, 그 매출의 절반 이상이 대기업(Netflix·Spotify·KPMG 등)에서 나옵니다 (Sacra). 즉 랩이 버는 돈은 점점 원시 모델 API가 아니라, 그 모델을 박아 넣은 응용에서 나옵니다. 정확히 말하면 이렇습니다. 원시 모델은 녹지만, 그것을 옆(응용)과 위(유통)로 전진통합한 랩은 살아남습니다. 이건 "해자는 옆과 위로 이동한다"는 이 글의 논제와 정확히 같은 방향입니다.

단 그 숫자는 가려 들어야 합니다. 방향은 강하지만, 숫자는 과신하지 않습니다. 두 가지만 짚습니다. 하나, 이 ARR은 실제로 받은 돈이 아니라 어느 시점의 매출에 12를 곱한 연율화 수치(run-rate)입니다. 여기서 연율화라는 용어가 나옵니다. 연율화(run-rate)란 한 달이나 한 분기 매출을 1년치로 단순 환산한 값으로, 성장이 빠르면 실수금보다 부풀려 보입니다. 둘, 마진 70%의 상당 부분은 일시적인 컴퓨트 할인에 기댄 것일 수 있어, 할인이 끝나면 되돌아올 수 있습니다. 그래서 방향(전진통합으로 가치를 흡수한다)은 분명하되, 정확한 마진과 매출은 시간이 지나야 검증됩니다.

💡 모델 랩의 마진·매출 숫자를 읽는 법

그로스 회계: 클라우드를 통해 되파는 매출을 총액으로 잡으면 외형(top-line)이 커 보인다. 순액으로 잡는 곳과 단순 비교하면 안 된다.

추론비용: 한 분석은 추론비용이 예상보다 약 23% 높았다고 지적했다. 마진 70%가 구조적 개선인지 일시적 비용 억제인지 구분이 필요하다.

결론: 매체별로 연환산 매출이 $30B에서 $45B까지 갈리는 것도 시점·정의 차다. 방향(가치 흡수)은 보되, 정밀 수치는 실수금·할인 종료 후로 검증한다. (출처: SemiAnalysis·Sacra·Sherwood·The Information)

그래서 모델 랩의 강도는 두 갈래로 갈립니다. 원시 모델만 본 강도는 약하고, 전진통합(응용·유통·자본 결합)을 감안한 강도는 중강입니다. OpenAI는 ChatGPT라는 거대 유통 채널과 마이크로소프트 결합을, Anthropic은 Claude Code 응용과 Amazon·Google 자본 결합을 쥡니다. OpenAI와 Anthropic은 비상장이라 길목으로만 짚습니다. 종목 추천이 아닙니다. 위 마진과 ARR 수치는 SemiAnalysis·Sacra·VentureBeat·The Information·Sherwood 교차 출처이며, 시점·정의 차로 $30B에서 $45B 편차가 있고 그로스 회계·연율화·일시 컴퓨트 할인이 섞여 있어 정밀 수치는 검증 대상입니다.

이제 네 갈래에서 발굴한 곡괭이의 강도를 한 장에 모읍니다. 막대 길이는 곡괭이(길목 장악력)의 강도를 4구간으로 나눈 시각 표현이지, 정밀한 점수나 투자 매력도가 아닙니다.

모델 계층 곡괭이 강도 (4구간 정성 분류, 정밀 순위·측정값 아님)
최강
Alphabet: 검색·OS 유통 + 자체칩 + 자본
최강
Microsoft: 업무SW 디폴트 유통 + 자본 + OpenAI
NVIDIA: 학습·추론 컴퓨트 길목 (8편 변곡점 동반)
Amazon: 클라우드 자본 + 자체칩 + Anthropic
중강
OpenAI (비상장): ChatGPT 유통 + 응용 전진통합
중강
Anthropic (비상장): Claude Code 응용 전진통합 + 자본
중강
Meta: 오픈모델 생태계 + 소셜 유통
중강
Abridge (비상장): 의료 EHR 워크플로우, 전환비용 높음
Cursor (비상장): 코딩 워크플로우, 멀티툴 병용으로 락인 약함
원시 모델 자체만: API 두뇌, 녹는 부품

출처: 강도는 유통 장악과 자본 규모와 자체칩과 락인 증거(디폴트 지위·워크플로우 통합)를 정성 종합한 상대적 강도의 4구간 분류(최강/강/중강/중/약)이며, 절대 측정값이나 정밀 순위가 아니다. 투자 매력도도 아니다. 막대 길이는 구간을 보이기 위한 시각 표현일 뿐 점수가 아니다. Menlo·SemiAnalysis·Sacra·각사 IR 등. 비상장 다수 포함(종목 추천 아님).

5.3 핵심 분리: 곡괭이를 쥔 것 ≠ 주식이 싼 것 ≠ 영속적 곡괭이

발굴 결과를 보면 "이 회사들을 사면 되겠다"로 건너뛰고 싶어집니다. 그것이 이 시리즈가 매번 경계하는 함정입니다. 세 겹으로 분리합니다.

첫째, 곡괭이를 쥔 것과 주식이 싼 것은 다릅니다. 4편에서 본 시스코의 교훈입니다. 인터넷 골드러시의 곡괭이를 제대로 쥐었어도, 비싸게 사면 오래 잃습니다. AI 붐으로 발굴된 이 곡괭이들의 주가는 이미 크게 올라 있을 가능성이 높습니다. 가격이 합리적인지는 P/E 같은 잣대로 따로 따져야 합니다.

둘째, 가장 단단한 곡괭이가 가장 안전한 주식인 것도 아닙니다. 자본 길목을 쥔 빅테크는 모델에 쏟는 설비투자가 막대해, 그 회수 경로가 검증 대상입니다. 응용 회사들은 빠르게 컸지만 비상장이라 살 수도 없고 가치도 검증되지 않았습니다.

셋째, 지금 쥔 곡괭이가 영원히 그 자리인 것도 아닙니다. 이 글의 논제 자체가 "해자는 이동한다"였습니다. 모델에서 유통과 응용으로 옮겨갔듯, 그 유통과 응용의 곡괭이도 또 옮겨갈 수 있습니다. 결론에서 그 반증 조건을 명시합니다.

⚠️ 곡괭이를 쥔 것 ≠ 주식이 싼 것 ≠ 영속적 곡괭이

이 글은 종목 추천이 아닙니다. "누가 곡괭이를 쥐었나"(분석 결과)만 답하고, "그 값이 합리적인가"는 답하지 않습니다.

시스코의 교훈(4편): 곡괭이를 제대로 골랐어도 비싸게 사면 오래 잃는다. AI 붐으로 발굴된 곡괭이들의 주가는 이미 크게 올랐을 가능성이 높다.

가장 단단한 곡괭이 ≠ 가장 안전한 주식: 자본 길목 빅테크는 막대한 설비투자 회수가 검증 대상이고, 응용 강자(Cursor·Abridge)는 비상장이라 살 수도 가치 검증도 안 된다.

곡괭이 ≠ 영속적 곡괭이: 모델의 곡괭이가 유통·응용으로 옮겨갔듯, 그 유통·응용도 또 옮겨갈 수 있다. 가격·리스크·영속성 검증은 종목 분석의 몫이다.

투자자에게 5장이 말하는 것은 이렇습니다. 모델 계층의 곡괭이는 모델 자체가 아니라, 위(유통)와 옆(응용)과 밑(자본)을 쥔 곳들이고, 그 세 자리는 같은 소수 빅테크로 수렴합니다. 가장 강한 건 유통과 자본을 함께 쥔 빅테크와 컴퓨트 길목, 그다음이 업무 흐름을 잡은 비상장 응용(의료가 코딩보다 단단)이며, 원시 모델만 가진 곳은 가장 약합니다. 강도는 정성 분류이지 측정값이 아니며, 발굴은 출발점이고 가격·리스크·영속성 검증이 종목 분석의 일입니다.

5장 결론: 곡괭이는 모델이 아니라 그 위·옆·밑을 쥔 곳에 있다. 단 쥔 것 ≠ 싼 것 ≠ 영속적 곡괭이.

  • A(위+밑, 빅테크): Microsoft(업무SW 유통+자본)·Alphabet(검색 유통+자체칩+자본)·Amazon(클라우드 자본+Trainium)·Meta(오픈모델+소셜 유통).
  • B(밑, 컴퓨트 길목): NVIDIA. 모델이 흔해질수록 더 돌아가 칩 수요↑. 단 8편의 변곡점(자체칩 추격) 동반.
  • C(옆, 응용 수직통합·비상장, 코딩≠의료): Abridge(의료 EHR 90개+)는 전환비용 높아 중강, Cursor(코딩 ARR $20억)는 멀티툴 병용으로 락인 약해 중. 둘 다 모델 랩 응용 진입·빅테크 번들 압살(Teams→Slack 선례) 위협. 11편 본론.
  • D(모델 랩, 이원화): 원시 모델 자체는 약(범용화·엔터프라이즈 API 점유율 출렁임 OpenAI 50→27%·Anthropic 12→40%). 그러나 응용·유통으로 전진통합한 모델 랩은 강해진다(Anthropic 추론 그로스마진 38→70%·ARR $9B→$44B+·Claude Code ARR $1B→$2.5B). 이 마진·매출 폭증은 "모델은 약하다"의 반례가 아니라, 랩이 옆(응용)·위(유통)로 가치를 흡수한다는 우리 논제의 강화 사례다. 단 그 정량(마진 70%·ARR $44B)은 그로스 회계·연율화(run-rate)·일시 컴퓨트 할인이 섞여 실수금·할인 종료 후로 검증해야 한다. 방향은 강함, 숫자는 과신 금지.
  • 수렴: 발굴 상위가 전부 같은 빅테크인 것은 모순이 아니라 4.5의 수렴(세 자리가 같은 소수에게로 모임)의 증거. 투자 함의는 분산이 아니라 집중.
  • 강도 분류는 정성 종합(최강/강/중강/중/약)이지 절대 측정값·정밀 순위가 아니다.
  • 3중 분리: ① 쥔 것 ≠ 싼 것(시스코) ② 단단함 ≠ 안전(빅테크 capex 회수·비상장 검증) ③ 곡괭이 ≠ 영속(이동은 또 일어난다). 가격·리스크·영속성은 종목 분석에서.

결론: 모델은 녹지만 곡괭이는 위·옆으로 간다

프롤로그에서 우리는 한 줄 논제를 박았습니다. 같은 성능을 내는 비용이 해마다 10배씩 떨어진다고요. 이제 그 여정을 다 봤습니다. 모델값은 같은 성능 기준 연 10배, 3년에 1,000배로 녹습니다(1장). 어제의 최전선이 오늘 거의 공짜가 되고, DeepSeek 충격은 시장 전체가 그 사실을 한순간에 깨달은 날이었습니다.

그런데 쓰는 값이 녹는 것과 정반대로, 만드는 값은 오릅니다(2장). 최종 학습 비용이 매년 2.4배에서 3.5배로 불어 2027년엔 모델 하나에 10억 달러를 넘길 전망이고, 그 입장권을 살 수 있는 극소수의 랩들은 한 해에 수십조 원을 조달합니다. 게다가 최전선 프리미엄은 한자리에 머물지 않고 매 세대 다시 생깁니다. 오픈이 한때 4포인트까지 따라잡았지만, 격차는 다시 25에서 55포인트로 벌어졌습니다.

그렇다면 모델에 자물쇠가 걸릴까요. 잘 안 걸립니다(3장). 기업은 평균 4.7개 모델을 동시에 갈아 끼우고, 추상화 레이어가 그 교체를 한 줄짜리 코드로 만들었습니다. 점착이 없는 건 아니지만, 그 점착은 모델의 두뇌가 아니라 그 위의 인증과 업무 흐름에 붙습니다. 세입자가 모델을 안 가립니다. 모델은 교체 가능한 부품이 됐습니다.

그래서 곡괭이는 모델을 떠났습니다(4장). 이것이 이 편의 한 줄 논제입니다. 모델은 곡괭이가 아닙니다. 해자는 모델 위의 유통과 옆의 응용으로 이동합니다. 위로는 유통 채널(Apple이 돈 내고 채택한 디폴트 지위, 검색의 절반, 업무 소프트웨어 안의 비서 자리)로, 옆으로는 응용 수직통합(코딩의 Cursor, 의료 기록의 Abridge가 Epic 시스템 안에 박힌 자리)으로, 밑으로는 자본과 컴퓨트(하이퍼스케일러 6,050억 달러 capex, 엔비디아의 칩 길목)로요. 8편에서 곡괭이가 칩에서 시스템으로, 9편에서 땅에서 도구로 옆걸음했다면, 10편에서는 모델이 녹으면서 곡괭이가 위와 옆과 밑으로 흩어졌습니다. 단 정직하게 둡니다. 이동은 데이터로 확정되지만, 그 새 자리의 자물쇠가 단단한지는 미정입니다. 디폴트 지위도 계약이라 바뀔 수 있고, 응용도 복제될 수 있습니다.

마지막으로 그 곡괭이를 쥔 자들을 발굴했습니다(5장). 유통과 자본을 함께 쥔 빅테크, 컴퓨트 길목, 업무 흐름을 잡은 비상장 응용, 그리고 모델 랩입니다. 모델 랩은 한 가지를 정확히 나눠야 합니다. 원시 모델 자체는 녹어서 약하지만, 그것을 응용과 유통으로 전진통합한 랩은 오히려 강해집니다. 단가가 1,000분의 1로 녹는 와중에도 한 모델 랩의 마진이 38%에서 70%로, 매출이 다섯 배로 뛴 것이 그 증거입니다. 이건 "모델은 약하다"의 반례가 아니라, 가치가 옆과 위로 옮겨간다는 이 글 논제의 또 다른 증거입니다. 단 5편부터 9편까지와 똑같은 경고가 따라옵니다. 누가 곡괭이를 쥐었는지는 이 글이 답했지만, 그 값이 합리적인지(4편 시스코의 교훈)와 그 리스크와 영속성이 어떤지는 기업 하나하나를 깊이 따져야 압니다.

곡괭이 (길목)강도곡괭이를 쥔 기업균열 · 위협
── A. 위(유통) + 밑(자본)을 함께 쥔 빅테크 (세 자리가 여기로 수렴) ──
검색·OS 유통 + 자체칩 + 자본최강Alphabet (Google)검색이 AI에 자기 잠식되는 역설
업무SW 디폴트 유통 + 자본 + OpenAI최강MicrosoftOpenAI 의존·번들 규제·capex 회수
학습·추론 컴퓨트 길목강 (8편 교차)NVIDIA자체칩·추론칩 추격(8편 변곡점)
클라우드 자본 + 자체칩 + AnthropicAmazon (AWS)자체 소비자 모델 채널 약함·capex 회수
오픈모델 생태계 + 소셜 유통중강Meta직접 통행료 약함·막대한 capex 회수
── C. 옆(응용 수직통합) · 비상장 (코딩≠의료, 강도 다름) ──
의료 EHR 워크플로우 통합 (전환비용 높음)중강 (비상장)Abridge비상장·단일 도메인·빅테크 번들 압살 위험
코딩 워크플로우 통합 (멀티툴 병용으로 락인 약함)중 (비상장)Cursor비상장·전환비용 낮음·모델 랩 응용 진입·빅테크 번들 압살 위험
── D. 모델 랩 (원시 모델은 약, 전진통합 시 강) · 비상장 ──
원시 모델 자체 (녹는 부품)약 (범용화)(API 두뇌 일반)점유율 출렁임·매 세대 순위 교체
모델 랩 + ChatGPT 유통 + 응용 전진통합중강 (비상장)OpenAI비상장·자본소진·하이퍼스케일러 포획·원시 모델은 녹음
모델 랩 + Claude Code 응용 전진통합 + 자본중강 (비상장)Anthropic비상장·마진(그로스·일시할인) 검증 대상·하이퍼스케일러 포획

모델 계층의 곡괭이를 쥔 기업과 그 강도. 원시 모델 자체는 녹으므로, 곡괭이는 모델 위(유통)·옆(응용)·밑(자본)을 쥔 곳, 그리고 그쪽으로 전진통합한 모델 랩에 있습니다. 단 그 세 자리의 주인은 같은 소수 빅테크로 수렴합니다(분산이 아니라 집중). 강도는 곡괭이(길목 장악력)의 강도를 정성 종합한 상대적 분류(최강/강/중강/중/약)이지 투자 매력도나 적정가가 아닙니다. 곡괭이를 쥔 것과 그 주식이 싼 것은 다릅니다. 종목 추천이 아닙니다. 비상장 기업은 사고팔 수 있는 주식이 아니며 길목으로만 표기합니다. (강도는 2026년 상반기 시점 판정이며 바뀔 수 있습니다.)

이 글이 틀렸다고 인정해야 할 신호를 정직하게 박아 둡니다. 분석은 반증 조건을 함께 적을 때만 정직합니다. 네 가지 중 하나라도 현실이 되면, 이 글의 논제는 수정되거나 보류되어야 합니다.

첫째, 모델값 하락이 멈추거나 최전선 프리미엄이 한자리에 고착되면, 1장의 "모델은 녹는다"는 전제가 약해집니다. 지금은 같은 성능당 값이 연 10배로 녹지만, 어떤 결정적 역량(예: 특정 회사만 가능한 추론 도약)이 모방 불가능해져 한 모델이 수년간 1등을 지키면, 모델 자체가 다시 곡괭이가 됩니다. 오픈-클로즈드 격차가 재확대를 넘어 영구 고정되는지를 추적합니다.

둘째, 유통의 디폴트 지위가 계약을 넘어 구조적 락인이 되면, 곡괭이의 위쪽 이동이 예상보다 단단해집니다. 실제로 2025년 9월 미국 검색 반독점 판결은 배타적 계약만 금지하고 디폴트 지불 자체(구글이 Apple에 내는 연 $200억 검색 지불)는 합법으로 재확인해, 디폴트가 규제로도 쉽게 무너지지 않음을 보였습니다 (AppleInsider). 반대로 향후 규제 강화나 경쟁으로 Apple·검색의 기본 모델 채택이 쉽게 바뀌면, 4장의 디폴트 락인이 약해집니다. 어느 쪽으로 기우는지를, 디폴트 계약 갱신과 항소심(구글은 2026년 4월 항소) 결과로 추적합니다.

셋째, 하이퍼스케일러의 설비투자(capex)가 전년 대비 역성장으로 돌아서면, 4장 밑(자본) 이동의 전제(AI에 쏟는 돈은 줄지 않는다)가 깨지고, 8편과 공유하는 대로 모든 곡괭이가 동반 약화됩니다. 곡괭이가 어디로 가느냐보다, 곡괭이를 살 돈이 있느냐가 먼저이기 때문입니다.

넷째, 응용 수직통합의 자물쇠가 위협받는 일은 미래의 가정이 아니라 이미 벌어진 현실입니다(3장에서 모델 범용화를 "이미 발화"로 격상한 것과 같은 어법입니다). 두 경로가 있습니다. 첫째, 모델 랩이 직접 응용으로 내려왔습니다. 한 모델 랩의 코딩 응용(Claude Code)이 Cursor 같은 응용 회사와 정면으로 경쟁하고, 응용 회사는 거꾸로 자체 모델(Cursor의 Composer)을 만들어 종속을 끊으려 합니다. 둘째, 더 치명적인 경로가 번들 압살입니다. 빅테크가 같은 응용을 업무 소프트웨어에 무료로 끼워 깔면, 독립 응용 강자는 산소 공급이 끊깁니다. 마이크로소프트가 Teams를 Office에 번들로 끼워 Slack을 압살한 것이 직접 선례입니다 (Medium). 여기서 번들이라는 용어가 나옵니다. 번들(bundle)이란 여러 제품을 묶어 한 값에 파는 것으로, 묶음에 끼워 넣으면 따로 파는 경쟁자(standalone)는 가격과 영업 양쪽에서 밀립니다. 여기서 standalone이라는 용어가 나옵니다. standalone(독립 제품)이란 다른 소프트웨어에 끼이지 않고 단독으로 파는 제품입니다. 마이크로소프트가 이미 업무 소프트웨어에 AI 비서(Copilot)를 1,500만 좌석 번들로 깔고 있어, Cursor 같은 독립 응용이 Slack처럼 압살될 위험이 있습니다. 위(모델)와 옆(응용)의 경계가 양쪽에서 무너지고, 거기에 빅테크 번들까지 누르는 중입니다. 이 발화가 4장 옆(응용) 이동의 단단함을 위협하는 동시에, 11편 「응용」의 긴장을 높입니다. 그 워크플로우 통합이 정말 단단한 자물쇠인지, 아니면 모델 랩 진입과 빅테크 번들에 먹히는 자리인지를 11편에서 본격적으로 측정합니다.

방향 힌트를 하나만 남깁니다(종목 추천이 아니라 탐색의 방향입니다). 모두가 화제로 삼는 프론티어 모델 자체보다, 그 모델이 녹으면서 곡괭이가 옮겨간 위(유통)와 옆(응용)과 밑(자본)일수록 들여다볼 가치가 큽니다. 반대로 유통이나 자본 없이 프론티어 모델만 가진 길목은 강도가 세 보여도 그 범용화를 함께 봐야 합니다.

정리하면 이렇습니다. 모델은 손에서 녹지만, 곡괭이는 녹지 않고 위와 옆으로 옮겨갑니다. 단 옮겨간 그 자리도 영원하진 않습니다. 녹는다는 것과 곡괭이가 사라진다는 것은 다릅니다. 이 글이 "모델은 약하다"와 "그 위·옆은 강하다"를 함께 말한 건 결론을 흐리려는 게 아니라, 그 둘이 서로 다른 층에서 동시에 참이기 때문입니다.

분명히 해둡니다. 이 글은 어느 회사를 사라는 글이 아닙니다. 누가 모델 계층의 길목을 쥐었는지를 보여줄 뿐, 지금 그 값과 그 리스크가 맞는지는 종목 분석의 몫입니다. 시장이 "어느 모델이 1등인가"라는 매달 바뀌는 순위에 시선을 빼앗긴 동안, 진짜 곡괭이는 조용히 모델 위와 옆으로 옮겨가고 있었습니다. 그 이동의 지도를 손에 쥐었다는 것, 그것이 이 글이 남기는 것입니다.

📖 다음 편 예고: 11편 「응용: 옆으로 간 곡괭이」

모델이 녹으면서 곡괭이는 위(유통)와 옆(응용)으로 흩어졌습니다. 이번 편이 위쪽 유통까지 짚었다면, 다음 편은 옆으로 간 곡괭이, 즉 응용을 본격적으로 답사합니다. 녹는 부품(모델)을 가져다 안 녹는 자리(업무 흐름)에 박은 회사들, Abridge가 의료에서 단단히 박은 자리와 Cursor가 코딩에서 잡은 헐거운 자리가 어떻게 다른지, 그 워크플로우 통합이 모델 랩의 직접 진입과 빅테크의 번들 앞에서 정말 버티는 자물쇠인지(이번 편의 반증조건 4번)를 다음 편에서 해부합니다.

모델: 한 장 요약

같은 성능을 내는 비용이 해마다 10배씩(3년에 1,000배) 떨어진다. 모델은 곡괭이가 아니다. 해자는 모델 위의 유통과 옆의 응용으로 이동한다.

  • 가격이 녹는다: 같은 성능당 비용 연 10배·3년 1,000배 하락(a16z LLMflation, $60에서 $0.06). DeepSeek 충격(2025.01)으로 엔비디아 단일일 -18%·시총 $589B 증발. 개발자 실사용 토큰 상위가 오픈 모델(DeepSeek·Qwen·Llama).
  • 그런데 만드는 건 더 비싸진다: 최종 학습 컴퓨트 비용 연 2.4~3.5배↑, 2027년 모델당 $1B 전망. 프론티어 랩 3사 2025 조달 $63B+. 최전선 Elo 격차 2025.02 최저 4에서 2026초 25~55 재확대. 단 추론 토큰 5~100배 소비로 총지출은 안 준다.
  • 모델에 자물쇠가 안 걸린다: 기업 평균 4.7개 동시 사용·5개+ 37%. MCP 80배·OpenRouter 5배·LiteLLM 49.6k stars가 교체를 1줄 코드로. 점착(Cleveland Clinic 120병원·업그레이드 66% vs 교체 11%)은 모델이 아니라 인증·워크플로우에 붙는다.
  • 곡괭이는 어디로: 위(유통, Apple $10억/년·검색 50%·Office 1,500만 좌석)·옆(응용, 의료 Abridge Epic EHR 90개+는 강·코딩 Cursor는 멀티툴 병용으로 약)·밑(자본, 하이퍼스케일러 capex $6,050억·NVDA $1,973억). 이동은 확정, 단단함은 미정(단 디폴트 지불은 반독점 판결에도 존속).
  • 흩어지지만 같은 소수로 수렴: 세 자리의 주인이 같은 빅테크(GOOGL·MSFT·AMZN·NVDA)로 모인다. 모델 랩조차 컴퓨트·지분으로 빅테크에 포획. 투자 함의는 분산이 아니라 집중(단 순환 리스크 동반).
  • 모델 랩의 이원성: 원시 모델 자체는 약(녹는 부품), 그러나 응용·유통으로 전진통합한 랩은 강해진다(Anthropic 마진 38→70%·ARR $9B→$44B+·Claude Code $1B→$2.5B). 마진 폭증은 반례가 아니라 "가치는 옆·위로 이동" 논제의 강화 사례. 단 그 정량은 그로스 회계·연율화·일시 할인이 섞여 검증 대상(방향은 강함, 숫자는 과신 금지).
  • 위(모델)·옆(응용)의 경계가 흐려지는 중: Cursor가 자체 경량모델(Composer)을 만들고, 모델 랩이 응용(Claude Code)으로 내려오며, 빅테크가 번들로 누른다(Teams가 Slack 압살한 선례).
  • 핵심 분리: 곡괭이를 쥔 것 ≠ 주식이 싼 것 ≠ 영속적 곡괭이. 강도 분류는 정성 종합이지 측정값 아님. 다음 편은 11편 「응용: 옆으로 간 곡괭이」.
관련 개념
🏰해자Economic Moat📈P/E주가수익비율🏗️Capex자본적 지출
추천 글
필연의 줄기
플랫폼: AI의 대지주
모델이 올라타는 도구를 누가 깔았는지, 직전 편 플랫폼에서 대지주가 IaaS에서 도구로 통행료를 옮긴 이동을 먼저 보면 이 글이 더 깊이 읽힙니다
필연의 줄기
응용: 옆으로 간 곡괭이
모델을 떠난 곡괭이가 옆으로 간 곳, 다음 편 응용 계층에서 ChatGPT조차 해자가 없는 이유와 살아남는 AI 기업의 조건을 이어서 봅니다
필연의 열매
엔비디아 종목 분석
DeepSeek 충격으로 하루 시총 5,890억 달러가 증발한 엔비디아를, 실제 종목 분석에서 CUDA 해자와 가격까지 따져 확인해보세요