혁명의 해부학 #8

컴퓨트: GPU 독점은 영원한가

같은 날, 한쪽은 '엔비디아는 끝났다'고 외치고
다른 쪽은 '엔비디아는 영원하다'고 외칩니다.
CUDA 개발자
400만+
19년 쌓인 소프트웨어 해자
추론 점유율 (추정)
60~75%
학습은 90%+, 추론만 갈라졌다
데이터센터 매출
+68%
점유율은 내려가는데 돈은 오른다

데이터는 둘 다 틀렸다고 말합니다. 컴퓨트는 7계층 답사에서 처음으로 곡괭이가 흔들리는 변곡점입니다.
단일 칩 독점은 영원하지 않습니다. 그러나 곡괭이는 사라지지 않고 이동합니다.

흔들리는 성벽 너머로 곡괭이가 어디로 옮겨갔는지 따라가 보세요

어느 날 아침, 두 개의 헤드라인이 같은 화면에 뜹니다. 하나는 "엔비디아의 독점은 끝났다"고 외칩니다. 하이퍼스케일러(아마존·구글·마이크로소프트·메타처럼 초대형 데이터센터를 운영하는 회사)들이 자체 칩을 만들고, 경쟁사 소프트웨어가 따라붙고, 추론 칩 가격이 떨어지고 있으니까요. 다른 하나는 "엔비디아는 영원하다"고 외칩니다. 데이터센터 매출이 또 신기록을 세웠고, 마진은 75%이고, 주문은 2027년까지 밀려 있으니까요.

이상한 것은, 두 헤드라인이 인용하는 데이터가 둘 다 사실이라는 점입니다. 자체 칩도 진짜고, 신기록 매출도 진짜입니다. 그렇다면 어느 쪽이 맞을까요. 이 글의 답은 "둘 다 틀렸다"입니다. 정확히는, 둘 다 같은 코끼리의 다른 부위를 만지고 있습니다.

이번 편은 그래서 이전 세 편과 결이 다릅니다. 5편(전력), 6편(설계도구), 7편(제조)에서 우리가 발굴한 곡괭이들(ASML·도쿄일렉트론·KLA·신에츠)은 데이터로 아무리 들여다봐도 거의 흔들림이 없었습니다. 한 공정을 한 회사가 100% 쥐었고, 우회로가 없었고, 20년 누적 연구개발이 성벽이었습니다. 그런데 컴퓨트는 다릅니다. 7계층 답사를 통틀어, 처음으로 곡괭이 자체가 흔들리는 변곡점입니다. 점유율이 실제로 내려가고(추정치 기준 2024년 약 87%에서 2026년 약 75%로), 경쟁사 소프트웨어가 프로덕션에 들어오고, 고객들이 자기 칩을 만들기 시작했습니다.

그래서 이 글은 곡괭이를 발굴하는 데서 그치지 않습니다. 곡괭이가 흔들리고, 어디로 옮겨가는지를 추적합니다. 한 가지 결론을 미리 비추면, 단일 칩 독점은 영원하지 않았습니다. 그러나 곡괭이는 부서지지 않았습니다. 사라지지 않고, 다른 곳으로 이동했습니다. 그 이동의 끝에 누가 새 곡괭이를 쥐었는지가 이 글의 마지막 질문입니다.

📖 이 글을 읽는 법

이 글은 특정 종목을 추천하지 않습니다. AI 연산의 심장인 컴퓨트(GPU·가속기) 계층에서, 엔비디아의 독점이 어떤 방어벽으로 지어졌고 어디에 균열이 갔으며 곡괭이가 어디로 옮겨가는지를 데이터로 추적합니다. 미국·대만·한국·중국을 가리지 않습니다. 가격이 합리적인지(밸류에이션)는 이 글의 범위가 아니라, 발굴된 후보를 따로 종목 분석할 때 다룹니다.

1. 3중 방어벽의 현 강도: 해자는 칩이 아니다

엔비디아를 "AI 칩을 잘 만드는 회사"로만 보면, 독점이 왜 안 무너지는지 설명되지 않습니다. AMD도 좋은 칩을 만들고, 구글도 자체 칩을 만드니까요. 칩 자체는 따라 만들 수 있습니다. 무너지지 않는 이유는 다른 데 있습니다. 엔비디아의 성은 칩 한 장이 아니라 세 겹의 방어벽으로 둘러싸여 있고, 그 세 겹은 따라 만들기가 훨씬 어렵습니다. 1장에서는 그 세 겹의 벽을 하나씩 두드려, 각각이 얼마나 단단한지를 봅니다.

1.1 첫째 벽: CUDA, 모두가 그 위에서 코드를 짠다

첫째 벽은 CUDA입니다. CUDA란 엔비디아 GPU 위에서 프로그램을 돌리기 위한 소프트웨어 토대(병렬 컴퓨팅 플랫폼)입니다. AI 모델을 학습시키거나 돌리려면 결국 GPU에 명령을 내려야 하는데, 그 명령을 짜는 표준 도구가 CUDA입니다. 비유하면, GPU가 무대라면 CUDA는 그 무대 위에서 모든 배우가 따르는 대본 작성 규칙입니다. 무대를 새로 지을 수는 있어도, 모든 극단이 이미 익힌 대본 규칙을 하루아침에 바꾸기는 어렵습니다.

숫자가 이 벽의 두께를 말해 줍니다. CUDA 개발자는 400만 명이 넘고, CUDA에 최적화된 모델·라이브러리는 4,000개가 넘으며, 도입한 기업·기관은 4만 개가 넘습니다. 이 생태계를 엔비디아는 2007년부터 19년에 걸쳐 쌓아 왔습니다 (NVIDIA CUDA Moat 분석, Medium). cuDNN(딥러닝)·TensorRT(추론 최적화)·cuBLAS(선형대수) 같은 라이브러리가 분야별로 깔려 있어, 개발자는 바닥부터 짤 필요 없이 검증된 도구를 가져다 씁니다 (CUDA Platform, NVIDIA Developer).

왜 이게 해자일까요. 한 개발자가 CUDA로 몇 년간 코드를 짜고 그 위에 모델을 올렸다면, 다른 플랫폼으로 옮기는 순간 그 코드와 노하우를 상당 부분 다시 만들어야 합니다. 개인만 그런 게 아니라 회사 전체, 산업 전체가 그 위에 서 있습니다. 칩은 사면 바뀌지만, 19년간 쌓인 소프트웨어 습관은 사서 바꿀 수 없습니다. 이것이 해자(moat)의 첫째 벽입니다.

해자는 칩이 아니라, 칩을 감싼 세 겹의 방어벽이다셋째 벽 · 생태계도입기관 4만+ · Triton 역포획 · 풀스택둘째 벽 · NVLink·NVSwitch (연결)GPU 72개를 하나처럼 · 1.8TB/s · PCIe 14배첫째 벽 · CUDA (소프트웨어)개발자 400만 · 라이브러리 4,000+ · 19년 축적GPU 칩 (Blackwell·Rubin)칩은 따라 만들 수 있다안쪽(칩)은 약하고, 바깥으로 갈수록 따라 만들기 어렵다

출처: NVIDIA Developer, CUDA Moat 분석(Medium), Computex 2025 발표. 개념적 시각화입니다.

1.2 둘째 벽: NVLink, GPU 수십 개를 하나처럼 묶는다

둘째 벽은 NVLink입니다. 요즘 AI 모델은 너무 커서 GPU 한 장으로는 못 돌립니다. 수십, 수백 개의 GPU를 마치 하나의 거대한 칩처럼 묶어야 하는데, 이때 GPU끼리 데이터를 주고받는 속도가 전체 성능을 좌우합니다. NVLink는 그 GPU 사이의 고속도로입니다. 도로가 좁으면 칩이 아무리 빨라도 차들이 정체에 갇히듯, 연결이 느리면 GPU를 아무리 많이 붙여도 제 속도가 안 납니다.

스펙이 격차를 보여줍니다. 최신 5세대 NVLink는 GPU 한 장당 1.8TB/s(초당 1.8테라바이트)의 대역폭을 내는데, 이는 일반적인 연결 방식(PCIe Gen5)보다 14배 빠릅니다. 그리고 NVSwitch라는 전용 스위치 칩으로 GPU 72개를 하나의 랙(NVL72)에 묶어, 마치 한 덩어리처럼 130TB/s로 통신하게 합니다 (NVLink Fusion, NVIDIA Newsroom).

여기서 엔비디아의 영리한 한 수가 나옵니다. 2025년 5월, 엔비디아는 NVLink Fusion을 발표했습니다. 종전까지 NVLink는 엔비디아 GPU끼리만 쓰는 폐쇄 기술이었는데, 이제 다른 회사의 CPU나 가속기도 NVLink로 엔비디아 GPU에 직접 연결할 수 있게 연 것입니다. 미디어텍·마벨·후지쯔·퀄컴·AWS 같은 파트너들이 합류했습니다 (NVLink Fusion, NVIDIA Newsroom, SDxCentral). 개방처럼 보이지만 본질은 포획입니다. 남의 칩을 쓰더라도 결국 NVLink라는 엔비디아의 연결 표준 위에 올라타게 만드는 것입니다. 이 한 수가 왜 중요한지는 5장에서 곡괭이의 이동을 따질 때 다시 만나게 됩니다.

1.3 셋째 벽: 생태계, 그리고 경쟁자를 역으로 끌어들이는 힘

셋째 벽은 생태계 그 자체입니다. 400만 개발자, 4,000개 라이브러리, 4만 개 도입 기관이 서로를 강화합니다. 개발자가 많으니 라이브러리가 늘고, 라이브러리가 좋으니 기업이 들어오고, 기업이 많으니 개발자가 또 모입니다. 이 선순환이 셋째이자 가장 두꺼운 벽입니다. 한번 도시가 형성되면, 더 좋은 빈 땅이 있어도 사람들이 쉽게 떠나지 않는 것과 같습니다. 인프라와 이웃과 일자리가 이미 거기 있으니까요.

가장 흥미로운 것은 엔비디아가 경쟁자의 무기마저 자기 쪽으로 끌어당기는 방식입니다. OpenAI가 만든 Triton이라는 도구가 있습니다. Triton은 원래 CUDA를 직접 안 쓰고도 GPU 프로그램을 짤 수 있게 해서 엔비디아 종속을 줄이려는 오픈소스입니다. 그런데 2025년, 엔비디아는 그 Triton에 자사 기술을 기여해, Triton으로 짠 코드가 엔비디아의 최신 칩(Blackwell)의 새 기능을 자동으로 활용하게 만들었습니다 (CUDA Tile IR / Triton, NVIDIA GTC25). 엔비디아를 벗어나려는 도구조차 엔비디아 위에서 가장 잘 돌게 만든 것입니다. 이것을 역포획이라 부를 만합니다.

여기에 엔비디아는 칩을 넘어 풀스택(하드웨어부터 소프트웨어까지 한 묶음으로 제공하는 전략)으로 확장합니다. 무료로 푼 CUDA 위에 NIM(추론 마이크로서비스)·AI Enterprise(유료 소프트웨어)·DGX Cloud(클라우드 마켓플레이스)를 쌓아, 하드웨어를 바꾸려 해도 소프트웨어 전환 비용이 발목을 잡게 합니다 (NVIDIA 풀스택).

세 벽을 합치면 그림이 분명합니다. 엔비디아의 해자는 칩이 아닙니다. 칩을 감싼 세 겹의 방어벽입니다. 그래서 다음 질문이 중요해집니다. 이 세 겹의 벽은 정말 빈틈이 없을까요. 2장에서 그 벽에 간 금을 봅니다.

💡 핵심: 엔비디아의 해자는 칩이 아니다

세 겹의 방어벽이 칩을 감쌉니다. 첫째 벽 CUDA(소프트웨어): 개발자 400만, 최적화 라이브러리 4,000+, 도입기관 4만+, 19년 축적. 둘째 벽 NVLink·NVSwitch(연결): GPU 72개를 하나처럼(NVL72), 1.8TB/s로 PCIe의 14배. NVLink Fusion으로 파트너(미디어텍·마벨·후지쯔·퀄컴·AWS)까지 포획. 셋째 벽 생태계: 선순환 + Triton 역포획(경쟁자 오픈소스를 CUDA로 수렴) + 풀스택(NIM·AI Enterprise·DGX Cloud). 칩은 따라 만들 수 있어도 세 겹은 못 따라 만든다. 지금도 강하다.

그래서 투자자에게 1장이 말하는 것은 이렇습니다. 5·6·7편에서 곡괭이를 잴 때 쓴 네 조건 중 진입장벽과 고객유지가, 컴퓨트에서 어떻게 작동하는지를 1장이 보여줍니다. 다른 계층의 곡괭이가 물리적 독점(100% 공정 장악)이었다면, 컴퓨트의 곡괭이는 소프트웨어·연결·생태계라는 무형의 독점입니다. 무형이라 칩처럼 한 번에 무너지지 않지만, 동시에 물리적 독점처럼 100%를 영원히 지키지도 못합니다. 그 미묘한 차이가 2장의 균열로 이어집니다.

1장 결론: 엔비디아의 해자는 GPU 칩이 아니라 CUDA·NVLink·생태계 3중 방어벽이다. 칩은 따라 만들 수 있어도 세 겹은 못 따라 만든다.

  • 첫째 벽 CUDA: 개발자 400만·라이브러리 4,000+·도입기관 4만+·19년 축적. 19년 쌓인 소프트웨어 습관은 사서 바꿀 수 없다.
  • 둘째 벽 NVLink: GPU 72개를 하나처럼(NVL72)·PCIe 14배 속도. NVLink Fusion으로 남의 칩까지 엔비디아 연결 표준에 포획.
  • 셋째 벽 생태계: 선순환 + Triton 역포획(경쟁자 오픈소스마저 CUDA로 수렴) + 풀스택. 무형의 독점이라 한 번에 안 무너지지만 100%를 영원히 지키지도 못한다.

2. 균열: 학습은 견고하고, 추론은 갈라진다

1장의 세 벽은 분명 강합니다. 그런데 그 벽 전체가 똑같이 강한 것은 아닙니다. AI 연산은 크게 두 단계로 나뉘는데, 그 두 단계에서 벽의 두께가 다릅니다. 균열은 한쪽에만 갔습니다. 2장에서는 어느 쪽 벽이 견고하고 어느 쪽에 금이 갔는지를, 세 가지 증거로 확인합니다.

2.1 두 개의 시장: 학습과 추론

AI 연산을 두 단계로 나눠 봅니다. 첫째는 학습(training)입니다. 거대한 AI 모델을 데이터로 처음부터 가르치는 단계입니다. 이건 극도로 어렵습니다. 수만 개의 GPU를 한 덩어리처럼 묶어 몇 달간 쉬지 않고 돌려야 하고, 한 장이라도 어긋나면 전체가 멈춥니다. 여기서는 1장의 둘째 벽(NVLink)이 결정적입니다. GPU를 가장 촘촘하게 묶는 회사가 이깁니다.

둘째는 추론(inference)입니다. 이미 다 배운 모델을 가져다 실제로 답을 내는 단계입니다. 여러분이 챗봇에 질문을 던지면 일어나는 일이 추론입니다. 추론은 학습보다 단순합니다. 칩 한두 개, 때로는 노트북으로도 돌릴 수 있고, GPU를 수만 개씩 묶을 필요가 없습니다. 묶을 필요가 적다는 건, 둘째 벽(NVLink)의 효력이 약하다는 뜻입니다. 학습이 거대한 발전소를 짓는 일이라면, 추론은 그 발전소에서 만든 전기를 집집마다 콘센트로 쓰는 일에 가깝습니다.

그래서 두 시장에서 곡괭이의 강도가 갈립니다. 엔비디아는 학습 시장의 90% 이상을 쥐고 있지만, 추론 시장에서는 60~75% 수준으로 추정됩니다 (Silicon Analysts 추정). 같은 회사인데 한쪽 벽은 90%, 다른 쪽 벽은 60~75%인 것입니다. 균열은 추론 쪽 벽에 났습니다.

같은 엔비디아, 두 시장에서 곡괭이 강도가 다르다
90%+
학습 (training)
60~75%
추론 (inference)

출처: Silicon Analysts 추정(TrendForce·Morgan Stanley·SemiAnalysis 인용). 점유율은 추정치

학습 쪽은 NVLink로 GPU 수만 개를 묶는 일이 결정적이라 진입장벽이 극강이고, CUDA의 학습 라이브러리(NeMo·Megatron)도 견고합니다. 반면 추론은 칩 한두 개로 가능해 NVLink의 효력이 약하고, 뒤에서 볼 경쟁 소프트웨어와 우회로가 이미 들어와 있습니다. 같은 방어벽이라도 학습 쪽은 90%+로 견고하고, 추론 쪽은 60~75%로 갈라진 것입니다.

2.2 ROCm이 프로덕션에 들어왔다

추론 벽에 간 금의 첫 번째 증거는 ROCm입니다. ROCm은 AMD가 만든 CUDA 대항마, 즉 AMD GPU에서 AI를 돌리는 소프트웨어 토대입니다. 오랫동안 ROCm의 평가는 가혹했습니다. "써보긴 해도 실전 운영엔 못 쓴다"는 게 정설이었습니다.

그 평가가 바뀌기 시작했습니다. 2024년 ROCm 6.x가 "각자 책임 하에 써보라(use at your own risk)" 딱지를 뗐고, 2025년 9월 ROCm 7이 나오면서 주요 AI 프레임워크(PyTorch·TensorFlow·JAX·Triton)를 폭넓게 지원했습니다 (ROCm 7.0, Phoronix). 더 중요한 건 실제 채택입니다. Meta가 Llama 모델 추론에 AMD MI300X를 광범위하게 배포했고, Microsoft Azure가 프로덕션에서 운영하고, Oracle과 OpenAI도 2026년 배포에 들어갔습니다. AMD는 상위 10대 AI 모델 기업 중 7곳이 자사 가속기에서 프로덕션 워크로드를 돌린다고 밝혔습니다 (AMD Advancing AI 2025).

물론 ROCm은 아직 CUDA가 아닙니다. 설치가 더 까다롭고, 최적화된 라이브러리 수가 적고, 개발자 재교육이 필요하다는 한계가 남아 있습니다 (ROCm 한계, efficientlyconnected). 핵심은 ROCm이 CUDA를 따라잡았다는 게 아니라, "실전에서 절대 못 쓴다"는 첫째 벽의 전제가 처음으로 깨졌다는 것입니다. 그것도 추론에서 먼저 깨졌습니다.

2.3 CUDA 없이 돌아가는 추론

두 번째 증거는 더 근본적입니다. 추론에서는 CUDA를 아예 안 거치는 길이 생겼습니다.

1장에서 본 Triton을 다시 봅니다. 엔비디아가 역포획하려 한 그 도구입니다. 측정해 보면, Triton으로 짠 추론 코드는 CUDA로 직접 짠 것 대비 H100 칩에서 약 76~78%의 성능을 냅니다 (CUDA-Free Inference, PyTorch Blog). 100%는 아니지만, "CUDA 없이도 8할은 나온다"는 사실 자체가 중요합니다. 추론처럼 마진이 빠듯한 영역에서는 8할 성능을 더 싼 칩으로 내는 쪽이 경제적일 수 있기 때문입니다.

여기에 CUDA 없이 모델을 돌리는 도구들이 흔해졌습니다. llama.cpp는 노트북 CPU나 애플 칩에서, MLC LLM은 휴대폰에서 CUDA 없이 모델을 돌립니다 (CUDA-Free 런타임, DEV). 학습은 여전히 거대한 GPU 농장과 CUDA가 필요하지만, 추론은 점점 더 많은 곳에서 CUDA를 우회합니다. 첫째 벽이 추론 쪽에서 얇아지고 있는 것입니다.

2.4 표준 전쟁: 연결의 벽에도 도전이 시작됐다

세 번째 증거는 둘째 벽(NVLink)에 대한 도전입니다. 업계는 엔비디아 전용 연결에만 의존하지 않으려고 두 개의 개방 표준을 만들고 있습니다.

하나는 UALink입니다. GPU들을 한 덩어리로 묶는(스케일업) 개방 표준으로, AMD·애플·구글·인텔·마이크로소프트 등 12개사가 주도하고 70개 이상이 참여해 2025년 4월 1.0 규격을 확정했습니다. 최대 1,024개의 가속기를 묶는 것이 목표입니다 (UALink 1.0, UALink Consortium). 다른 하나는 울트라이더넷(UEC)으로, 여러 서버를 연결하는(스케일아웃) 표준이며 2025년 6월 1.0이 나왔습니다 (UEC 2025, Ultra Ethernet).

단 정직하게 짚어야 합니다. 이 표준들은 아직 막 나오는 단계입니다. 실제 UALink 스위치 제품은 2026년 4분기에야 첫 출시 목표이고, 성능과 생태계가 NVLink를 따라잡았는지는 아직 입증되지 않았습니다. 핵심은 NVLink가 당장 대체됐다는 게 아니라, "엔비디아 연결에만 의존하지 않겠다"는 업계 합의가 표준 형태로 형성됐다는 것입니다. 둘째 벽에도 도전장이 붙었습니다.

2.5 반대편 시각: 균열을 약하게 보는 두 힘

여기까지가 "추론에서 균열이 났다"는 증거입니다. 그런데 정직한 분석이라면 반대편 시각도 함께 둬야 합니다. 균열을 약하게 보는 데이터도 분명히 있습니다.

첫째는 제번스 역설(Jevons paradox)입니다. 어떤 자원의 효율이 좋아져 값이 싸지면, 절약되기는커녕 그 자원의 총 사용량이 오히려 늘어나는 현상입니다. 19세기에 증기기관 효율이 좋아지자 석탄이 절약된 게 아니라 더 많이 쓰인 데서 나온 이름입니다. 추론에 적용하면, 추론 칩 값이 싸지면 추론을 더 많이 돌리게 되고, 그 늘어난 수요가 결국 엔비디아 GPU 물량을 더 키운다는 것입니다. 실제로 동일 성능 기준 추론 가격이 연 9~900배씩 떨어지는 동안에도 (Epoch AI) 기업의 생성 AI 지출은 2년 만에 22배로 늘었습니다 (Menlo Ventures). 업계도 이 패턴을 "제번스 역설의 재증명", 효율 개선이 수요를 늘리는 자기강화 사이클이라 부릅니다 (Jon Peddie Research).

둘째, 엔비디아 자신도 그 균열을 직접 메우려 합니다. 엔비디아는 역사적으로 칩 세대가 바뀔 때마다 격차를 다시 벌려 왔는데, 차세대 칩(Vera Rubin)이 추론 성능을 5배, 토큰당 비용을 10배까지 낮춘다면 추론에서 벌어진 틈을 다시 메울 수 있다는 분석입니다 (Vera Rubin 추론 5배, Bernstein/TipRanks). 이건 먼 미래의 가정이 아닙니다. 2026년 3월 GTC에서 젠슨 황은 "지금 추론의 왕은 그레이스 블랙웰과 NVLink"라며 추론 리더십을 직접 표방했고, 하반기 양산할 베라 루빈이 토큰당 비용을 최대 10배까지 낮춰 그 리더십을 더 확장한다고 밝혔습니다 (GTC 2026 키노트, Quartz). 즉 "추론 균열"이라는 이 글의 관찰과 반대 방향의 힘이 이미 발화하고 있습니다.

그래서 이 글은 한 가지를 분명히 못 박습니다. 균열이 시작됐다까지만 말합니다. 그 균열이 영구적 추세인지, 한 세대의 일시적 상태인지는 단정하지 않습니다. 차세대 칩 양산 후 엔비디아의 추론 점유율이 실제로 회복되는지를 반증 조건으로 남기고, 그 조건은 결론에 명시합니다. 안심하고 읽어도 됩니다. "추론에 금이 갔다"와 "엔비디아가 그 금을 메우려 한다"는 둘 다 동시에 진실이고, 어느 쪽이 이길지는 이후 데이터가 답합니다.

그래서 투자자에게 2장이 말하는 것은 이렇습니다. 2장은 1장을 부정하지 않습니다. 세 벽은 여전히 강합니다. 다만 그 벽이 균일하게 강한 게 아니라, 학습 쪽은 견고하고 추론 쪽은 갈라졌다는 것입니다. 그리고 추론은 앞으로 AI 연산에서 점점 더 큰 비중을 차지합니다. 한 추정에 따르면 추론은 2023년 전체 AI 연산의 3분의 1에서 2025년 절반, 2026년에는 약 3분의 2까지 커집니다 (Deloitte 2026 전망). 균열이 난 쪽(추론)이 점점 커지는 쪽이라는 점, 이것이 변곡점의 핵심입니다. 그런데 여기서 가장 이상한 일이 벌어집니다. 점유율이 내려가는데 돈은 더 법니다. 3장의 역설입니다.

2장 결론: 방어벽에 금이 갔다. 단 균일하지 않다. 학습은 90%+로 견고하고, 추론은 60~75%로 갈라졌다.

  • 학습 vs 추론: 학습은 GPU 수만 개를 묶어야 해 NVLink가 결정적(90%+). 추론은 칩 한두 개로 가능해 락인이 약하다(60~75%, 추정).
  • 첫째 벽(CUDA) 균열: ROCm이 Meta·MS·Oracle 프로덕션 진입(상위 10대 AI 기업 중 7곳). Triton 추론이 CUDA의 76~78% 성능. CUDA 없는 런타임 확산.
  • 둘째 벽(NVLink) 도전: UALink·울트라이더넷 개방 표준 형성(단 제품은 2026 Q4부터, 입증 전). 단 제번스 역설과 차세대 칩(Vera Rubin) 재독점이라는 반대 힘도 이미 발화 중. 균열은 시작까지만, 영구성은 반증 조건.

3. 역설: 점유율은 내려가는데, 돈은 올라간다

2장에서 균열을 봤습니다. 점유율이 내려간다면, 보통은 매출도 흔들려야 합니다. 그런데 엔비디아는 정반대입니다. 점유율은 내려가는데 매출과 마진은 오히려 오릅니다. 프롤로그의 두 헤드라인이 동시에 사실인 비밀이 바로 여기 있습니다. 3장에서는 이 역설이 모순이 아니라 산수임을 봅니다.

3.1 두 개의 사실: 하락하는 점유율, 상승하는 매출

먼저 점유율입니다. AI 가속기 시장에서 엔비디아의 점유율은 한 추정에 따르면 2024년 약 87%(피크)에서 2025년 약 81%, 2026년 약 75%로 내려가는 흐름입니다 (Silicon Analysts 추정). 이 수치는 Silicon Analysts의 자체 추정이고 기관마다 차이가 있다는 점은 분명히 둬야 합니다. 모건스탠리·TrendForce 등은 방법론과 정의(출하량 기준이냐 매출 기준이냐, GPU만이냐 ASIC 포함이냐)에 따라 다른 수치를 제시합니다. 핵심은 정확한 숫자가 아니라 방향입니다. 어느 추정으로 보나, 피크를 찍고 내려오는 흐름이라는 데는 대체로 일치합니다.

이제 같은 시기의 매출을 봅니다. 엔비디아의 데이터센터 부문 연매출은 FY2026 기준 약 1,937억 달러로, 전년 대비 +68% 늘었습니다. 분기로 보면 직전 분기(Q4) 데이터센터 매출이 623억 달러였고, 전사 매출은 681억 달러, 그 분기의 매출총이익률(GAAP)은 75.0%였습니다 (NVIDIA Q4 FY2026, Newsroom). 점유율은 내려가는데 매출은 신기록이고 마진은 75%입니다.

점유율은 내려가는데, 매출은 올라간다
같은 시기, 두 지표가 정반대로 움직인다
↑ 데이터센터 연매출 (늘어남)
$47.5B
$115.2B
$193.7B
같은 회사 · 같은 시기 · 정반대 방향
↓ AI 가속기 점유율 (내려감, 추정)
~87%
~81%
~75%
FY2024 / 2024E
FY2025 / 2025E
FY2026 / 2026E

점유율은 Silicon Analysts 추정치(방향만 신뢰)이고, 매출은 NVIDIA 공식입니다.

출처: Silicon Analysts(점유율 추정)·NVIDIA Newsroom(매출)

3.2 비밀: 시장이 점유율보다 빨리 큰다

모순처럼 보이는 이 그림의 비밀은 단순합니다. 케이크 자체가 폭발적으로 커지고 있기 때문입니다.

비유하면 이렇습니다. 케이크의 87%를 가졌는데 케이크가 작으면, 87%를 가져도 양이 적습니다. 그런데 케이크가 두 배, 세 배로 커지면, 내 비율이 87%에서 75%로 줄어도 내가 실제로 가져가는 양은 오히려 늘어납니다. 엔비디아가 정확히 이 상황입니다.

숫자로 보면, AI 가속기 전체 시장은 2024년 약 1,150억 달러에서 2026년 2,000억 달러를 넘는 규모로 추정됩니다 (시장규모 추정, Silicon Analysts). 그 뒤에는 하이퍼스케일러 4사(아마존·구글·마이크로소프트·메타)의 설비투자가 있는데, 이들의 합산 설비투자(Capex)가 2년 만에 약 3배로 불어났습니다 (하이퍼스케일러 Capex, Tom's Hardware). 이 돈의 상당 부분이 AI 칩으로 흘러갑니다. 시장이 이 속도로 커지면, 점유율이 좀 내려가도 절대 매출은 늘어납니다.

여기에 엔비디아의 가격결정력이 더해집니다. 칩이 모자라서 주문이 2027년까지 밀려 있고, 차세대 칩에 필요한 CoWoS 패키징은 2027년 중반까지 거의 다 예약됐습니다 (공급 부족, Spheron). 물건이 부족하니 값을 깎을 이유가 없고, 그래서 마진이 75%로 유지됩니다.

2장에서 본 추론 시장이 커지는데도 당분간 엔비디아 매출이 함께 느는 이유가 여기 있습니다. 시장 전체가 점유율 하락보다 더 빨리 크고, 연산이 싸지면 사람들이 더 많이 돌리기 때문입니다(2장의 제번스 역설). 추론이 커진다고 곧바로 엔비디아 매출이 줄지 않는 것은 그래서입니다.

단 이 역설에도 한계의 조짐이 있습니다. 하이퍼스케일러가 새로 쓰는 설비투자 중 엔비디아로 흘러 들어가는 몫이 정점을 찍은 뒤 더 이상 늘지 않고 있습니다 (증분 capex 점유율, Daloopa). 시장이 커지는 속도가 엔비디아 매출이 커지는 속도를 앞지르기 시작했다는 신호입니다. 시장 성장이 점유율 하락을 가려 주는 효과가 언젠가는 약해진다는 뜻입니다.

그래서 투자자에게 3장이 말하는 것은 이렇습니다. 3장의 역설은 4편의 척추와 정확히 맞물립니다. "점유율이 내려간다"는 약세 논리와 "매출·마진이 신기록"이라는 강세 논리가 동시에 사실일 수 있다는 것입니다. 그래서 점유율 한 숫자만 보고 "끝났다"고 하거나, 매출 한 숫자만 보고 "영원하다"고 하는 것이 둘 다 위험합니다. 단 한 가지 질문이 남습니다. 시장이 영원히 이 속도로 클 수는 없습니다. 시장 성장이 점유율 하락을 더 이상 가려 주지 못하는 날이 오면, 가치는 어디로 갈까요. 그 답이 4장입니다. 곡괭이는 사라지지 않고 이동합니다.

3장 결론: 점유율은 내려가는데(추정 87%→75%) 매출은 오른다(+68%, 마진 75%). 시장이 점유율 하락보다 빠르게 크기 때문이다.

  • 두 사실 모두 진짜: 점유율 추정 2024 ~87%→2026 ~75%(하락) + 데이터센터 연매출 $193.7B(+68%)·분기 마진 75%(상승).
  • 비밀은 케이크: AI 가속기 시장 ~$115B(2024)→$200B+(2026). 하이퍼스케일러 Capex 2년 만에 약 3배. 케이크가 빨리 커지면 내 비율이 줄어도 내 몫은 는다.
  • 가격결정력: 공급 부족(주문 2027까지)으로 마진 75% 유지. 단 시장 성장이 점유율 하락을 영원히 가려주진 못한다.

4. 곡괭이의 이동: 칩에서 시스템으로, 그리고 주변부로

3장 끝의 질문, "시장 성장이 점유율 하락을 더 못 가려 주면 가치는 어디로 가는가". 답은 "사라지지 않는다"입니다. AI에 쏟아붓는 돈(하이퍼스케일러 Capex 연 6,000억 달러 이상)이 이 속도를 유지한다는 전제 하에, 그 돈은 줄지 않습니다. 다만 그 돈이 도착하는 길목이 바뀝니다. 곡괭이가 옮겨가는 것입니다. 4장에서는 그 이동을 세 갈래로 추적합니다.

이 전제는 명시해 둬야 합니다. 이 글은 거시 버블 논쟁을 다루지 않습니다. 다만 곡괭이 이동 논의 전체가 "AI 설비투자가 줄지 않는다"는 전제 위에 서 있다는 점을 분명히 합니다. 만약 이 전제가 깨지면(하이퍼스케일러 4사의 설비투자가 전년 대비 역성장으로 돌아서거나 가이던스를 하향하면), 곡괭이 이동 논의 전체가 보류됩니다. 곡괭이가 어디로 가느냐를 따지기 전에, 곡괭이를 살 돈이 있느냐가 먼저이기 때문입니다. 이 반증 조건도 결론에 명시합니다.

4.1 칩에서 시스템으로: 엔비디아 자신의 이동

가장 먼저, 엔비디아 자신이 곡괭이를 칩에서 시스템으로 옮겼습니다.

예전 엔비디아는 GPU 한 장을 팔았습니다. 지금은 다릅니다. GPU 72개를 NVLink로 묶은 랙 한 덩어리(NVL72)를 통째로 팝니다. 거기에 네트워킹(InfiniBand·Spectrum-X), 소프트웨어(CUDA·AI Enterprise)까지 묶입니다. 실제로 엔비디아의 네트워킹 사업만 따로 봐도 분기 수십억 달러 규모로 커졌습니다 (네트워킹 매출, DataCenterDynamics).

이것이 왜 곡괭이의 이동일까요. 경쟁사가 GPU 칩 하나를 더 잘 만들어도, 엔비디아는 "칩 하나"가 아니라 "칩 72개 + 연결 + 소프트웨어가 통합된 시스템"으로 경쟁하기 때문입니다. 칩 하나의 우열보다 시스템 전체의 완성도로 싸우게 만들면, 둘째 벽(NVLink)과 셋째 벽(생태계)이 다시 작동합니다. 곡괭이를 칩 한 장에서 시스템 한 덩어리로 두껍게 만든 것입니다.

4.2 엔비디아 바깥으로: 자체 칩의 길목

두 번째 이동은 엔비디아 성벽 바깥에서 일어납니다. 하이퍼스케일러들이 엔비디아에만 의존하지 않으려고 자체 칩을 만들기 시작했습니다. 구글의 TPU, 아마존의 트레이니엄(Trainium), 메타의 MTIA, 마이크로소프트의 마이아(Maia)입니다. 이들은 엔비디아 칩을 사면서 동시에 자기 칩도 만드는 이중 전략을 씁니다 (커스텀 실리콘, CNBC).

여기서 새로운 곡괭이가 드러납니다. 하이퍼스케일러는 칩의 아키텍처(설계 방향)는 정하지만, 그 칩을 실제 실리콘으로 구현하는 일(신호를 빠르게 주고받는 회로, 패키징 등)은 전문 설계 파트너에게 맡깁니다. 그리고 그 설계 파트너 시장의 약 95%를 단 두 회사가 쥐고 있습니다 (설계 파트너 95%, Hashrate Index). 즉 "엔비디아를 안 쓰겠다"는 움직임조차, 다른 길목에 있는 새 곡괭이를 두껍게 만들어 줍니다. 자체 칩 흐름이 커질수록, 그 칩을 설계해 주는 회사의 곡괭이가 단단해지는 구조입니다.

여기에 패키징이라는 또 하나의 길목이 있습니다. 엔비디아 GPU든 하이퍼스케일러 자체 칩이든, AI 칩이라면 거의 다 거치는 첨단 패키징(CoWoS, 여러 칩을 하나의 패키지로 통합하는 방식)을 TSMC가 사실상 독점합니다(7편에서 본 그 고리입니다). 누가 칩 경쟁에서 이기든, 그 칩은 TSMC의 패키징을 거칩니다.

곡괭이는 사라지지 않고 이동한다① 단일 GPU엔비디아 칩점유율 흔들림 87%→75%② 시스템NVL72 + 네트워킹 + SW엔비디아 자신의 이동③ 주변부 길목 (여러 자루로 분기)커스텀 ASIC 설계 (~95% 2사)AI 네트워킹 (이더넷 스위치)광통신 (1.6T 트랜시버)리타이머 (신호 복원)전력관리첨단 패키징 (CoWoS)단, 엔비디아의 손도 여기로 따라온다이더넷 스위치에 제로→11.6% 직접 침입NVLink Fusion으로 주변부 칩에 통행료

출처: NVIDIA Newsroom, CNBC, Hashrate Index, NextPlatform. 개념적 시각화이며 점유율은 추정치입니다.

4.3 주변부의 곡괭이들: 골드러시의 곡괭이는 여러 자루다

세 번째 이동은 가장 넓습니다. AI 컴퓨터 한 대를 짓는 데는 GPU만 있으면 되는 게 아닙니다. 5편(전력)에서 본 골드러시 논리가 여기서도 작동합니다. 누가 GPU 경쟁에서 이기든, 그 GPU를 실제로 돌리려면 주변 부품이 다 필요합니다.

칩과 칩을 묶는 AI 네트워킹(이더넷 스위치), 데이터를 빛으로 빠르게 나르는 광통신(1.6테라비트급 트랜시버), GPU에서 나온 신호가 멀리 가도 깨지지 않게 살려 주는 리타이머(약해진 전기 신호를 다시 또렷하게 복원하는 칩), 그리고 그 모든 칩에 안정적으로 전기를 공급하는 전력관리. 이 길목 하나하나마다 곡괭이를 쥔 회사가 있습니다. AI 네트워킹용 이더넷 스위치 칩 시장의 절반 이상, AI 서버에 들어가는 특정 리타이머의 80% 이상을 쥔 회사들이 그 예입니다 (주변부 점유율, Hashrate Index).

핵심은 이것입니다. 단일 GPU의 곡괭이는 흔들리지만, AI 인프라 전체로 보면 곡괭이는 한 자루가 아니라 여러 자루로 갈라졌습니다. GPU가 엔비디아 것이든 자체 칩이든, 네트워킹과 광통신과 전력은 어차피 필요하니까요. 단 한 가지는 미리 짚어 둡니다. 이 주변부 길목이 전부 "엔비디아와 무관하게 안전한" 것은 아닙니다. 일부 길목(특히 네트워킹)에는 엔비디아가 직접 들어오고 있습니다. 그래서 5장에서는 단순히 "누가 쥐었나"만이 아니라 "엔비디아가 따라오기 어려운 길목은 어디인가"까지 갈라서 발굴합니다.

그래서 투자자에게 4장이 말하는 것은 8편 전체의 핵심입니다. "단일 칩 독점은 영원하지 않다"(2·3장)는 것과 "곡괭이는 사라지지 않는다"(4장)는 것은 모순이 아닙니다. 곡괭이가 이동했기 때문입니다. 엔비디아 한 종목에만 시선을 두면 "독점이 흔들린다"만 보이지만, AI 인프라 전체를 지도로 보면 "가치의 길목이 여러 갈래로 번진다"가 보입니다. 5편(전력)에서 "곡괭이를 파는 자가 이긴다"고 했다면, 8편은 "곡괭이가 한 자루가 아니라는 것, 그리고 그것이 이동한다는 것"을 더합니다.

4장 결론: 곡괭이는 사라지지 않고 이동한다. 단일 GPU에서 시스템으로, 그리고 엔비디아 바깥 주변부로 번진다.

  • 칩→시스템(엔비디아 자신): GPU 한 장 판매 → NVL72 랙+네트워킹+소프트웨어 시스템 판매. 곡괭이를 두껍게.
  • 엔비디아 바깥: 하이퍼스케일러 자체 칩(TPU·트레이니엄·MTIA·마이아) 흐름이 설계 파트너(설계 시장 ~95% 2사)와 CoWoS(TSMC)의 곡괭이를 키운다.
  • 주변부 여러 자루: AI 네트워킹·광통신(1.6T)·리타이머(AI서버 80%+)·전력관리. GPU가 누구 것이든 어차피 필요한 길목들. 단 일부(네트워킹)엔 엔비디아가 직접 침입 중 → 5장에서 "엔비디아가 따라오기 어려운 길목"까지 갈라 발굴.

5. 그래서 누가 곡괭이를 쥐는가

4장에서 곡괭이가 여러 자루로 갈라져 이동하는 것을 봤습니다. 이제 그 자루 하나하나를 누가 쥐었는지를 데이터로 발굴합니다. 5편·6편·7편에서 했던 그 작업입니다. 단 컴퓨트에서는 발굴 대상이 "흔들리는 GPU 본체"가 아니라 "이동한 끝의 주변부 길목"이라는 점이 다릅니다.

그 전에 한 가지를 솔직하게 짚어야 합니다. 곡괭이는 엔비디아 바깥으로 이동하지만, 엔비디아도 그 이동을 가만히 보고만 있지 않습니다. 1장에서 본 NVLink Fusion이 그 증거입니다. 엔비디아는 남의 칩이 자기 연결 표준 위에 올라타게 만들어 통행료(랙이 켜질 때마다 발생하는 인프라 매출)를 겁니다. 더 나아가, 엔비디아는 그동안 자기 영역이 아니었던 곳에도 직접 들어옵니다. 칩끼리 묶는 이더넷 스위치 시장이 그렇습니다. 엔비디아의 데이터센터 이더넷 스위치 매출(Spectrum-X)은 한 분기에 전년 대비 760% 넘게 뛸 만큼 폭증했고, 제로에서 출발해 데이터센터 스위치 시장의 약 11.6%까지 단숨에 올라왔습니다 (NVIDIA 이더넷 스위치 진입, NextPlatform). 즉 "곡괭이가 엔비디아 바깥으로 이동했다"는 말은 "엔비디아의 손이 닿지 않는 곳으로 갔다"는 뜻이 아닙니다.

그래서 발굴을 한 덩어리로 묶으면 안 됩니다. 주변부 곡괭이는 두 종류로 갈립니다. 하나는 엔비디아가 자본과 설계로도 그 부품을 직접 생산해 들어오기는 어려운 물리적·소재적 병목입니다(A군). 다른 하나는 엔비디아가 직접 침입하고 있거나 통행료를 거는 표적입니다(B군). 상대적으로 안전한 주변부 곡괭이는 전자입니다. 단 A군이라고 다 같은 안전 등급은 아닙니다. 이것은 8편의 논제("곡괭이는 이동한다")를 부정하는 것이 아니라 정밀화하는 것입니다. 곡괭이는 이동하지만, 그 이동을 엔비디아가 따라가는 만큼, 엔비디아가 따라가기 어려운 곳일수록 곡괭이가 더 안전합니다.

그 위에 가장 중요한 분리를 먼저 못 박습니다. 7편이 우리에게 남긴 교훈입니다. 곡괭이를 쥐었다는 것과 그 주식이 싸다는 것은 전혀 다른 문제입니다. 그리고 7편이 한 겹 더 보탰습니다. 가장 단단한 곡괭이가 곧 가장 안전한 주식인 것도 아니라는 것입니다(100% 독점일수록 단일 표적이 됩니다). 이 글은 "누가 곡괭이를 쥐었는가"만 답합니다. "그 값이 합리적인가"는 종목 분석의 몫입니다.

5.1 분석 결과: 길목별로 곡괭이를 쥔 자, 그리고 엔비디아가 따라오는가

결론부터 지도를 드립니다. 이 절은 곡괭이를 세 묶음으로 나눕니다. ① 가장 안전한 곡괭이는 엔비디아가 자본으로도 물리적으로 못 따라오는 첨단 패키징(CoWoS)입니다. ② 그 다음은 광통신 레이저와 리타이머입니다. 진입장벽은 높지만 차세대 기술이 그 가치를 옆으로 밀 위험이 있습니다. ③ 점유율이 세 보여도 조심해야 할 곳은, 엔비디아가 직접 쳐들어오는 네트워킹과 설계 2위입니다. 아래는 이 지도를 데이터로 채우는 과정입니다.

4장에서 본 주변부 길목 각각에, 5·6·7편과 같은 네 조건(점유율·진입장벽·고객유지·범용화 저항)을 대입했습니다. 단 컴퓨트에서는 한 차원을 더 봅니다. 도입에서 못 박은 "엔비디아가 직접 침입하는가"입니다. 이 차원으로 주변부 곡괭이를 두 군으로 나눕니다.

A군은 엔비디아가 따라오기 어려운 물리·소재 병목입니다. 엔비디아는 자본도 설계 역량도 넘치지만, 물리적 공정과 화합물 소재의 양산은 돈으로 단숨에 사들이기 어렵습니다. 여기에 세 가지가 있습니다. 첫째, 첨단 패키징(CoWoS)을 사실상 독점한 TSMC입니다. AI 칩이라면 엔비디아 GPU든 자체 칩이든 거의 다 이 패키징을 거칩니다(7편에서 본 그 고리입니다). 둘째, 데이터를 빛으로 나르는 핵심 레이저를 절반 이상 쥔 회사입니다. 이 레이저는 특수한 화합물 소재로 만들어 양산까지 진입에 수년이 걸립니다. 셋째, AI 서버에 들어가는 특정 신호 복원 칩(리타이머)을 사실상 혼자 양산하는 회사입니다(AI 서버 탑재율 80% 이상). 신호가 빠를수록 멀리 보내면서 살려 내기가 어려워, 가장 빠른 등급은 사실상 한 회사만 양산합니다. 이 셋은 엔비디아가 직접 만들겠다고 자본을 투입해도 따라잡는 데 시간이 걸리는, 물리적 시간이 방어벽인 곡괭이입니다.

단 A군이 곧 "안전 등급"이라고 읽으면 안 됩니다. 물리적 진입장벽이 높다는 것과 그 곡괭이의 가치가 안 흔들린다는 것은 다릅니다. 엔비디아가 그 부품을 직접 생산하기는 어려워도, 곡괭이의 형태 자체가 바뀌면 가치는 옮겨갈 수 있습니다. 실제로 엔비디아와 브로드컴은 광 부품을 스위치 칩에 한 패키지로 합치는 차세대 방식(CPO, 공패키지 광학)을 2026년 볼륨 생산 단계로 밀어붙이고 있습니다. 이 방식은 광통신에 쓰던 레이저를 4분의 1만 쓰게 만듭니다. 레이저를 덜 쓰면, 레이저를 만들던 회사의 곡괭이가 패키징·스위치를 만드는 회사 쪽으로 넘어갑니다. 광의 가치가 광소자 업체에서 패키징·스위치 벤더로 이동하는 것입니다 (NVIDIA Spectrum-X Photonics, NVIDIA Newsroom, CPO 가치사슬 재편, Chipstrat). 그래서 같은 A군이라도 강도가 갈립니다. 첨단 패키징(CoWoS)은 물리 공정이고 생산능력 증설에만 수년이 걸려, 엔비디아가 그 생산능력의 절반 이상을 예약해도 직접 생산은 못 하는, 가장 안전한 곡괭이입니다 (CoWoS 60% 선점, Astute Group). 반면 광통신 레이저와 리타이머는 물리적 진입장벽은 높지만, 곡괭이의 형태가 CPO로 재편되면 가치가 옆으로 이동할 수 있어 CoWoS보다 한 단계 약합니다.

B군은 엔비디아가 직접 침입하고 있거나 통행료를 거는 표적입니다. 대표가 AI 네트워킹(이더넷 스위치)입니다. 5·6·7편 같으면 "GPU가 누구 것이든 어차피 필요한 안전한 길목"으로 묶었을 자리입니다. 그러나 도입에서 본 대로, 엔비디아가 바로 그 시장에 제로에서 11.6%까지 치고 들어왔습니다. 그래서 AI 이더넷 스위치 시스템 1위 회사의 곡괭이는, 점유율 자체는 강하지만 침입 리스크를 강도에서 깎아야 합니다. 커스텀 AI 칩 설계 2위 회사도 B군 성격이 강합니다. 엔비디아가 NVLink Fusion으로 이 회사에 2조 원 넘게 투자해 자기 연결 표준에 묶었기 때문입니다. 투자처럼 보이지만 본질은 통행료입니다. 이 회사가 쥔 곡괭이의 가치 일부를 엔비디아가 떼어 갑니다.

그 사이에 가장 단단한 곡괭이가 있습니다. 커스텀 AI 칩 설계 선두 회사입니다. 4장에서 본 "설계 시장 95%를 쥔 두 회사" 중 선두가, 동시에 AI 네트워킹용 이더넷 스위치 칩의 절반 이상까지 쥐고 있습니다. 자체 칩의 설계와 그 칩들을 잇는 네트워킹을 함께 공급해, 골드러시의 두 길목을 한 손에 쥔 셈입니다. 공개된 AI 반도체 수주잔고만 730억 달러에 이르고, 자체 칩 설계 고객이 6곳으로 늘었습니다 (커스텀 ASIC 선두, Tom's Hardware). 자체 칩 설계는 고객과 2~3년을 함께 개발한 뒤에야 칩이 나오므로, 한 번 시작하면 고객이 떠나는 비용이 막대합니다. 단 이 회사의 곡괭이에는 A군과 B군의 성격이 섞여 있습니다. 설계 부분은 엔비디아가 직접 하지 않는 영역이지만, 겸하는 이더넷 스위치 칩은 엔비디아가 침입 중인 시장이고, 고객(빅테크)이 설계를 직접 쥐려는 내재화 압력도 받습니다. 그래서 강도는 최상위이되, 차원이 단일하지 않습니다.

여기에 차세대 GPU의 전력관리를 상당 부분 맡을 것으로 추정되는 회사가 있습니다. 전력관리는 플랫폼별로 경쟁사가 분산될 수 있어, 곡괭이의 폭이 위 길목들보다 좁습니다.

이제 네 조건과 침입 차원으로 잰 결과를 한 장에 모읍니다. 막대(게이지 길이)가 곡괭이의 강도입니다. A군이라도 안전 등급은 아니며, 엔비디아가 직접 침입하는 B군은 강도에서 침입 리스크만큼 깎였고, 전력관리는 곡괭이 폭이 좁아 70 미만으로 가장 약합니다.

컴퓨트 주변부 곡괭이 강도 (5·6·7편 동일 척도 + 엔비디아 침입 차원)
88
커스텀 ASIC 설계+네트워킹 · Broadcom (혼합)
86
첨단 패키징 CoWoS · TSMC (A군 최고)
80
1.6T 광통신 레이저 · Lumentum·Coherent (A군)
80
리타이머 · Astera Labs (A군)
75
AI 이더넷 스위치 · Arista (B군)
70
커스텀 ASIC 설계 2위 · Marvell (B군)
68
전력관리 · Monolithic Power (가장 약)

출처: Hashrate Index·Tom's Hardware·NextPlatform·NVIDIA Newsroom·Chipstrat·Astute Group. 점유율 일부 추정·자사 주장 포함

곡괭이 (길목 · 쥔 기업)강도근거 (점유율·진입장벽·고객유지·범용화저항)엔비디아 침입 · 이동 위협
커스텀 ASIC 설계+네트워킹 · Broadcom88설계 시장 ~95% 중 선두·이더넷칩 ~55% 겸함·AI 백로그 $73B·고객 6곳·2~3년 공동개발 락인겸하는 이더넷칩에 침입 중 + 고객 설계 내재화 압력(혼합)
첨단 패키징 CoWoS · TSMC86AI 칩 거의 다 거침·사실상 독점(7편)·생산능력 수년 증설직접 생산 곤란(물리 공정). CPO 침식 낮음 → A군 중 가장 안전
1.6T 광통신 레이저 · Lumentum·Coherent80200G/lane 레이저 ~50~60%·유일 양산·화합물 반도체 진입장벽 2~3년직접 생산 아님이나 CPO가 레이저 수↓·가치를 패키징으로 이동(높음)
리타이머 선두 · Astera Labs80AI 서버 탑재율 >80%·차세대(PCIe Gen6) 사실상 유일 양산·전용 SW 락인직접 생산 아님이나 CPO·개방표준·후발 진입의 장기 위협(중)
AI 이더넷 스위치 1위 · Arista75데이터센터 스위치 #1·전용 운영체제 락인·AI 백로그 큼엔비디아 Spectrum-X가 제로→11.6% 직접 침입 中(강등)
커스텀 ASIC 설계 2위 · Marvell70설계 시장 2위·신호회로+ASIC+광 통합·소수 하이퍼스케일러 집중엔비디아 $2B 투자=NVLink Fusion 통행료에 묶임 + 데이터센터 매출 76% 집중
전력관리 (AI 서버) · Monolithic Power68차세대 GPU 점유율 추정 높음·단 플랫폼별 경쟁사 분산 가능성직접 생산 아님이나 곡괭이 폭 좁음·경쟁 분산(가장 약)
GPU 본체 · NVIDIA학습90·추론67학습 90%+ 견고·추론 60~75% 갈라짐(2장)본체 자체. 단일 칩 독점은 흔들리는 곡괭이

각 곡괭이의 4조건 근거와 엔비디아 침입·이동 위협. A군이라도 안전 등급은 아니며, 강도는 침입 리스크를 깎은 값입니다. (출처: 본문 5장 데이터 종합)

곡괭이가 여러 자루로 갈라졌습니다. A군(엔비디아가 직접 생산 침입하기 어려운 물리·소재 병목)이라도 안전 등급은 아닙니다. CoWoS는 물리 공정이라 가장 안전하고, 광 레이저와 리타이머는 CPO로 곡괭이 형태가 재편되면 가치가 패키징·스위치로 이동해 한 단계 약합니다. 엔비디아가 직접 침입하는 표적(B군: 네트워킹·설계 2위)은 침입 리스크로 강등되고, 전력관리는 곡괭이 폭이 좁고 경쟁이 분산돼 가장 약한 주변부 곡괭이입니다.

5.2 핵심 분리: 곡괭이를 쥔 것 ≠ 주식이 싼 것

발굴 결과를 보면 "이 회사들을 사면 되겠다"는 결론으로 건너뛰고 싶어집니다. 그것이 정확히 이 시리즈가 매번 경계하는 함정입니다.

곡괭이를 쥐었다는 것은 "이 회사가 AI 골드러시에서 대체 불가능한 길목에 있다"는 뜻입니다. 그것이 "지금 이 주식이 싸다"는 뜻은 전혀 아닙니다. 4편에서 본 시스코의 교훈이 그대로 적용됩니다. 곡괭이를 제대로 골랐어도, 비싸게 사면 오래 잃을 수 있습니다. AI 붐으로 이 발굴된 곡괭이들의 주가는 이미 크게 올라 있을 가능성이 높습니다. 단단한 곡괭이라는 사실과 그 값이 합리적이라는 사실은 별개입니다. 가격이 합리적인지는 P/E 같은 잣대로 따로 따져야 알 수 있습니다.

여기에 7편의 교훈을 한 겹 더합니다. 가장 단단한 곡괭이일수록 동시에 가장 큰 리스크를 질 수 있습니다. 예를 들어 발굴된 회사 중 일부는 한 고객(특정 하이퍼스케일러)에게 매출의 70% 이상이 쏠려 있습니다 (고객 집중도, Hashrate Index). 그 한 고객이 자체 설계 역량을 키우거나 다른 파트너로 옮기면, 단단했던 곡괭이가 한순간에 흔들립니다. 또 자체 칩을 설계해 주는 사업은, 그 고객(하이퍼스케일러)이 바로 엔비디아의 경쟁자이기도 해서, 산업 전체가 엔비디아 독점이라는 한 변수에 함께 묶여 있습니다.

그리고 한 겹을 더 솔직하게 박습니다. 곡괭이를 쥐었다고 그것이 영속적인 곡괭이인 것도 아닙니다. 이 글의 논제 자체가 "곡괭이는 이동한다"였습니다. 그렇다면 지금 발굴한 곡괭이도 다시 이동할 수 있습니다. 두 가지 경로가 있습니다. 첫째, 기술 전환입니다. 지금 광통신과 리타이머가 쥔 곡괭이는, 5.1에서 본 CPO(광 기능을 칩 패키지 안으로 끌어들이는 차세대 방식)가 본격 대량 배포되면 가치가 패키징·실리콘 포토닉스 쪽으로 다시 이동할 수 있습니다 (CPO 가치 재편, SemiAnalysis). 둘째, 고객 내재화입니다. 자체 칩 설계의 곡괭이는 그 고객인 빅테크가 설계를 직접 쥐려는 구조라, 설계 듀오폴리의 몫이 줄어들 수 있습니다 (설계 내재화 압력, Tom's Hardware).

단 이것이 "그래서 발굴이 무의미하다"는 뜻은 아닙니다. 정반대입니다. 발굴은 "지금 누가 길목을 쥐었나"를 알려 주고, 그다음에 "이 곡괭이가 얼마나 오래갈지(전환 리스크)와 지금 값이 맞는지(가격)"를 따지는 것이 종목 분석의 일입니다. 발굴은 출발점이고, 영속성과 가격 검증이 그다음 일입니다.

그래서 이 글은 여기서 멈춥니다. 누가 곡괭이를 쥐었는지는 데이터로 답했습니다. 그 값이 합리적인지, 그 리스크가 어느 정도인지는 기업 하나하나를 따로 깊이 분석해야 알 수 있습니다. 그것이 종목 분석의 몫입니다. 그중 가장 시선이 쏠리는 GPU 본체, 엔비디아 자체가 궁금하다면 📈NVDA엔비디아 종목 분석에서 그 가격과 리스크를 따로 따져 볼 수 있고, A군 최고 곡괭이인 첨단 패키징은 📈TSMCTSMC 분석에서 가격과 지정학 리스크를 따져 볼 수 있습니다. 그리고 GPU에서 옆으로 옮겨 간 곡괭이, 즉 GPU들을 잇는 네트워킹과 그 칩을 쥔 머천트 실리콘이 궁금하다면 📈ANET아리스타 분석📈AVGO브로드컴 분석에서 각 곡괭이의 값과 침입 리스크를 따로 따져 볼 수 있습니다. 컴퓨트 독점의 구조를 더 깊이 보고 싶다면 아래 분석을 이어 보세요.

⚠️ 곡괭이를 쥔 것 ≠ 주식이 싼 것 ≠ 영속적 곡괭이

이 글은 종목 추천이 아닙니다. "누가 곡괭이를 쥐었나"(분석 결과)만 답하고, "그 값이 합리적인가"는 답하지 않습니다.

시스코의 교훈(4편): 곡괭이를 제대로 골랐어도 비싸게 사면 오래 잃는다. AI 붐으로 발굴된 곡괭이들의 주가는 이미 크게 올랐을 가능성이 높다.

7편의 교훈: 가장 단단한 곡괭이일수록 큰 리스크를 동시에 진다. 일부는 단일 고객 집중도 70%+. 그 고객이 자체 설계로 돌아서면 곡괭이가 흔들린다.

곡괭이 ≠ 영속적 곡괭이: 발굴된 곡괭이도 다시 이동할 수 있다. 광은 CPO로, 리타이머는 개방표준·CPO로, 설계는 고객 내재화로. 가격·리스크·영속성 검증은 종목 분석의 몫이다.

그래서 투자자에게 5장이 말하는 것은 8편 전체의 결론입니다. 컴퓨트는 7계층 중 처음으로 곡괭이가 흔들리는 변곡점이었습니다. 단일 칩 독점은 영원하지 않았습니다(2·3장). 그러나 곡괭이는 사라지지 않고 이동했습니다(4장). 그 이동의 끝에서 새 곡괭이를 쥔 자들을 발굴했습니다(5장). 단 변하지 않는 원칙이 있습니다. 곡괭이를 쥔 것과 그 주식이 싼 것은 다르고, 가장 단단한 곡괭이가 가장 안전한 주식인 것도 아니며, 지금 쥔 곡괭이가 영원히 그 자리인 것도 아닙니다(엔비디아가 침입하고, 기술이 전환하고, 고객이 내재화합니다). 발굴은 시작이고, 가격과 리스크와 영속성 검증이 종목 분석의 일입니다.

5장 결론: 곡괭이는 여러 자루로 갈라져 이동했고, 그 자루를 쥔 자들을 발굴했다. 단 곡괭이를 쥔 것 ≠ 주식이 싼 것 ≠ 영속적 곡괭이.

  • A군(엔비디아가 직접 생산 침입하기 어려운 물리·소재 병목): CoWoS·1.6T 광통신 레이저·리타이머. 단 A=안전등급 아님. CoWoS는 물리 공정이라 가장 안전, 광·리타이머는 CPO로 형태가 재편되면 가치가 패키징·스위치로 이동해 한 단계 약.
  • B군(엔비디아 침입 표적, 강등): AI 이더넷 스위치(엔비디아 제로→11.6% 침입)·설계 2위(NVLink Fusion 통행료). 강도에서 침입 리스크를 깎음. 설계 선두는 강도 최상위이나 침입·내재화 혼합.
  • 3중 분리: ① 곡괭이를 쥔 것 ≠ 주식이 싼 것(시스코) ② 가장 단단한 곡괭이 ≠ 가장 안전한 주식(단일 고객 70%+) ③ 곡괭이 ≠ 영속적 곡괭이(광→CPO·설계→내재화). 가격·리스크·영속성은 종목 분석에서 검증.

결론: 단일 칩 독점은 영원하지 않다. 그러나 곡괭이는 이동한다.

프롤로그에서 우리는 같은 날 뜬 두 헤드라인을 봤습니다. "엔비디아는 끝났다"와 "엔비디아는 영원하다". 이 글은 둘 다 틀렸다고 했습니다. 이제 그 이유를 데이터로 다 봤습니다.

엔비디아의 해자는 칩이 아니라 세 겹의 방어벽이었습니다(1장). CUDA 400만 개발자, NVLink로 묶인 GPU 72개, 4만 개 기관의 생태계. 칩은 따라 만들 수 있어도 이 세 겹은 못 따라 만듭니다. 그래서 "끝났다"는 틀렸습니다.

그러나 그 벽에 금이 갔습니다(2장). 학습은 90%+로 견고했지만, 추론은 60~75%로 갈라졌습니다. ROCm이 Meta·Microsoft·Oracle의 프로덕션에 들어왔고, CUDA 없는 추론이 8할 성능을 냈습니다. 그래서 "영원하다"도 틀렸습니다.

가장 이상한 일은 점유율은 내려가는데 돈은 올라간 것이었습니다(3장). 점유율 추정치는 87%에서 75%로 내려갔지만, 데이터센터 매출은 1,937억 달러로 68% 늘고 마진은 75%였습니다. 시장이 점유율 하락보다 빠르게 커졌기 때문입니다. 그래서 점유율 한 숫자로도, 매출 한 숫자로도 이 계층을 다 설명할 수 없습니다.

그리고 가장 중요한 발견이 있었습니다(4장). 곡괭이는 사라지지 않았습니다. 이동했습니다. 단일 GPU에서 시스템으로, 그리고 엔비디아 성벽 바깥의 주변부로. 커스텀 ASIC 설계, AI 네트워킹, 광통신, 리타이머, 전력관리, 패키징. 단일 칩의 독점은 흔들렸지만, AI 인프라 전체로 보면 곡괭이는 한 자루가 아니라 여러 자루로 갈라졌습니다. 이것이 이 편의 한 줄 논제였습니다. 단일 칩 독점은 영원하지 않다. 그러나 곡괭이는 사라지지 않고 이동한다.

그래서 처음 질문, "엔비디아 독점은 영원한가"에 대한 답은 이렇습니다. 엔비디아 자체는 끝나지도 영원하지도 않습니다. 단일 칩 점유율은 흔들리지만, 엔비디아는 시스템과 생태계로 곡괭이를 옮겨 가는 중입니다. 그 값이 합리적인지는 📈NVDA엔비디아를 따로 분석할 때 봅니다.

마지막으로, 그 여러 자루의 곡괭이를 쥔 자들을 발굴했습니다(5장). 단 5·6·7편에서와 똑같은 경고가 따라옵니다. 누가 곡괭이를 쥐었는지는 이 글이 답했지만, 그 값이 합리적인지(4편 시스코의 교훈)와 그 리스크가 어느 정도인지(7편의 교훈)는 기업 하나하나를 깊이 따져야 압니다.

곡괭이 (길목)강도곡괭이를 쥔 기업엔비디아 직접 침입 · 이동 위협
커스텀 ASIC 설계 + AI 네트워킹최강Broadcom (AVGO)이더넷칩에 침입 중 + 고객 내재화 압력(혼합)
첨단 패키징 (CoWoS)강 · A군 최고TSMC직접 생산 곤란(물리 공정). CPO 재편 대상 아님 → 가장 안전
1.6T 광통신 핵심 레이저강 · 한 단계 약Lumentum · Coherent직접 생산 아님이나 CPO가 레이저 수↓·가치 패키징으로 이동
리타이머 (신호 복원)강 · 한 단계 약Astera Labs (ALAB)직접 생산 아님이나 CPO·개방표준·후발 진입 위협
AI 이더넷 스위치 시스템중강Arista (ANET)엔비디아 Spectrum-X 침입 中 (제로→11.6%)
커스텀 ASIC 설계 2위중강Marvell (MRVL)NVLink Fusion 통행료에 묶임 + 데이터센터 매출 76% 집중
AI 서버 전력관리Monolithic Power직접 생산 아님이나 곡괭이 폭 좁음·경쟁 분산(가장 약)
GPU 본체 (학습)강(학습)NVIDIA (NVDA)본체 자체. 추론은 갈라짐

컴퓨트 계층의 곡괭이를 쥔 기업과 그 강도. 강도는 곡괭이(길목 장악력)의 강도이지 투자 매력도가 아닙니다. 곡괭이를 쥔 것 ≠ 주식이 싼 것 ≠ 영속적 곡괭이. 가장 단단한 곡괭이 ≠ 가장 안전한 주식. 가격·리스크·영속성은 이 글의 범위가 아닙니다(종목 추천 아님).

마지막으로, 이 글이 틀렸다고 인정해야 할 신호를 정직하게 박아 둡니다. 분석은 반증 조건을 함께 적을 때만 정직합니다. 네 가지 중 하나라도 현실이 되면, 이 글의 논제는 수정되거나 보류되어야 합니다.

첫째, 차세대 칩(Vera Rubin) 양산 이후 엔비디아의 추론 점유율이 다시 85% 이상으로 회복되면, 2장의 "추론 균열"은 변곡점이 아니라 한 세대의 일시적 상태였던 것이고, 곡괭이는 이동한 게 아니라 엔비디아로 재독점된 것입니다. 이 신호는 미래에 지켜볼 가정이 아니라 이미 발화 중입니다. 엔비디아는 GTC 2026에서 추론 리더십을 직접 표방하고 베라 루빈으로 토큰 비용을 10배 낮추겠다고 선언했습니다(2장). 그래서 우리는 이 반대 방향의 힘이 실제 점유율 회복으로 이어지는지를 가장 먼저 추적합니다.

둘째, 빅테크가 자체 칩 설계를 내재화해 설계 듀오폴리의 매출이 줄어들면, 곡괭이는 주변부로 이동한 게 아니라 어디에도 남지 않고 소멸한 것입니다. 셋째, 하이퍼스케일러 4사의 설비투자가 전년 대비 역성장으로 돌아서면, 4장의 전제(돈은 줄지 않는다)가 깨지고 모든 곡괭이가 동반 약화됩니다. 넷째, 차세대 광학(CPO)의 채택 비율이 2027년 15% 이상으로 빠르게 올라오면, 발굴한 광통신·리타이머 곡괭이의 가치가 패키징 쪽으로 다시 이동해 그 발굴의 영속성이 약해집니다.

방향 힌트를 하나만 남깁니다(종목 추천이 아니라 탐색의 방향입니다). 이미 모두가 보는 GPU 본체보다, 그 곡괭이가 이동해 간 주변부, 그중에서도 엔비디아가 자본으로도 따라 들어오기 어려운 물리·소재 병목(첨단 패키징·고속 광소자·리타이머)일수록 들여다볼 가치가 큽니다. 반대로 엔비디아가 직접 침입 중인 네트워킹이나 통행료에 묶인 길목은, 점유율이 강해 보여도 침입 리스크를 함께 봐야 합니다. 시장이 엔비디아만 쳐다보는 동안 곡괭이는 조용히 옆으로 번졌지만, 엔비디아의 손도 그 옆으로 따라가고 있기 때문입니다.

분명히 해둡니다. 이 글은 어느 회사를 사라는 글이 아닙니다. 누가 컴퓨트 계층의 길목을 쥐었는지를 보여줄 뿐, 지금 그 값과 그 리스크가 맞는지는 종목 분석의 몫입니다. 발굴은 출발점입니다. 그리고 출발점에 서 있다는 것이 이 글의 값입니다. 시장이 온통 엔비디아 한 종목만 쳐다보는 동안, 우리는 그 옆자리에서 조용히 단단해진 곡괭이들을 먼저 지도에 올렸습니다. 그 지도를 손에 쥐었다는 것, 그것이 이 글이 남기는 것입니다.

이제 1달러의 여정에서 다음 칸으로 올라갑니다. 칩을 설계했고(6편), 실리콘으로 깎았고(7편), 그 칩이 AI 연산을 수행하는 컴퓨트가 됐다면(8편), 이제 그 위에서 누군가가 땅을 깔고 임대료를 걷기 시작합니다. AI 모델을 빌려주고, 클라우드를 빌려주고, 플랫폼을 깔아 그 위에서 일어나는 모든 거래에서 통행료를 떼는 자들입니다. 다음 편의 주제입니다.

📖 다음 편 예고: 9편 「플랫폼: AI의 대지주」

칩을 설계하고(6편), 깎고(7편), 연산하는 컴퓨트(8편)까지 봤다면, 이제 그 컴퓨트 위에 누가 땅을 깔고 임대료를 걷는지가 남았습니다. 클라우드는 부동산이고, 한번 들어오면 이사 비용이 커서 좀처럼 떠나지 않는다고들 합니다. 그 대지주가 이제 도구까지 만들기 시작했습니다. 컴퓨트 위에 누가 땅을 깔고 임대료를 걷는가를 다음 편에서 해부합니다.

컴퓨트: 한 장 요약

컴퓨트는 7계층 중 처음으로 곡괭이가 흔들리는 변곡점이다. 단일 칩 독점은 영원하지 않다. 그러나 곡괭이는 사라지지 않고 이동한다.

  • 엔비디아의 해자는 칩이 아니라 CUDA(개발자 400만)·NVLink(GPU 72개)·생태계 3중 방어벽이다. 칩은 따라 만들어도 세 겹은 못 따라 만든다.
  • 그 벽에 금이 갔다: 학습은 90%+로 견고하나 추론은 60~75%로 갈라짐(ROCm 프로덕션 진입·CUDA 없는 추론 8할 성능).
  • 역설: 점유율은 내려가는데(추정 87%→75%) 매출은 +68%·마진 75%. 시장이 점유율 하락보다 빠르게 크기 때문.
  • 곡괭이의 이동: 단일 GPU → 시스템 → 주변부(커스텀 ASIC 설계 ~95% 2사·네트워킹·1.6T 광통신·리타이머 80%+·전력·CoWoS). 단 엔비디아도 따라온다(이더넷 스위치 제로→11.6% 침입·NVLink Fusion 통행료). 진짜 안전한 곡괭이는 엔비디아가 못 따라오는 물리·소재 병목(A군: CoWoS가 최고).
  • 핵심 분리: 곡괭이를 쥔 것 ≠ 주식이 싼 것 ≠ 영속적 곡괭이. 가장 단단한 곡괭이 ≠ 가장 안전한 주식. 다음 편은 9편 「플랫폼: AI의 대지주」.
관련 개념
🏰해자Economic Moat📈P/E주가수익비율🏗️Capex자본적 지출
추천 글
필연의 줄기
제조: 칩을 깎는 자가 세계를 지배한다
직전 칸인 제조에서 가장 단단한 곡괭이가 곧 가장 안전한 주식은 아니라는 교훈을, 컴퓨트가 그대로 이어받습니다
필연의 줄기
AI 밸류체인 7계층: 가치는 어디로 흐르는가
컴퓨트가 전체 AI 밸류체인 7계층 지도의 어디에 있는지, 가치가 어느 칸으로 흐르는지 투자 지도 전체를 다시 펼쳐봅니다
필연의 열매
엔비디아 종목 분석
이 글이 '끝나지도 영원하지도 않다'고 본 엔비디아를, 실제 종목 분석에서 CUDA 해자와 가격까지 따져 확인해보세요