GPU 독점은 영원한가? AI 컴퓨팅의 미래

핵심 요약

NVIDIA는 AI 학습용 GPU 시장의 90% 이상을 점유하며, 하드웨어 통합(NVLink 3,600GB/s), $130B 매출 기반 규모의 경제, 2년 주기 아키텍처 리드가 복합 해자를 형성한다. 그러나 추론 시장에서는 Google TPU, Amazon Trainium, Meta MTIA 등 특화 ASIC이 30~40% 낮은 비용으로 침식 중이며, 추론 점유율은 2022년 85%에서 2028년 55%로 하락이 예상된다. 핵심은 AI 칩 시장이 연 33% 성장하므로, 점유율이 떨어져도 NVIDIA 절대 매출은 2028년까지 2.9배 증가할 수 있다는 점이다.

공장과 도시를 비교해보겠습니다.

범용 공장은 무엇이든 만들 수 있습니다. 자동차도, 가전도, 로봇 부품도. 주문이 다양하고 예측 불가능할 때, 범용 공장이 이깁니다. 반면 특화 전문점 도시는 하나의 물건만 만들되, 그것을 극도로 싸고 빠르게 만듭니다. 수백만 명이 같은 물건을 원할 때, 전문점이 이깁니다.

🏭 범용 공장 (GPU)

어떤 AI 모델이든 실행 가능

유연성이 핵심 가치

새 모델이 나와도 재설계 불필요

비용: 높지만 범용적

🏘️ 특화 전문점 (ASIC)

특정 모델에 최적화된 칩

효율성이 핵심 가치

모델이 바뀌면 재설계 필요

비용: 대량 생산 시 매우 저렴

NVIDIA GPU는 AI 세계의 범용 공장입니다. 지난 10년간 AI 모델이 계속 바뀌었고, 어떤 모델이든 돌릴 수 있는 GPU가 승리했습니다. 그 결과 NVIDIA는 AI 학습용 칩 시장의 90% 이상을 점유하게 되었습니다. (CarbonCredits)

그런데 지금, 상황이 바뀌고 있습니다. AI 추론 시장에서 "수백만 명이 같은 모델을 사용하는" 패턴이 등장했습니다. ChatGPT, Claude, Gemini. 모두가 같은 물건을 원하기 시작한 겁니다. 전문점(ASIC)이 유리해지는 조건이 형성되고 있습니다.

이 글은 하나의 질문에 답합니다: NVIDIA의 GPU 독점은 영원한가?

소프트웨어 생태계(CUDA)의 관점은 별도 글에서 다뤘습니다. 이 글은 하드웨어 아키텍처, 경제 구조, 지정학의 관점에서 독점의 유지와 침식을 분석합니다.

🔬CUDA 생태계 심층 분석

NVIDIA의 소프트웨어 해자를 구성하는 CUDA 생태계의 구조와 경쟁 역학을 분석합니다

→

1. 독점의 세 기둥: 소프트웨어 너머의 해자

NVIDIA의 독점을 설명할 때 대부분의 사람들은 CUDA를 언급합니다. 맞는 말이지만, 절반만 맞습니다. CUDA는 "떠나기 어려운 이유"를 설명하지만, "왜 처음부터 이겼는가"는 설명하지 못합니다. 진짜 해자는 세 기둥으로 구성됩니다.

🔧 하드웨어 통합칩+네트워크+시스템

📈 규모의 경제$130B 매출→R&D 재투자

👥 인재 풀하드웨어 설계+TSMC 협업

1.1 하드웨어 통합의 힘: 칩만 파는 게 아니다

엔비디아는 GPU 칩만 파는 회사가 아닙니다. 칩(B200) + 칩 간 연결(NVLink) + 스위치(NVSwitch) + 서버(DGX/HGX) + 네트워크(Spectrum-X)까지, AI 데이터센터의 전체 스택을 제공합니다.

이것이 왜 중요한지 NVLink의 진화를 보면 알 수 있습니다.

NVLink 진화

2014

NVLink 1.0

160 GB/s

→

2017

NVLink 2.0

300 GB/s

→

2020

NVLink 3.0

600 GB/s

→

2022

NVLink 4.0

900 GB/s

→

2024

NVLink 5.0

1,800 GB/s

→

2026

NVLink 6.0

3,600 GB/s

출처: NVIDIA NVLink, Wikipedia

12년 만에 대역폭이 22.5배 증가했습니다. 이 수치가 중요한 이유는, AI 모델이 커질수록 여러 GPU가 협력해야 하고, GPU 간 통신 속도가 전체 성능을 결정하기 때문입니다. NVLink 6.0은 PCIe Gen6 대비 14배 이상 빠릅니다.

AMD나 Intel은 칩만 제공합니다. 서버 구성은 OEM(Dell, HPE 등)에 의존하고, 네트워크는 별도 벤더를 써야 합니다. NVIDIA는 전체를 하나의 시스템으로 설계하기 때문에, 100,000개 GPU를 연결하는 초대형 클러스터에서 통합 성능 격차가 극대화됩니다.

xAI의 Colossus 클러스터(10만 GPU)와 Meta의 전체 인프라가 Spectrum-X 이더넷을 채택한 것이 이를 증명합니다. Spectrum-X만으로 연간 환산 매출이 $10B을 돌파했습니다. (NVIDIA Newsroom)

1.2 규모의 경제: $130B 매출이 만드는 선순환

NVIDIA FY2025 매출은 $130.5B입니다. 이 규모가 만드는 선순환이 경쟁자를 구조적으로 밀어냅니다.

R&D 투자 비교 (FY2025)

$12.9B

$5.7B

$16.5B

NVIDIA FY2025

AMD FY2025

Intel FY2024

출처: 출처: StockAnalysis (NVDA), AMD IR. Intel R&D는 FY2024 10-K 기준 추정치.

흥미로운 점은 Intel이 R&D를 더 많이 쓰지만, AI 칩에서는 존재감이 미미하다는 것입니다. R&D 투자의 효율성, 즉 "어디에 쓰느냐"가 더 중요합니다. NVIDIA는 R&D의 대부분을 AI 가속기와 네트워킹에 집중하고, FY2026에는 $18.5B로 더 늘릴 계획입니다.

규모의 경제는 또 다른 방식으로 작동합니다. NVIDIA가 TSMC의 CoWoS 패키징 물량을 대량 선점합니다. CoWoS는 HBM을 GPU 다이 위에 올리는 첨단 패키징 기술인데, 생산 능력이 제한적입니다. NVIDIA가 대부분을 가져가면, AMD나 Google은 물량 확보에 어려움을 겪습니다.

결과적으로 NVIDIA는 2년 주기로 새 아키텍처를 출시합니다(Ampere→Hopper→Blackwell→Rubin). 경쟁사는 구조적으로 항상 1세대 뒤처집니다.

1.3 인재 풀과 연구 생태계

CUDA 생태계 글에서 450만 소프트웨어 개발자를 다뤘습니다. 여기서 주목할 것은 하드웨어 인재입니다.

NVLink/NVSwitch를 설계하는 팀, TSMC와 CoWoS-L 첨단 패키징을 공동 개발하는 팀, Spectrum-X 네트워킹 아키텍트. 이들은 10년 이상의 축적된 경험을 가지고 있으며, 경쟁사가 채용으로 해결할 수 있는 문제가 아닙니다.

NVIDIA의 interconnect 관련 특허 포트폴리오는 경쟁사가 유사한 기술을 개발하는 것 자체를 법적으로 제한합니다. 학술 분야에서도 GTC(GPU Technology Conference)를 통한 연구 파트너십이 기술 생태계를 강화합니다.

해자(Economic Moat) 완전 해설

2. 추론 시장의 구조적 분화: 균열이 시작되는 곳

독점이 깨진다면 어디서부터 깨질까요? 답은 명확합니다. 추론(Inference) 시장입니다. 훈련과 추론은 근본적으로 다른 경제학을 따릅니다.

2.1 훈련과 추론은 다른 경제학이다

🎓 훈련 (Training)

목표: FLOPS/$ 극대화

워크로드: 매번 다른 모델, 다른 구조

유연성이 핵심 (GPU 유리)

기간: 수주~수개월 1회성

전력: 비용보다 속도 우선

⚡ 추론 (Inference)

목표: $/token 최소화

워크로드: 동일 모델 수백만 번 반복

효율성이 핵심 (ASIC 유리)

기간: 24/7 상시 운영

전력: 비용이 최대 변수

훈련은 "다음에 어떤 모델을 만들지 모르는" 상황입니다. Transformer일 수도, Mixture-of-Experts일 수도, 완전히 새로운 구조일 수도 있습니다. 이 불확실성 앞에서 범용 GPU는 안전한 선택입니다.

추론은 정반대입니다. "이미 만들어진 하나의 모델을 수백만 사용자에게 서빙"하는 상황입니다. ChatGPT가 매일 수억 건의 요청을 처리할 때, 매 요청마다 같은 연산을 반복합니다. 이 반복적이고 예측 가능한 워크로드에서는, 그 연산만 극도로 잘 하는 특화 칩(ASIC)이 범용 GPU보다 효율적일 수 있습니다.

전력 소비가 이 차이를 극적으로 드러냅니다. NVIDIA B200의 TDP는 1,000W, 풀로드 시 1,200W 이상입니다. 추론에 특화된 칩은 같은 처리량을 절반 이하의 전력으로 달성할 수 있도록 설계됩니다. 데이터센터에서 전기료는 가장 큰 운영비이므로, 이 차이는 직접적인 비용 차이로 이어집니다.

2.2 하이퍼스케일러의 산술: 왜 자체 칩을 만드는가

Google, Amazon, Meta, Microsoft. 이 네 회사의 2026년 예상 설비투자(Capex)를 합산하면 $700B 이상입니다. (Tom's Hardware)

이 규모에서 10%의 비용 절감은 $70B입니다. 자체 칩 개발에 수십억 달러를 투자할 충분한 동기가 됩니다.

💡 핵심 산술:

GPU 1대 = ~$50,000 × 수백만 대 = 수천억 달러. Custom ASIC은 NRE(비반복 엔지니어링 비용) $수억을 투자하면, 대당 $15,000~20,000 수준까지 내려갑니다. 규모가 클수록 ASIC이 유리합니다.

결정적 인사이트는 이것입니다: 2026년 기준 추론 요청의 대부분은 소수의 대형 모델(GPT, Claude, Gemini 등)에 집중됩니다. "추론의 80%가 동일한 3개 모델을 실행한다"는 상황에서, 범용성은 낭비입니다. 그 3개 모델에 최적화된 ASIC이 경제적으로 우월합니다.

2.3 시장 점유율 이동의 비대칭

이것이 핵심입니다. 독점의 침식은 균일하지 않습니다. 훈련과 추론에서 완전히 다른 패턴이 나타납니다.

훈련 시장 점유율

90%+

~88%

2022

2024

2026E

2028E

추론 시장 점유율

~85%

~70%

~62%

~55%

2022

2024

2026E

2028E

출처: SiliconAnalysts, PatentPC. 2028E는 업계 복수 추정치 종합.

훈련 시장에서 NVIDIA의 점유율은 거의 움직이지 않습니다. Blackwell과 Rubin이 연달아 출시되면서 오히려 기술 격차가 벌어지고 있습니다. 반면 추론 시장에서는 2022년 85%에서 2028년 55% 수준까지 하락이 예상됩니다.

💡 핵심: 점유율 하락 ≠ 매출 하락. AI 칩 전체 시장이 연 33% CAGR로 성장하므로, NVIDIA의 절대 매출은 점유율이 떨어져도 증가합니다. 2024년 $130B → 2028년 $350B+ 가능. (Precedence Research)

이것이 "비대칭 침식"의 핵심입니다. NVIDIA 투자자에게 "점유율이 떨어진다"는 뉴스는 공포를 일으키지만, 실제 재무 성과는 시장 성장이 점유율 하락을 상쇄하고도 남을 수 있습니다.

3. 도전자들의 하드웨어 전략

CUDA 생태계 글에서 도전자들을 소프트웨어 관점으로 요약했습니다. 이 챕터에서는 각 플레이어의 하드웨어 아키텍처, 재무 규모, 구조적 한계를 깊이 파겠습니다.

3.1 Google TPU: 범용을 버리고 효율을 택하다

Google의 선택은 명쾌합니다. "우리 모델(Gemini)을 가장 효율적으로 돌리는 칩을 우리가 만든다." 범용성을 포기하고 Transformer 아키텍처에 특화된 명령어 세트를 설계합니다.

최신 TPU v6(Trillium)의 성능:

항목	TPU v6 (Trillium)	vs 이전 세대
컴퓨트	v5e 대비 4.7배	Gemma 2-27b 학습 4x 향상
전력 효율	67%+ 개선	같은 성능을 1/3 전력으로
ICI 대역폭	v5e 대비 2배	대규모 클러스터 효율 개선
클러스터 규모	91 ExaFLOPs	v5p 최대의 4배
가격-성능비	v5e 대비 2.1배	v5p 대비 2.5배

출처: Google Cloud Blog, Google Cloud Docs

Gemini가 TPU에서 학습된다는 사실은 중요합니다. 세계 최대 AI 모델 중 하나가 NVIDIA 없이 훈련된다는 것은, "NVIDIA 없이는 학습이 불가능하다"는 명제가 이미 깨졌음을 의미합니다.

한계: TPU는 외부에 판매되지 않습니다. Google Cloud 내부 + GCP 고객만 사용 가능합니다. NVIDIA처럼 "아무 회사나 구매"할 수 없으므로, 시장 점유율 계산에서 한정적 영향을 미칩니다.

3.2 Amazon Trainium: 가격-성능의 정면 승부

Amazon의 전략은 Google과 다릅니다. "NVIDIA보다 30~40% 더 싸게 같은 일을 한다"는 가격-성능 우위를 정면으로 내세웁니다.

Amazon Trainium 로드맵

2022

Trainium1

1세대, 제한적 성능

→

2024.12

Trainium2

96GB HBM3e 50만 칩 배포

→

2025.12

Trainium3

3nm, 2.52 PFLOPs 144GB HBM3e

→

2027E

Trainium4

NVLink Fusion NVIDIA와 공존

출처: TechCrunch, Amazon

Trainium3가 특히 주목할 점은 2.52 PFLOPs/chip이라는 성능입니다. NVIDIA B200의 단일 칩 FP8 성능이 ~4.5 PFLOPs이므로, 직접 비교하기는 어렵지만 상당한 수준까지 접근한 것입니다. 3nm 공정 채택으로 전력 효율에서 우위를 노립니다.

더 흥미로운 것은 Trainium4의 NVLink Fusion 지원입니다. NVIDIA의 독점 인터커넥트인 NVLink를 Amazon 칩이 지원한다는 것은, "대체"가 아닌 "공존" 전략으로의 전환을 의미합니다. 하나의 서버 안에서 NVIDIA GPU와 Trainium 칩이 함께 작동하는 미래가 열립니다.

Project Rainier: Anthropic의 Claude 모델 학습에 전용으로 투입되는 50만 칩 규모의 Trainium2 클러스터입니다. 2025년 10월 가동. AI 학습에서 NVIDIA가 아닌 칩이 "세계 최대 모델 중 하나"를 학습시키는 두 번째 사례(첫 번째는 Google TPU + Gemini)입니다. (TechCrunch)

3.3 Meta MTIA: 추론 전용 설계의 극단

Meta의 접근은 가장 극단적입니다. "추론 워크로드에서 GPU는 과잉 설계"라는 판단 하에, 추론에만 특화된 칩을 4세대에 걸쳐 빠르게 진화시킵니다.

세대	시기	용도	성능 (vs MTIA 300)
MTIA 300	양산 중	랭킹, 추천	기준
MTIA 400	2025 배포	+GenAI 추론	컴퓨트 향상
MTIA 450	2027 초	GenAI 추론 최우선	HBM 대역폭 2x
MTIA 500	2027 후반	GenAI 추론+훈련	컴퓨트 25x, HBM 4.5x

출처: Meta AI Blog

2년 안에 컴퓨트 25배, HBM 대역폭 4.5배 증가. 이 속도가 가능한 이유는 모듈형 칩렛(chiplet) 구조 때문입니다. MTIA 400/450/500이 동일한 랙과 네트워크 인프라를 공유하므로, 칩만 교체하면 됩니다. 데이터센터 재설계가 불필요합니다.

Meta의 의의: Facebook/Instagram의 추천 알고리즘과 랭킹은 이미 MTIA에서 돌아갑니다. GPU 없이 작동하는 대규모 AI 워크로드가 실제로 존재한다는 것을 증명한 사례입니다.

3.4 Broadcom: 커스텀 ASIC의 미드필더

Google, Amazon, Meta가 직접 칩을 설계한다면, Broadcom은 그 설계를 도와주는 회사입니다. 축구로 치면 "골을 넣지는 않지만, 모든 골을 어시스트하는 미드필더"입니다.

Broadcom AI ASIC 사업 규모

항목	수치
FY2025 AI 반도체 매출	$20B
AI 백로그	$73B+
주요 고객	6곳 (Google, Meta, OpenAI, Anthropic, Apple 등)
커스텀 AI 가속기 설계 시장 점유	70%+
CEO 목표 (FY2027)	$100B
Google TPU 파트너십	2031년까지 장기 계약

출처: Broadcom FY2025 Earnings, TechBuzz

Broadcom의 FY2027 $100B 목표가 실현된다면, 이는 NVIDIA의 현재 데이터센터 매출($115B)에 거의 도달하는 수준입니다. 물론 Broadcom 칩은 하이퍼스케일러 내부에서만 사용되므로 직접 경쟁은 아니지만, "NVIDIA를 거치지 않는 AI 칩 생태계"가 빠르게 커지고 있음을 보여줍니다.

Bloomberg Intelligence는 Custom ASIC 시장이 2024년 전체의 8%에서 2033년 19%로 성장할 것으로 전망합니다. NVIDIA 점유율이 동일한 비율만큼 줄어든다는 의미입니다.

4. 지정학이 만드는 새로운 변수

기술과 경제만으로는 설명할 수 없는 변수가 있습니다. 미국의 수출 규제, 중국의 자체 개발, 각국의 "소버린 AI" 전략. 지정학은 NVIDIA 독점의 구조를 외부에서 강제로 변형시킵니다.

4.1 미국 수출 규제: $17B 매출이 흔들리는 구조

NVIDIA FY2025 중국 매출은 $17.1B(전체의 13.1%)입니다. 이 매출이 규제에 의해 흔들립니다. (CNN)

미국 수출 규제 타임라인

2024.01

FDPR 확대

HBM·DRAM 통제 추가

→

2025.01

AI Diffusion Rule

3-tier 국가 분류

→

2025.04

H20 수출 금지

$4.5B 손상차손

→

2025.07

H20 판매 재허용

15% 납부 조건

→

2026.01

BIS 최종 규정

케이스별 허가 전환

출처: Wikipedia, Built In, Willkie

규제는 금지와 허용 사이를 오갑니다. 2025년 4월 H20 금지 → 7월 재허용 → 12월 H200 승인 → 2026년 케이스별 허가. 이 불확실성 자체가 NVIDIA에 리스크입니다. 고객(중국 기업)은 언제 공급이 끊길지 모르니, 대안을 찾게 됩니다.

Jensen Huang은 중국 AI 시장을 $50B 기회로 봅니다. (Fortune) 그러나 이 기회의 상당 부분은 규제에 의해 접근 불가능하거나, 접근하더라도 15% 수수료를 미국 정부에 납부해야 합니다.

⚠️ 역설: 수출 규제는 단기적으로 NVIDIA 매출을 줄이지만, 장기적으로 더 위험합니다. 중국이 "어차피 NVIDIA를 못 쓰니 자체 개발하겠다"는 결론에 도달하게 만들기 때문입니다. 규제가 경쟁자를 만드는 구조입니다.

4.2 중국의 자체 칩 전략: 화웨이 Ascend

화웨이 Ascend 910B/910C는 중국의 AI 칩 자주권을 상징하는 제품입니다. SMIC 7nm 공정으로 제조되며, NVIDIA H100 대비 2-3세대 뒤처지는 것으로 평가됩니다.

성능 차이에도 불구하고, 중국 내에서는 빠르게 채택되고 있습니다. ByteDance, Alibaba, Tencent 등 주요 기업들이 Ascend를 도입하고, 화웨이의 MindSpore 프레임워크 생태계도 성장 중입니다.

핵심 판단: Ascend의 현재 성능은 최첨단 학습에는 부족하지만, 추론에는 "충분"합니다. 중국 내 수억 사용자를 대상으로 한 AI 서비스 추론은, 최첨단 칩 없이도 운영 가능합니다. 이것이 중국 시장에서 NVIDIA의 추론 점유율을 장기적으로 잠식합니다.

4.3 소버린 AI: 국가별 칩 전략의 부상

"소버린 AI(Sovereign AI)"란 각 국가가 자국 내에 독립적인 AI 인프라를 구축하려는 움직임입니다. AI가 국가 안보와 경제의 핵심이 되면서, "미국 기업(NVIDIA)에 의존하고 싶지 않다"는 수요가 생깁니다.

🇺🇸

미국

CHIPS Act $52.7B · 국내 생산 인센티브

🇨🇳

중국

화웨이 Ascend · 완전 자급 목표

🇪🇺

EU Chips Act €43B · 20% 글로벌 생산 목표

🇸🇦

중동

수백억 달러 AI 투자 · NVIDIA DGX Cloud 채택

역설적으로, 소버린 AI 트렌드는 단기적으로 NVIDIA에 유리합니다. 각국이 자체 AI 인프라를 구축할 때, 가장 빠르고 안전한 선택은 NVIDIA DGX를 구매하는 것이기 때문입니다. 자체 칩 개발은 5-10년이 걸리지만, DGX는 지금 당장 설치 가능합니다.

그러나 장기적으로는 위협입니다. 각국이 자체 역량을 키우면, 10년 뒤에는 NVIDIA를 거치지 않는 AI 인프라가 곳곳에 존재하게 됩니다.

5. 독점이 깨지는 시나리오 vs 유지되는 시나리오

지금까지의 분석을 종합하여, 투자자가 실제로 사용할 수 있는 구조적 프레임워크를 제시합니다.

5.1 독점 유지 시나리오: 훈련은 난공불락

독점 유지 조건

Rubin(2026) → Rubin Ultra(2027)로 2년 리드 유지

100K+ GPU 클러스터에서 NVLink/NVSwitch 통합 우위 심화

TensorRT/NIM으로 추론 $/token 경쟁력도 확보

AI 모델 구조 다변화 → 범용 GPU의 유연성 가치 상승

ASIC 팀도 NVIDIA로 벤치마크 → 간접 수혜

독점 침식 조건

"Good enough" ASIC이 40% 낮은 비용으로 추론 볼륨 확보

UCIe 칩렛 표준 성숙 → 모듈형 실리콘 → 통합 우위 약화

하이퍼스케일러 학습에서도 자체 칩 사용 (TPU→Gemini 선례 확산)

Transformer 구조 고착 → 특화 ASIC의 효율 우위 유지

수출 규제로 중국 시장 영구 이탈

훈련 시장에서 NVIDIA를 밀어내는 것이 왜 어려운지 정리하면:

Rubin(2026)은 단일 칩 50+ PFLOPS(FP4), Rubin Ultra(2027)는 100+ PFLOPS로 예고되어 있습니다. 이 성능에 NVLink 6.0(3.6TB/s)과 NVSwitch 5.0의 비차단 패브릭이 결합되면, 100,000개 GPU를 하나의 거대한 컴퓨터처럼 연결하는 것은 NVIDIA만 가능합니다.

경쟁사가 이를 복제하려면, "칩 성능"만이 아니라 "인터커넥트 + 스위치 + 시스템 + 소프트웨어" 전체를 동시에 갖춰야 합니다. 단일 요소의 우위로는 불가능한 구조입니다.

5.2 독점 침식 시나리오: 추론이 갈라진다

반면 추론 시장은 구조적으로 침식에 취약합니다.

추론은 "클러스터 규모"가 핵심이 아닙니다. 단일 서버 또는 소규모 클러스터에서 동작하며, GPU 간 초고속 통신보다는 칩당 효율이 중요합니다. NVLink의 통합 우위가 작동하지 않는 영역입니다.

"Good enough" ASIC이 NVIDIA GPU 대비 30-40% 저렴한 $/token을 제공한다면, 대규모 추론 워크로드의 경제적 선택은 ASIC이 됩니다. Meta는 이미 자사 추천 시스템을 MTIA에서 운영하고 있으며, Google의 검색 추론은 TPU에서 작동합니다.

UCIe(Universal Chiplet Interconnect Express) 칩렛 표준도 장기적 위협입니다. 이 표준이 성숙하면, 여러 벤더의 칩렛을 레고처럼 조합하여 커스텀 프로세서를 만들 수 있게 됩니다. NVIDIA의 "전체 시스템을 우리가 제공한다"는 통합 전략의 가치가 줄어듭니다.

5.3 투자자를 위한 해자 점검표: 5가지 모니터링 시그널

이 5가지를 주기적으로 체크하면, NVIDIA 해자의 변화를 조기에 감지할 수 있습니다.

① NVIDIA 추론 점유율이 50% 이하로 하락하는가?

현재: ~62-70%. 아직 안전 구간이나 하락 추세 중.

② 하이퍼스케일러가 학습에서도 NVIDIA를 대체하는가?

현재: Google(TPU→Gemini)과 Amazon(Trainium→Claude) 선례 등장. 아직 소수.

③ UCIe 칩렛 표준이 3개+ 벤더에서 채택되는가?

현재: 표준 제정 중. 상용 제품 아직 초기.

④ Broadcom AI ASIC 매출이 $50B를 돌파하는가?

현재: $20B. CEO 목표 FY2027 $100B이나 2.5배 필요.

⑤ 중국 Ascend 생태계가 성능 동등을 달성하는가?

현재: 2-3세대 뒤처짐. 추론에는 충분하나 학습 격차 큼.

5개 중 4개가 🟢(안전)입니다. ②만 🟡(주의). 이 상태가 "3개 이상 🟡 또는 🔴"로 전환되면, NVIDIA의 해자에 구조적 변화가 시작된 것으로 판단합니다.

6. 비대칭 미래: 2028년 지형도

6.1 시장 지형 예측: 훈련 90% + 추론 55%

종합하면, 2028년 AI 칩 시장의 예상 구조는 다음과 같습니다.

AI 칩 시장 구조 예측

NVIDIA

2024 $100B

2026E $200B

2028E $350B

NVIDIA

Custom ASIC

AMD + 기타

출처: Precedence Research, SiliconAnalysts, Yole Group. 2028E는 TAM 33% CAGR + 점유율 추세 기반 자체 추정.

핵심 수치를 정리하면:

AI 칩 TAM: $100B(2024) → $200B(2026E) → $350B(2028E)
NVIDIA 절대 매출: $80B → $150B → $228B (점유율 떨어져도 매출 2.9배)
Custom ASIC: $8B → $26B → $67B (8.4배 성장)
AMD + 기타: $12B → $24B → $56B

"점유율이 떨어지니까 팔아야 한다"는 단순한 결론이 왜 위험한지 보여주는 수치입니다. 시장 성장이 충분히 빠르면, 점유율 하락과 매출 성장은 공존할 수 있습니다.

6.2 투자자가 주목해야 할 시간표

시점	이벤트	투자 시사점
2026 H2	AMD MI400 + AWS Trainium3 출시	NVIDIA Blackwell과 첫 정면 대결. 성능/가격 비교 주목
2027 초	NVIDIA Rubin Ultra + Meta MTIA 500	훈련 격차 유지 여부 확인. MTIA의 추론 대체 규모 주목
2027 후반	Trainium4 (NVLink Fusion) 출시	'공존' 모델 현실화. GPU+ASIC 하이브리드 시대 개시
2028	추론 시장 > 훈련 시장 (규모 역전)	ASIC 유리한 시장이 더 커짐. 추론 점유율 추이 결정적

2026년 하반기가 첫 번째 분수령입니다. AMD MI400(CDNA 5, 2nm, 20 PFLOPs FP8)과 Trainium3(3nm, 2.52 PFLOPs)가 NVIDIA Blackwell과 동시에 시장에 존재하는 최초의 시점입니다. 이때의 벤치마크와 고객 채택률이 향후 3년의 경쟁 구도를 결정합니다.

GPU 독점의 미래는 '전부 아니면 전무'가 아니라, '영역별 분화'다

훈련 시장에서 NVIDIA의 독점은 2028년까지 난공불락입니다. 하드웨어 통합(NVLink/NVSwitch) + 규모의 경제 + 2년 주기 리드가 복합 해자를 형성합니다.
추론 시장은 구조적으로 침식됩니다. "같은 모델을 반복 실행"하는 워크로드에서 특화 ASIC의 비용 우위는 극복하기 어렵습니다.
그러나 "점유율 하락 = 투자 실패"는 아닙니다. 시장 자체가 33% CAGR로 성장하므로, NVIDIA 절대 매출은 2028년까지 $228B+(현재의 2.9배)에 도달할 수 있습니다.
5가지 모니터링 시그널 중 3개 이상이 🟡/🔴로 전환되면, 해자의 구조적 변화로 재평가가 필요합니다. 현재는 4/5가 🟢입니다.

이 분석을 다루는 종목

엔비디아

엔비디아 주식 심층 분석

엔비디아(NVDA) FY2026 매출 $216B, 영업이익률 60%. AI칩 90% 독점의 구조를 제품·재무...

→