엔비디아 시스템 통합: DGX에서 AI Factory까지
칩 $40K → 시스템 $500K+ 객단가 전략. DGX vs Dell/HPE OEM 경쟁, 하이퍼스케일러 자체 설계 위협
엔비디아 시스템 통합은 GPU 칩 $40K를 DGX 서버 $500K+, NVL72 랙 $2~3M으로 확대하여 객단가를 13~50배 끌어올리는 매출 레버리지 전략이다. DGX 직접 판매, HGX-OEM 납품, ODM 직접 발주 세 경로 모두에서 핵심 부품(GPU+HGX 보드)은 NVIDIA에서 공급되며, 8년간 AI 연산 성능이 8,470배 향상되었다. 수냉 필수화(120kW 랙)가 턴키 시스템의 복잡도 프리미엄을 높이고 있어, 하이퍼스케일러 자체 칩이 보험에 그치는 한 시스템 레버리지는 확대될 전망이다.
엔진을 사시겠습니까, 완성차를 사시겠습니까
자동차 엔진만 따로 팔면 얼마일까요? 고성능 엔진 하나에 수백만 원입니다. 그런데 이 엔진을 차체에 넣고, 변속기를 달고, 전자장치를 연결하고, 에어컨까지 붙여서 완성차로 팔면? 수천만 원입니다. 같은 엔진인데 가격이 10배 뜁니다.
NVIDIA의 시스템 사업이 정확히 이 구조입니다. GPU 칩(엔진) 하나는 $40,000입니다. 이걸 서버(완성차)에 8개 넣고 NVLink로 연결하고 소프트웨어를 깔면? $515,000짜리 DGX B200이 됩니다. GPU 72개를 수냉 랙 하나에 통째로 담으면? 수백만 달러짜리 GB200 NVL72가 됩니다. 객단가가 13배에서 50배 이상 뜁니다.
💡 핵심: 칩만 파는 회사와 시스템을 파는 회사는 완전히 다른 비즈니스입니다. NVIDIA는 GPU $40K를 DGX $500K+로 바꾸고, 그 위에 AI Enterprise 구독료까지 얹는 구조입니다. 이 글은 그 구조가 어떻게 진화했고, 어디가 강하고, 어디가 약한지를 해부합니다.
📈NVDA엔비디아 본문에서는 시스템 통합을 4개 기술 축 중 하나로 개요 수준에서 다뤘습니다. 이 글은 그 안으로 깊이 들어갑니다. DGX가 8년간 어떻게 진화했는지, 실제로 NVIDIA 매출의 어디서 돈이 벌리는지, 수냉 혁명이 왜 턴키 시스템의 가치를 높이는지, 그리고 하이퍼스케일러의 자체 설계가 정말 위협인지를 데이터로 검증합니다.
1. DGX의 진화: $129K 연구장비에서 $3M AI 공장 벽돌로
1.1 8년, 7세대, 8,470배
2016년 4월, 젠슨 황은 GTC에서 "세계 최초의 AI 슈퍼컴퓨터"를 공개하며 1호기를 직접 OpenAI에 전달했습니다. DGX-1. 가격 $129,000, 성능 170 TFLOPS(FP16). 이것이 시작이었습니다.
출처: NVIDIA 공식 스펙 (FP16/FP8/FP4 각 세대 기준)
8년 만에 성능이 8,470배 올랐습니다. 같은 기간 가격은 $129K에서 $2~3M으로 15~23배 상승했습니다. 성능 증가 속도가 가격 증가 속도를 압도합니다. 이것이 고객이 계속 업그레이드하는 이유입니다.
1.2 세대별 핵심 변곡점
| 세대 | 출시 | GPU | GPU 수 | 메모리 | 성능 (AI) | 가격 | 냉각 |
|---|---|---|---|---|---|---|---|
| DGX-1 | 2016 | P100 | 8 | 128GB | 170 TFLOPS | $129K | 공냉 |
| DGX-1 V | 2017 | V100 | 8 | 128GB | 960 TFLOPS | $149K | 공냉 |
| DGX-2 | 2018 | V100 32GB | 16 | 512GB | 2 PFLOPS | $399K | 공냉 |
| DGX A100 | 2020 | A100 | 8 | 640GB | 5 PFLOPS | $199K | 공냉 |
| DGX H100 | 2022 | H100 | 8 | 640GB | 32 PFLOPS | $300~400K | 공냉/수냉 |
| DGX B200 | 2024 | B200 | 8 | 1.4TB | 72 PFLOPS | $275~500K+ | 공냉 |
| GB200 NVL72 | 2024 | B200 | 72 | 13.5TB | 1,440 PFLOPS | $2~3M | 수냉 필수 |
주목할 변곡점이 세 번 있습니다.
변곡점 ① NVSwitch 등장 (2018, DGX-2)
DGX-2에서 NVSwitch가 최초 적용되었습니다. GPU 16개를 512GB 공유 메모리로 통합한 첫 시스템입니다. 가격이 $399K로 3배 뛰었지만, 성능은 12배 올랐습니다. 이때부터 "칩 + 네트워크 = 시스템"이라는 공식이 만들어졌습니다.
변곡점 ② 가격 리셋 (2020, DGX A100)
DGX A100은 가격을 $199K로 절반 가까이 내렸습니다. GPU 수를 16개에서 8개로 줄이고, CPU를 Intel에서 AMD EPYC으로 전환하여 원가를 최적화했습니다. 성능은 2.5배 올리면서 가격은 절반. 이것은 고객 기반 확대를 위한 전략적 판단이었습니다.
변곡점 ③ 수냉 필수화 (2024, GB200 NVL72)
GB200 NVL72는 DGX 브랜드가 아닌 NVL 브랜드입니다. 서버가 아닌 랙 스케일 시스템입니다. GPU 72개 + Grace CPU 36개를 수냉 랙 하나에 담았습니다. 무게 1.36톤. 전력 120kW. 공냉으로는 물리적으로 불가능한 영역에 진입했습니다.
1.3 객단가 에스컬레이터
이 진화의 핵심은 "같은 GPU를 더 비싸게 파는 구조"입니다.
| 판매 방식 | 대표 제품 | 가격 | 배수 |
|---|---|---|---|
| GPU 칩 1개 | B200 | ~$40,000 | 1x |
| 서버 (GPU 8개) | DGX B200 | $275~500K+ | 7~13x |
| 랙 시스템 (GPU 72개) | GB200 NVL72 | $2~3M | 50~75x |
| 클러스터 (GPU 576개) | SuperPOD (8랙) | $16~24M | 400~600x |
💡 핵심: 객단가 확대는 단순히 "더 많이 끼워 판다"가 아닙니다. 칩에 NVLink(연결)을 더하고, NVSwitch(스위칭)를 더하고, 소프트웨어(DGX OS)를 더하고, 수냉(냉각)을 더할 때마다 NVIDIA만 할 수 있는 영역이 추가됩니다. 각 층이 부가가치를 만드는 구조입니다.
2. 세 개의 판매 경로: NVIDIA는 어디서든 이긴다
2.1 DGX, HGX, ODM: 서로 다른 경로, 같은 결론
NVIDIA의 시스템 매출은 세 개의 경로로 나뉩니다. 많은 분석이 "DGX vs OEM" 2개 경로만 다루지만, 실제로는 3개입니다.
NVIDIA 완성 시스템 (GPU+네트워크+SW 번들)
24×7 NVIDIA 엔터프라이즈 지원
가격 프리미엄 30~50%
턴키: 전원만 꽂으면 AI 가동
DC 매출의 ~20% (추정)
NVIDIA가 GPU+NVSwitch 보드를 OEM에 납품
OEM이 CPU/RAM/냉각/섀시를 추가하여 완성
Dell, HPE, Supermicro, Lenovo 등이 유통
고객은 OEM 브랜드를 구매하지만 핵심은 NVIDIA
기업 AI 인프라의 주력 경로
세 번째 경로가 있습니다. ODM 직접 발주입니다.
하이퍼스케일러(Google, Amazon, Meta, Microsoft)는 Dell이나 HPE 같은 OEM을 거치지 않습니다. Foxconn, Inventec, Quanta 같은 대만 ODM에 직접 서버를 발주합니다. NVIDIA에서 GPU와 HGX 보드를 받고, ODM이 나머지를 조립합니다.
출처: IDC Worldwide Quarterly Server Tracker, Q4 2024
ODM Direct가 서버 시장 매출의 47.3%를 차지합니다. 전년 대비 +155.5% 성장. Dell부터 Lenovo까지 5대 OEM을 합쳐도 ODM Direct의 절반이 안 됩니다. AI 서버 시장의 진짜 볼륨은 하이퍼스케일러의 ODM 직접 발주에서 나옵니다.
💡 핵심: DGX를 사든, Dell 서버를 사든, ODM에 직접 발주하든, 핵심 부품인 GPU와 HGX 보드는 전부 NVIDIA에서 옵니다. 고객이 어떤 경로를 선택해도 NVIDIA가 번다는 구조입니다.
2.2 HGX 보드: NVIDIA 시스템 매출의 실체
HGX(HGX Baseboard)는 GPU 8개 + SXM 소켓 + NVSwitch + NVLink 패브릭을 하나의 모듈 보드로 사전 조립한 것입니다. OEM은 이 보드 위에 CPU, RAM, 스토리지, 냉각, 섀시를 추가하여 자사 브랜드 서버로 완성합니다.
| 구분 | HGX (OEM 납품) | DGX (직접 판매) |
|---|---|---|
| 정의 | GPU+NVSwitch 베이스보드 모듈 | NVIDIA 완성 시스템 |
| 커스터마이징 | OEM이 CPU/RAM/냉각 선택 | 고정 구성 |
| 소프트웨어 | OEM이 별도 구성 | DGX OS + AI Enterprise 번들 |
| 지원 | OEM 채널 지원 | NVIDIA 24×7 (1시간 응답) |
| 추정 비중 (2023) | DC 매출의 ~80% | DC 매출의 ~20% |
2023년 기준 HGX 보드 출하는 약 $5B 규모, 36,600대 시스템, 293,600개 GPU에 해당합니다. (The Next Platform) DGX가 브랜드 인지도에서는 앞서지만, NVIDIA 시스템 매출의 실체는 HGX 보드입니다.
2.3 OEM AI 서버 라인업
주요 OEM은 모두 NVIDIA GPU 서버를 라인업에 두고 있으며, 최근에는 AMD GPU 서버도 추가하고 있습니다.
| OEM | NVIDIA 주력 모델 | AMD GPU 모델 | 특이사항 |
|---|---|---|---|
| Dell | PowerEdge XE9680 (H100/H200) | XE7745 (MI325X/MI355X) | 2025.1 AMD 서버 출시 |
| HPE | ProLiant DL380a Gen12 | Cray EX XD685 (MI325X) | 슈퍼컴퓨터급 블레이드 |
| Supermicro | SYS-421GE (HGX B200) | AS-4125GS (MI350X) | NVIDIA/AMD 양쪽 최대 라인업 |
| Lenovo | ThinkSystem SR675 V3 | 미확인 | Neptune 액냉 기술 보유 |
⚠ Dell이 MI355X 서버를, HPE가 MI325X 서버를 출시하기 시작했습니다. OEM들이 AMD GPU를 본격 채택하는 이유는 명확합니다. 공급 다변화(NVIDIA 공급 제약 대비), 가격 레버리지(협상력 확보), 하이퍼스케일러 수요(Azure, OCI가 AMD 인스턴스 도입). 단, AMD MI300X/MI325X 서버의 실제 출하 대수는 아직 공개되지 않았습니다.
2.4 ODM 직접 발주: 보이지 않는 거인들
대만 ODM이 NVIDIA GPU 서버 출하의 70% 이상을 담당합니다. (Morgan Stanley 추정, 2023)
출처: Morgan Stanley 추정 (2024.3), Digitimes 경유
하이퍼스케일러가 ODM에 직접 발주하는 이유는 단순합니다. OEM 마진을 건너뛰고, 자사 데이터센터에 최적화된 커스텀 설계를 원하기 때문입니다. Meta의 Grand Teton, Google의 커스텀 서버 트레이 등이 대표 사례입니다.
3. 소프트웨어: 시스템 프리미엄의 숨은 열쇠
3.1 DGX 소프트웨어 스택: 4층 구조
DGX가 OEM 서버보다 30~50% 비싼데도 팔리는 이유는 소프트웨어에 있습니다. (ServeTheHome)
| 층 | 제품 | 역할 | 단독 구매 가능 |
|---|---|---|---|
| ① OS | DGX OS | Ubuntu 커스텀 + GPU 드라이버 + 진단 + 모니터링 | 불가 (DGX 전용) |
| ② 클러스터 관리 | Base Command Manager | 프로비저닝, 워크로드 스케줄링, 인프라 모니터링 | 별도 구매 가능 |
| ③ Factory 운영 | Mission Control | AI Factory 통합 운영. BCM 상위 호환 | 별도 구매 가능 |
| ④ AI 프레임워크 | AI Enterprise | NIM, TensorRT, RAG 프레임워크, 모델 최적화 | 별도 구매 가능 |
DGX를 사면 ①이 기본 탑재되고, Hopper 세대까지는 ④ AI Enterprise도 번들이었습니다. 전원만 꽂으면 AI를 돌릴 수 있는 "턴키" 가치가 여기서 나옵니다. OEM 서버를 사면 ①~④를 고객이 직접 구성해야 합니다.
⚠ Blackwell DGX부터 AI Enterprise가 별도 과금됩니다. Hopper DGX에서는 AI Enterprise가 포함되었지만, Blackwell DGX(B200, B300)부터는 별도 구독이 필요합니다. (NVIDIA Licensing Guide) DGX 프리미엄의 근거 중 하나가 약화되는 시그널입니다. NVIDIA 입장에서는 하드웨어 일회성 매출보다 소프트웨어 반복 매출을 키우겠다는 전략 전환으로 읽힙니다.
3.2 DGX Cloud에서 Lepton으로: 전략 후퇴
2023년 3월 NVIDIA는 DGX Cloud를 출시했습니다. H100 8-GPU 인스턴스를 월 $36,999에 제공하는 클라우드 서비스였습니다. 파트너는 Oracle Cloud, Microsoft Azure, Google Cloud. (HPCwire)
그런데 2025년, NVIDIA는 DGX Cloud에서 전략적으로 후퇴합니다. AWS 등 하이퍼스케일러가 GPU 인스턴스 가격을 최대 45% 인하하면서 가격 경쟁력이 약화되었기 때문입니다. 대신 Lepton이라는 GPU 중개 마켓플레이스로 전환 중입니다. (Tom's Hardware)
💡 핵심: NVIDIA는 "GPU를 직접 임대하는 클라우드 사업자"가 되려 했지만, 하이퍼스케일러와의 가격 경쟁에서 불리하다는 것을 인정했습니다. 전략을 "GPU를 파는 것"에 집중하는 쪽으로 되돌렸습니다. 이것은 약점이 아닌 자기 인식입니다. NVIDIA의 강점은 칩과 시스템을 만드는 것이지, 데이터센터를 운영하는 것이 아닙니다.
3.3 SuperPOD: 시스템을 넘어 인프라로
DGX 개별 서버 위에 SuperPOD라는 클러스터 단위 제품이 있습니다.
| 세대 | 기반 시스템 | Scalable Unit 구성 | 최대 규모 |
|---|---|---|---|
| A100 SuperPOD | DGX A100 | 20 노드/SU | 140 노드 (1,120 GPU) |
| H100 SuperPOD | DGX H100 | 32 노드/SU | 2,000+ 노드 (16,000+ GPU) |
| GB200 SuperPOD | GB200 NVL72 | 8 랙/SU | 128+ 랙 (9,216 GPU) |
SuperPOD는 DGX/NVL72를 정해진 구성으로 묶어, 선형 확장이 보장되는 클러스터입니다. Meta는 DGX A100 760대 기반 AI Research SuperCluster를 운영했고, Lockheed Martin은 SuperPOD 기반 사내 AI Factory를 구축했습니다. (NVIDIA Blog)
4. 수냉 혁명: 120kW 랙이 바꾸는 물리 법칙
4.1 공냉의 한계
전통적인 서버 랙은 5~10kW의 전력을 소비합니다. 에어컨으로 충분히 냉각할 수 있는 수준입니다. H100 GPU 서버 랙은 25~30kW. 공냉의 한계(~15kW)를 넘어서기 시작했습니다.
GB200 NVL72는 120~132kW입니다. 전통 서버 랙의 12~26배. 이 전력 밀도는 물리적으로 공기로 냉각할 수 없습니다.
출처: McKinsey (2024.10), NVIDIA GB200 스펙
McKinsey는 2027년까지 평균 랙 전력 밀도가 30kW에 도달할 것으로 전망합니다. 차세대 시스템은 240kW/랙까지 예상됩니다.
4.2 수냉 시장의 폭발
수냉(Liquid Cooling)이 선택이 아닌 필수가 되면서 관련 시장이 급성장하고 있습니다.
출처: Grand View Research (CAGR 23.96%)
| 기업 | 포지셔닝 | 주요 이벤트 |
|---|---|---|
| CoolIT Systems | Direct-to-chip 냉각 1위 | Ecolab이 $4.75B에 인수 (2025) |
| Vertiv | CDU/XDU 냉각 솔루션 | NVIDIA GPU 대응 포트폴리오 확대 |
| Schneider Electric | 전력+냉각 통합 인프라, 점유율 ~12% | 하이퍼스케일러 파트너십 |
4.3 수냉이 턴키 시스템의 가치를 높이는 이유
공냉 시대에는 서버를 사서 랙에 꽂으면 끝이었습니다. 수냉 시대에는 다릅니다. 냉각수 배관을 설계하고, CDU(Coolant Distribution Unit)를 설치하고, 서버 내부에 냉각판을 연결하고, 누수 감지 시스템을 구축해야 합니다. 복잡도가 비약적으로 올라갑니다.
💡 핵심: 시스템이 복잡해질수록 "전원만 꽂으면 되는" 턴키 솔루션의 가치가 올라갑니다. GB200 NVL72가 수냉을 시스템의 일부로 포함시킨 것은 우연이 아닙니다. 수냉 설계까지 직접 해야 하는 OEM 서버와, 수냉이 내장된 NVL72의 차이는 공냉 시대보다 더 커졌습니다.
IEA는 AI가 데이터센터 전체 전력 소비에서 차지하는 비중이 2024년 5~15%에서 2030년 35~50%로 급증할 것으로 전망합니다. 전 세계 데이터센터 전력 소비는 2024년 415 TWh에서 2030년 945~1,100 TWh로 2배 이상 증가합니다. (IEA Energy and AI)
5. 하이퍼스케일러 자체 설계: 진짜 위협인가
5.1 4대 하이퍼스케일러의 자체 칩 현황
Google, Amazon, Meta, Microsoft 모두 자체 AI 칩을 개발하고 있습니다. "NVIDIA 독점을 깨겠다"는 서사가 자주 등장하지만, 데이터를 보면 그림이 다릅니다.
| 기업 | 자체 칩 | 세대 | 용도 | NVIDIA 의존도 |
|---|---|---|---|---|
| TPU | v5p → Trillium → Ironwood | 내부 훈련+추론 | GCP 외부 고객 99% NVIDIA | |
| Amazon | Trainium / Inferentia | Trn1 → Trn2 → Trn3 | 훈련 일부 + 추론 | P5/P6 시리즈 주력 |
| Meta | MTIA | v1(Freya) → v2(Artemis) → v3(Iris) | 추천 추론 전용 | 훈련 전량 NVIDIA |
| Microsoft | MAIA 100 | 1세대 (MAIA 2 개발 중) | 내부 추론 보조 | 고객 대면 전량 NVIDIA |
5.2 현실: "대체"가 아니라 "보험"
가장 강력한 데이터 하나를 보겠습니다. TrendForce(2026년 5월)에 따르면, Google Cloud에서 TPU에 관심을 보이는 외부 고객은 전체의 약 1%에 불과합니다. 나머지 99%는 NVIDIA GPU를 요청합니다. (TrendForce)
각 사의 현실을 봅시다.
Google: 가장 앞서 있지만 외부 채택은 미미
Google TPU는 자체 칩 중 가장 성숙합니다. Ironwood(TPU v7)는 칩당 4,614 TFLOPS(FP8), 9,216칩 Pod에서 42.5 ExaFLOPs를 달성합니다. (Google Cloud) Anthropic이 최대 100만 TPU 칩 액세스 계약을 맺는 등 대형 거래도 있습니다.
하지만 GCP 인스턴스 라인업(A3 High, A3 Mega, A3 Ultra)은 여전히 NVIDIA H100/H200 기반이 주력입니다. TPU는 자체 내부 워크로드에서 강하지만, 외부 고객 전환에는 CUDA 생태계의 벽이 있습니다.
Amazon: 가격 대비 성능으로 승부
Trainium2는 H100 대비 가격 대비 성능이 30~40% 유리하다고 AWS가 주장합니다. Project Rainier(Anthropic 전용, Trn2 50만 칩, 2025년 10월 가동)가 대표 사례입니다. (Tom's Hardware)
하지만 절대 속도에서는 NVIDIA B200이 여전히 빠릅니다. AWS는 P5(H100), P5e(H200), P6e(GB200 NVL72) 인스턴스를 동시에 제공하며, 2025년 6월에는 NVIDIA 인스턴스 가격을 최대 45% 인하했습니다. 자체 칩과 NVIDIA를 병행하는 전략입니다.
Meta: 추론은 자체, 훈련은 NVIDIA
MTIA v2(Artemis)는 TSMC 5nm, 칩당 90W, 수십만 개가 이미 배포되어 수십억 사용자의 콘텐츠 랭킹·광고 추천을 처리하고 있습니다. GPU 대비 TCO를 44% 절감합니다. (Meta ISCA 2025)
그러나 LLM 훈련은 전량 NVIDIA입니다. 2026년 2월 Blackwell + Rubin GPU 수백만 개 멀티이어 계약을 체결했고, 2026년 capex는 $115~135B에 달합니다. (TechInformed)
Microsoft: 가장 조용한 도전자
MAIA 100은 5nm, 1,050억 트랜지스터, 0.8 PFLOPS(BF16). 설계 목적은 Bing, Copilot 등 내부 추론 워크로드 보조입니다. 외부 고객에게는 제공되지 않으며, "1~2년 내 전면 배포는 낙관적"이라는 평가입니다. (IT Pro)
Microsoft는 2025년 capex $80~90B의 대부분을 NVIDIA Blackwell 구매에 투입하고 있습니다. OpenAI GPT 시리즈 훈련도 Azure의 NVIDIA 인프라에서 수행됩니다.
5.3 자체 칩의 구조적 한계
| 한계 요인 | 수치/내용 |
|---|---|
| 개발 비용 | 칩 1세대당 $500M~$1B |
| 개발 기간 | 24~36개월 (개념→양산) |
| 경쟁력 확보까지 | 3~5년 (소프트웨어 생태계 포함) |
| CUDA 생태계 | 개발자 400만+, 앱 3,000+, 기업 40,000+, 19년 축적 |
| 범용성 | 자체 칩은 특정 워크로드에 최적화 (범용 LLM 훈련 불가) |
💡 핵심: 하이퍼스케일러의 자체 칩은 "NVIDIA를 대체하는 것"이 아니라 "NVIDIA 의존도를 줄이는 보험"입니다. Google 외에는 대규모 전환 사례가 없고, Google조차 GCP 외부 고객의 99%는 NVIDIA를 원합니다. 훈련에서의 NVIDIA 독점은 당분간 깨지기 어렵습니다. 추론에서는 ASIC의 침투가 시작되었지만, 2026년 기준 GPU가 여전히 69.7%를 차지합니다. (TrendForce)
5.4 NVIDIA 시장 점유율 전망
| 연도 | NVIDIA AI 가속기 점유율 | 비고 |
|---|---|---|
| 2024 | ~87% | 매출 기준 |
| 2025E | ~86% | 소폭 하락 |
| 2026E | ~75% | ASIC 침투 가속 전망 |
점유율이 하락하더라도 시장 자체가 급성장하고 있습니다. AI 서버 시장은 2024년 $205B에서 CAGR 19~34%로 성장합니다. 점유율 75%라도 절대 매출은 증가하는 구조입니다.
6. 투자자가 봐야 할 것
6.1 시스템 사업의 해자 점수
| 요소 | 점수 | 평가 |
|---|---|---|
| 기술 차별화 | ●●●○ | GPU+NVLink+NVSwitch+SW 통합은 유일. 단, OEM이 동일 GPU로 유사 성능 달성 가능 |
| 전환 비용 | ●●○○ | DGX→OEM 전환은 비교적 쉬움. SuperPOD 단위에서는 전환 비용 상승 |
| 네트워크 효과 | ●○○○ | 시스템 자체에는 네트워크 효과 약함. SW 생태계(CUDA)에서 발생 |
| 객단가 레버리지 | ●●●● | 칩 $40K → 시스템 $500K+ → 클러스터 $24M. 구조적 매출 승수 |
| 경쟁 방어 | ●●○○ | OEM·ODM·하이퍼스케일러 모두 대안 구축 가능. 단 NVIDIA GPU/HGX 의존은 유지 |
💡 핵심: 시스템 통합은 전통적 의미의 "해자"가 아닙니다. Dell이 같은 GPU로 더 싼 서버를 만들 수 있고, 하이퍼스케일러는 직접 조립합니다. 시스템의 진짜 가치는 방어가 아닌 레버리지입니다. 같은 GPU를 팔아도 시스템으로 묶으면 13~50배 매출을 뽑는 구조. 수냉 시대가 오면 이 복잡도 프리미엄은 더 커집니다.
6.2 모니터링 지표
- DGX의 8년 진화: $129K 연구장비 → $3M AI 공장 벽돌. 성능 8,470배, 가격 23배. 고객이 업그레이드를 멈출 이유가 없다
- 세 경로 모두 NVIDIA가 번다: DGX 직접, HGX-OEM 납품, ODM 직접 발주. 어떤 경로든 GPU와 HGX 보드는 NVIDIA에서 온다
- 수냉이 프리미엄을 키운다: 120kW 랙의 냉각 복잡도는 턴키 시스템의 가치를 과거보다 높인다
- 하이퍼스케일러 자체 칩은 보험이지 대체가 아니다: TPU 외부 채택 1%, Meta 훈련 전량 NVIDIA, MAIA 외부 미제공