커스텀 ASIC, 브로드컴의 해자는 진짜인가 | Broadcom 상세 분석

핵심 요약

브로드컴의 "AI 반도체"는 한 덩어리가 아니라 성격이 정반대인 두 엔진입니다. 칩을 설계해 주는 XPU(커스텀 ASIC)는 설계 시장의 약 70%를 쥐었지만, 고객이 컴퓨트 코어를 소유하는 수탁 모델이라 해자가 한 세대(약 18개월)마다 다시 따내야 하는 갱신형입니다. 반면 칩을 직접 정의해 파는 네트워킹(Tomahawk·Jericho)은 표준을 쥐어 해자가 견고합니다. 단 네트워킹도 견고한 곳은 클러스터 사이를 잇는 스케일아웃이고, 서버 안을 잇는 스케일업은 엔비디아 NVLink에 도전하는 미확정 전장입니다. 이 거울상 구조를 분해하지 못하면 브로드컴의 강함과 약함을 동시에 오해합니다.

브로드컴의 커스텀 AI ASIC(XPU)은 구글·메타·앤트로픽·오픈AI 같은 빅테크가 설계한 가속기를 실제 실리콘으로 구현해 주는 사업으로, 설계 시장의 약 70%를 점유합니다(Bloomberg Intelligence 추정). 다만 고객이 컴퓨트 코어 IP를 소유해 해자는 1세대(약 18개월)마다 갱신해야 하는 우위이며(소멸이 아니라 재계약 주기), 같은 회사의 AI 네트워킹 칩(특히 클러스터 사이를 잇는 스케일아웃)이 오히려 더 견고한 해자를 가집니다.

빅테크는 왜 엔비디아를 두고 자기 칩을 따로 만드나

세계 최고의 GPU가 있는데도 구글·메타·오픈AI가 굳이 자기 전용 칩을 따로 만듭니다. 그리고 그 칩을 직접 짓지 않고 브로드컴에 맡깁니다. 이 두 가지 선택이 이 글의 출발점입니다.

먼저 첫 번째 질문. 왜 전용 칩인가. 세상에서 가장 좋은 범용 트럭(엔비디아 GPU)이 있어도, 매일 같은 짐만 나르는 대형 물류회사는 "그 짐 전용"으로 깎은 차를 따로 발주합니다. 워크로드가 고정되어 있으면 전용 설계가 더 싸고 효율적이기 때문입니다. 빅테크의 워크로드는 실제로 고정적입니다. 구글 TPU는 행렬연산, 메타 MTIA는 추천, 오픈AI는 트랜스포머. 이 고정된 일에 맞춘 전용칩(ASIC)의 총소유비용(TCO)이 범용 GPU보다 40~65% 유리하다는 추정이 있습니다(SemiAnalysis·Bernstein 추정).

두 번째 질문. 그런데 왜 직접 안 짓고 브로드컴에 맡기나. 빅테크는 칩 설계 회사가 아니기 때문입니다. 도면(연산 코어 아키텍처)은 자기가 그리되, 그것을 선단 공정·HBM·칩렛 패키지로 "양산 가능한 실물"로 바꾸는 일은 전문 시공사에 맡깁니다. 그 시공사가 브로드컴입니다.

이 "맡기는" 관계의 규모를 숫자로 보면 체감이 됩니다. 브로드컴이 공개한 확인 XPU 고객은 구글·메타·앤트로픽·오픈AI를 포함한 5개사이며(IBTimes), 향후 18개월에 인도할 AI 반도체 백로그(주문잔고)는 $73B에 달합니다(Futurum, Q4 FY25, 확정). 구글 한 곳과의 부품·네트워킹 공급 보장 계약은 2031년까지 잠겨 있습니다(Investing.com, 2026-04-06 발표).

개념적 시각화. "건축" 비유. 왼쪽은 도면(설계 IP)이 건축주(고객) 소유로 남는 수탁 구조, 오른쪽은 도로·규격(네트워킹 표준)을 브로드컴이 정의하는 구조입니다.

이 "맡기는 이유"를 위협하는 길은 둘인데, 성격이 전혀 다릅니다. 하나는 멀티소싱(같은 일을 다른 설계하우스에 나눠 주는 것, 브로드컴을 교체)이고, 다른 하나는 내재화(고객이 설계부터 양산까지 스스로 완주하는 것, 시공사라는 자리 자체를 없애는 것)입니다. 멀티소싱은 점유를 깎고, 내재화는 이 글의 출발 전제 자체를 부정합니다. 그래서 두 길을 한 칸으로 묶지 않고 4장에서 따로 추적합니다.

"그럼 구글이 마음먹으면 직접 다 못 만드나?"라는 의문이 들 수 있습니다. 설계 도면을 그리는 것과 그것을 수율 나오는 실물로 양산하는 것은 다른 일입니다. 다회 무사고 테이프아웃(설계를 공정에 넘기는 최종 제출) 트랙레코드라는 양산 장벽 때문에, 내재화는 가장 치명적이지만 속도가 느립니다(4장에서 신호로 추적).

이 글이 답할 것은 넷입니다. ① 브로드컴이 파는 게 정확히 무엇인가 ② 그 점유율(설계 시장 약 70%)이 기술의 어디서 나오나 ③ 이 해자가 얼마나 오래 가나 ④ 무엇이 이걸 깨뜨리나. 주가나 적정가는 다루지 않습니다. 오직 기술과 해자가 어떻게 작동하고, 왜 한쪽은 단단하고 한쪽은 시한적인지만 봅니다.

1. 한 덩어리가 아니다: 거울상 두 엔진

브로드컴의 "AI 반도체" 매출 안에는 기술 성격이 정반대인 두 사업이 섞여 있습니다. XPU는 고객 도면을 받아 짓는 설계 대행 서비스이고, 네트워킹은 브로드컴이 규격까지 정의하는 자체 표준 제품입니다. 이 둘을 한 단어로 묶는 순간 강함과 약함이 동시에 흐려집니다. 그래서 가장 먼저 두 엔진을 분리해 정체를 밝힙니다.

1.1 엔진 1, XPU: 칩을 파는 게 아니라 "설계해 주는 서비스"

브로드컴 XPU 사업의 본질은 칩 판매가 아니라 물리 구현(physical implementation) 서비스입니다. 연산 코어를 무엇으로 할지는 고객(구글 TPU팀 등)이 정의하고, 브로드컴은 그것을 테이프아웃 가능한 실물로 만듭니다. 비유로 돌아가면, 건물의 용도와 층수(연산 코어)는 건축주가 정하고, 그것을 무너지지 않는 실제 건물로 세우는 일을 시공사가 맡는 것입니다.

브로드컴이 이 시공에서 가진 기술은 세 개의 층으로 쌓여 있습니다. 핵심은 이 셋 모두 "고객이 처음부터 안 해도 되는 일"이라는 점입니다.

기술 층	고객이 안 해도 되는 일	공학적 의미
① 검증된 IP 블록	SerDes·HBM PHY/컨트롤러·PCIe/이더넷 I/O·다이-투-다이 인터커넥트를 처음부터 짤 필요 없음	칩 면적의 30~40%를 차지하는 주변 회로를 즉시 붙인다
② 선단공정 접근권	TSMC 2nm 우선 할당·CoWoS 캐파 줄서기를 새로 확보할 필요 없음	엔비디아·애플급 발주량으로 선단 노드 줄 앞에 선다
③ 3.5D 어드밴스드 패키징	멀티 컴퓨트 다이 + I/O 칩렛 + HBM 스택 통합을 직접 설계할 필요 없음	단일 다이 한계(reticle limit)를 넘는 칩렛 조립. 설계 실수는 곧 수율 0

XPU 기술 3층. 셋 모두 고객이 직접 하지 않아도 되게 만드는 구현·검증 자산입니다. (출처: AVGO 기술 분석)

이 셋이 실제 성능으로 나타난 사례가 구글 TPU v8t "Sunfish"입니다. 브로드컴이 설계 파트너로 참여한 훈련 전용 칩으로, TSMC 2nm 공정에 컴퓨팅 다이 2개 + I/O 칩렛 + HBM3e 12-high 8스택 구조이며 2027년 말 출시 예정입니다. 7세대(Ironwood) 대비 훈련 가격-성능이 약 2.7배입니다(NAND Research, The Next Web). 이 2.7배는 노드 미세화 + HBM3e 대역폭 + 패키지 최적화의 합산 효과로, 브로드컴의 물리 구현 품질이 실측 성능으로 드러난 수치입니다.

여기서 가장 중요한 구분을 못 박아 둡니다. XPU의 기술 우위는 "연산 코어를 잘 만든다"가 아닙니다. 연산 코어는 고객이 정의합니다. 브로드컴의 우위는 그 코어를 선단 노드 + HBM + 칩렛으로 양산 가능한 실물로 만드는 구현·검증·양산 파이프라인에 있습니다. 이 구분이 이후 점유율과 해자의 성격을 모두 규정합니다.

1.2 엔진 2, 네트워킹: 브로드컴이 규격까지 정의하는 자체 제품

네트워킹은 XPU와 정반대입니다. AI 클러스터는 수만~수백만 개의 XPU를 하나의 패브릭으로 묶어야 하고, 그 연결을 담당하는 스위치/라우터 칩이 Tomahawk와 Jericho입니다. 여기서는 브로드컴이 아키텍처부터 표준까지 자기가 정의합니다. 도면을 받는 을(乙)이 아니라, 도로 규격을 정하는 갑(甲)입니다.

절대 스펙으로 보면 세대 리드가 또렷합니다.

칩	좌표	절대 스펙	공학적 의미
Tomahawk 6	스케일아웃	102.4Tbps, 3nm, 2025-06 출하	한 세대 만에 51.2T에서 2배 점프. 10만 개 이상, 최대 100만 개 이상 XPU 클러스터 연결
Tomahawk Ultra	스케일업	51.2Tbps, 250ns 레이턴시, SUE 표준	NVLink 5세대(28.8Tbps) 대비 약 1.78배 대역폭(브로드컴 주장)
Jericho 4	DC간 라우팅	3nm, 36,000 HyperPorts @3.2Tbps	HBM 패킷버퍼 내장으로 100km 이상 무손실 RoCE. 복수 DC를 하나의 컴퓨팅 풀로

네트워킹 3종. 스케일아웃·스케일업·DC간을 모두 커버하는 포트폴리오입니다. (출처: Broadcom IR / NetworkWorld)

네트워킹의 기술 우위는 두 가지에서 나옵니다. ① 대역폭 세대 리드(102.4Tbps를 경쟁사보다 먼저, 2배 점프) ② 패킷 처리 아키텍처 깊이(동적 혼잡제어, HBM 버퍼링, 무손실 이더넷)입니다. 이 둘이 합쳐져 "InfiniBand의 무손실·적응형 라우팅을 이더넷에서 재현"합니다. InfiniBand가 이더넷보다 비싸다는 비용 격차와 결합되어, 이더넷이 2025년 InfiniBand를 추월하게 만든 기술적 동인입니다(Dell'Oro 추정).

1.3 두 엔진의 결정적 차이, 갑과 을

XPU는 고객 설계를 구현하므로 표준화·범용화에 노출되고, 네트워킹은 브로드컴이 표준을 정의하므로 생태계 락인에 가깝습니다. 이 한 가지 차이가 해자 전체를 가릅니다. XPU는 도면(설계 IP)이 고객 소유라 다음 세대를 다른 시공사에 맡길 수 있는 을(乙)입니다. 네트워킹은 SUE를 OCP(Open Compute Project)에 공개하고 UEC(Ultra Ethernet Consortium)를 주도하며 규격 자체를 브로드컴이 정의하는 갑(甲)입니다. 규격을 채택하면 사실상 브로드컴 칩이 레퍼런스가 됩니다.

개념적 시각화. 같은 "AI 반도체" 안에 들어 있는 두 엔진의 구조적 비대칭입니다. 이 비대칭이 2장(점유율)과 3장(해자 수명)에 그대로 새겨집니다.

이 글의 나머지는 이 갑/을 비대칭이 점유율(2장)과 해자 수명(3장)에 어떻게 새겨지는지를 따라갑니다.

2. 그 70%는 어디서 나오나: 점유율의 기술 출처

XPU의 약 70%와 네트워킹의 약 80%는 같은 종류의 점유율이 아닙니다. XPU 점유율은 IP폭 + 선단공정 줄서기 + 무사고 트랙레코드에서, 네트워킹 점유율은 대역폭 세대 리드 + 표준 정의력 + 머천트 모델 구조에서 나옵니다. 숫자만 보면 둘 다 압도적이지만, 그 숫자를 떠받치는 기둥이 다르므로 추세도 갈립니다.

2.1 XPU 약 70%, 시공 실력이 만든 점유율

현재 브로드컴은 커스텀 AI ASIC 설계 시장의 약 70%를 점유합니다(Bloomberg Intelligence 추정, 2026). Marvell이 약 20~25%로, 양사 합산이 80% 이상입니다(Bloomberg Intelligence, hashrateindex 인용). 나머지는 Alchip·MediaTek 등 소규모 설계하우스입니다.

기술이 이 점유율을 만든 경로는 셋입니다.

XPU 70%를 만든 세 기둥

검증된 IP 라이브러리 폭

선단공정·CoWoS 우선 할당

무사고 트랙레코드

첫째, 검증된 IP 라이브러리 폭입니다. 고객이 컴퓨트 다이만 정의하면 SerDes·HBM·I/O를 즉시 붙입니다. 후발주자는 이 IP를 처음부터 검증해야 하고 수년이 걸립니다. 둘째, 선단공정·CoWoS 우선 할당입니다. TSMC 2nm·CoWoS 캐파를 엔비디아·애플급 물량으로 선점하므로, 신규 진입자는 캐파 줄 뒤에 섭니다. 셋째, 무사고 트랙레코드입니다. 구글 TPU 여러 세대 + 메타 MTIA + 오픈AI를 무사고 양산했습니다. 하이퍼스케일러는 한 번 실패하면 1세대(약 18개월)를 손실하므로 검증된 파트너를 쉽게 못 바꿉니다. 앞의 둘은 강, 셋째는 중강입니다.

여기서 분모를 못 박아 둡니다. 이 70%는 "커스텀 ASIC 설계 시장" 슬라이스의 점유율입니다. 흔히 인용되는 "AI 가속기 $200B+ 시장"이 아니라, 그중 빅테크 자체설계 칩을 외주 설계하는 좁은 시장의 점유율입니다. 분모를 섞으면 점유율이 자동으로 왜곡됩니다.

2.2 네트워킹 약 80%, 규격을 쥔 자의 점유율

네트워킹은 AI 하이엔드 데이터센터 이더넷 스위칭/라우팅 머천트 실리콘에서 약 80%를 점유합니다(JPMorgan Harlan Sur 추정, 2024-06). 전체 이더넷 스위치 칩 기준으로는 일부 집계에서 약 55%인데(1차 미확인, openPR), 두 수치는 분모가 다릅니다. 80%는 AI 하이엔드 전용 시장, 약 55%는 엔터프라이즈·캐리어를 포함한 전체 이더넷 스위치칩 시장입니다. 이 글의 관심 대상은 AI 데이터센터이므로 80%가 정합한 수치입니다.

기술이 이 점유율을 만든 경로는 넷입니다. ① 대역폭 세대 리드(102.4Tbps를 업계 최초로, 한 세대에 2배 점프. 경쟁사 대비 12개월 이상 기술 격차) ② 패킷 처리 아키텍처 자산(동적 혼잡제어·HBM 버퍼·무손실 이더넷은 수년 축적된 R&D) ③ 표준 정의력(UEC를 주도, 메타·마이크로소프트·HPE·아리스타 참여) ④ 유통 파트너 락인(아리스타 등 스위치 OEM이 브로드컴 칩을 탑재해 판매. 경쟁이 아니라 채널)입니다.

단, 이 80%·세대 리드·표준 락인은 클러스터 사이를 잇는 스케일아웃 층의 그림입니다. 서버 안 가속기끼리를 잇는 스케일업 층은 엔비디아 NVLink가 이미 양산 배치로 우위를 쥔 시장이고, 브로드컴은 SUE·Tomahawk Ultra로 뒤늦게 도전하는 중입니다. 한 단어 "네트워킹 80%"가 두 층을 덮으면 스케일업의 미확정 전장이 가려집니다(3.2에서 본격 분해).

여기서도 분모를 짚습니다. 네트워킹 점유율의 분모는 칩(머천트 실리콘)이지 스위치 장비가 아닙니다. 완제품 스위치 박스 시장($50B대)으로 재면 브로드컴 직접 수혜 시장이 약 10배 과대 산정됩니다.

2.3 같은 점유율, 다른 추세

XPU 점유율은 하락 압력이 시작됐고, 네트워킹 점유율은 유지~방어가 가능합니다. 방향이 갈리는 이유 자체가 1장의 갑/을 비대칭입니다.

XPU 추세부터 봅니다. 점유율 유지는 가능하나 "준독점"은 종료 국면입니다. 기술이 약해서가 아니라 고객의 멀티소싱 전략 때문입니다. 다만 그 시작은 "준독점 균열"이라기보다 워크로드 분화입니다. 구글이 추론 칩 TPU v8i(Zebrafish)를 MediaTek에 넘긴 것은(wccftech), 상대적으로 범용화 압력이 큰 추론 워크로드가 먼저 갈라진 신호입니다. 고마진 심장인 훈련칩(Sunfish 등)은 아직 브로드컴이 쥐고 있습니다.

70%가 내려가는 경로는 둘인데, 성격이 전혀 다릅니다. 이걸 갈라 보지 않으면 같은 숫자로 강함과 약함을 동시에 오해합니다.

(a) 훈련칩 멀티소싱: 아직 안 일어남

고객이 차세대 훈련칩 발주를 다른 설계 파트너에 나눠 줌

고마진 심장을 직접 겨눔

일어나면 진짜 종료 신호

현재: 발생 0건

(b) 분모 무게중심 이동: 이미 진행 중

분모 안 추론칩 비중이 커짐

훈련칩을 100% 지켜도 비율은 내려감

약화가 아니라 믹스 정상화

현재: 진행 중

(b)를 비유로 풀면 이렇습니다. 반에서 내 키가 그대로여도 키 큰 전학생이 늘면 반 평균이 올라가 내 등수가 밀립니다. 브로드컴이 훈련칩을 다 쥐고도, 분모(커스텀 ASIC 설계 시장) 안에서 이미 갈라진 추론칩 비중이 커지면 70%라는 비율 숫자는 그것만으로 내려갑니다. 그래서 70% 하락을 곧 약화로 읽으면 오독입니다. 정확히는 고마진·고난도 칸(훈련)을 지키며 저마진·범용 칸(추론)을 내주는 믹스 정상화입니다(마진 비대칭의 정량은 본 글 범위 밖이며 밸류에이션 DD가 종합합니다).

단 "훈련은 무풍"이라는 뜻은 아닙니다. 추론 멀티소싱이 이미 존재한다는 사실 자체가, 훈련칩 재계약에서 고객이 쥔 협상 카드가 됩니다. 비율이 내려가기 전부터 훈련 단가에 가격 압박이 작동하는 것입니다.

네트워킹 추세는 유지~소폭 하락 방어가 가능합니다. 위협은 엔비디아 Spectrum-X의 이더넷 진입이지만, 엔비디아는 자사 GPU 묶음 판매가 주력이라 "타사 시스템에 칩을 파는" 머천트 실리콘 모델에서는 브로드컴이 우위입니다. 단 여기서도 분모를 갈라야 합니다. 엔비디아 이더넷의 폭발적 성장(IDC 기준 2025년 3분기 +167%YoY, $1.0B, DC 이더넷 스위치 점유 11.6%, The Next Platform)은 시스템을 포함한 데이터센터 이더넷 스위치 전체 분모이고, 브로드컴 80%는 AI 하이엔드 머천트 실리콘이라는 좁은 분모입니다. 두 수치는 직접 비교가 아닙니다. 게다가 Spectrum-X가 메타·오라클 등 타사 시스템에 채택된 만큼, 머천트 우위는 절대적이 아니라 추세 감시 대상입니다(4장과 연결). 이더넷의 InfiniBand 추월(2025)과 AI 백엔드 이더넷 점유율의 지속 상승(2026년 현재 50%를 넘어 70~80%로 향하는 추세)(Dell'Oro)은 오히려 브로드컴 시장 자체를 키웁니다.

3. 이 점유율은 얼마나 오래 가나: 해자의 수명

XPU 해자는 고객이 설계 IP를 소유한다는 구조적 천장 때문에 1세대(약 18개월) 단위로 시한적입니다. 네트워킹 해자는 표준 락인으로 견고합니다. 브로드컴의 진짜 엔진은 점유율은 같아 보여도 네트워킹 쪽입니다. 이 장은 해자를 세 엔진(점유율 획득 / 점유율 유지 / 범용화 압력)으로 쪼개 두 사업을 따로 평가합니다. 거울상 구조이므로 하나의 통합 점수는 의미가 없습니다.

3.1 XPU 해자: 실재하나 천장이 있다

XPU 해자는 실재합니다. 다만 세 엔진으로 쪼개 보면 어디가 강하고 어디에 천장이 있는지가 드러납니다.

획득력은 중입니다. 시장 성장(ASIC 서버 출하 +44.6% YoY, GPU를 처음 추월, TrendForce 추정)은 강하지만, 그 성장이 신규 고객 탈취가 아니라 기존 고객의 멀티소싱 분산으로 흘러갑니다. 시장 성장에 획득력이 못 미칩니다.

유지력도 중입니다. 락인은 검증된 파트너를 못 바꿈(1세대 약 18개월 리스크)과 다회 테이프아웃 트랙레코드에서 옵니다. 그러나 고객이 설계 IP를 소유하므로 차세대 발주를 다른 설계 파트너에 줄 수 있습니다. 구글 Zebrafish가 MediaTek으로 간 사례가 이를 실증했습니다.

그렇다면 무엇이 단기 복제를 막느냐가 핵심입니다. 물리 구현 IP 자체(SerDes·HBM PHY 같은 블록)는 브로드컴만의 비밀이 아닙니다. Marvell도 동급 물리 구현 IP를 이미 보유합니다. 옮긴 파트너가 처음부터 다시 쌓아야 하는 것은 IP라는 비밀이 아니라 다음 세 가지의 묶음입니다.

경쟁사가 단기에 복제하지 못하는 것은 IP가 아니라 트랙레코드·계약·통합의 묶음입니다.

💡 핵심: ① 다회 무사고 양산 트랙레코드(한 번 실패하면 1세대 손실) ② 다년 공급 보장 계약(구글 2031년까지 잠금) ③ 인터커넥트(네트워킹)까지 한 묶음으로 동반 설계하는 통합 능력. 이 셋은 비밀이 아니라 시간과 신뢰로만 쌓입니다.

그래서 락인의 "약 18개월"은 천장이 아니라 갱신 단위입니다. 단 이 갱신은 자동이 아니라 매 세대 재계약 경쟁을 거칩니다(이 갱신형 우위의 성격은 3.3에서 CUDA와 대조해 풀어 봅니다).

범용화 압력은 강(위험 큼)입니다. ASIC은 세대마다 노후화합니다. 범용 GPU(엔비디아/AMD)가 세대 효율을 도약시키면 하이퍼스케일러가 커스텀 사이클을 지연·축소할 수 있습니다. CoWoS 캐파가 엔비디아·Marvell과 공유 병목이라 차별화에도 한계가 있습니다.

종합하면 중강이나 시한적입니다. 전환비용은 실재하지만 "컴퓨트 코어 IP를 고객이 소유하는 수탁 모델"이라는 구조적 약점이 해자의 천장을 만듭니다. 다만 이 시한성은 곧 무너질 천장이 아니라 갱신 주기입니다(반증 조건은 4장에서 분리).

3.2 네트워킹 해자: 진짜 엔진. 단 스케일아웃과 스케일업은 분리해야 한다

네트워킹은 한 덩어리가 아니라 두 층입니다. 클러스터 사이를 잇는 스케일아웃(Tomahawk 6·Jericho 4)과 한 서버 안 가속기끼리를 잇는 스케일업(Tomahawk Ultra·SUE). 같은 "네트워킹 해자"라도 두 층의 경쟁 좌표가 정반대입니다.

스케일아웃: 견고한 인큐번트

클러스터 사이 통신 (Tomahawk 6·Jericho 4)

대역폭 세대 리드 + 이더넷의 InfiniBand 추월로 시장 자체가 커짐

UEC 주도 = 생태계 락인. OEM이 브로드컴 칩 위에서 시스템 검증

범용화 압력: 중 (Spectrum-X 진입하나 머천트에서 버팀)

스케일업: 도전 중 (미확정)

서버 안 가속기 연결 (Tomahawk Ultra·SUE)

엔비디아 NVLink가 이미 양산 배치(Blackwell NVL72)로 우위

브로드컴은 뒤늦게 도전. SUE 외 UALink도 같은 자리를 노림

범용화 압력: 강 (개방표준 분열로 표준 정의력=락인이 약해짐)

스케일아웃은 브로드컴이 사실상 인큐번트입니다. 표준 정의력(UEC 주도)이 생태계 락인이고, 스위치 OEM이 브로드컴 칩 위에서 시스템을 검증하므로 전환하려면 전체를 재검증해야 합니다. 위협인 엔비디아 Spectrum-X 진입에도 머천트 칩에서는 브로드컴이 버팁니다. 단 분모를 갈라야 합니다. 엔비디아 이더넷의 급성장(IDC 2025년 3분기 +167%YoY)은 시스템 포함 DC 이더넷 스위치 전체 분모이고, 브로드컴 80%는 AI 하이엔드 머천트 실리콘 분모라 직접 비교가 아닙니다.

스케일업은 다릅니다. 이 층은 브로드컴이 도전자입니다. 서버 내 가속기 연결은 엔비디아 NVLink가 이미 양산 배치(Blackwell NVL72)로 우위를 쥔 시장이고, 브로드컴은 SUE·Tomahawk Ultra로 뒤늦게 들어가는 중입니다(아직 미정). 게다가 SUE만이 스케일업 개방표준이 아니라, 브로드컴이 함께 후원하는 UALink도 같은 자리를 노립니다(2025-04 1.0 발표, 양산 미출하, The Next Platform). 개방표준이 둘로 갈리면 "표준 정의력=락인"이 약해집니다. 즉 스케일업에서는 점유 위협(범용화 압력)이 강입니다.

종합하면 스케일아웃은 강(견고한 인큐번트), 스케일업은 도전 중(미정)입니다. 브로드컴의 견고한 네트워킹 해자는 정확히는 스케일아웃 층이고, 스케일업은 XPU만큼은 아니어도 아직 확정되지 않은 전장입니다.

3.3 CUDA와의 대조: XPU 락인이 "약한" 진짜 이유

XPU의 락인은 엔비디아 CUDA식 개발자 락인과 질이 다릅니다. CUDA는 수백만 개발자가 묶이지만, XPU는 고객 한 곳이 1세대 단위로만 묶입니다. 같은 "락인"이라는 단어를 써도 수명이 근본적으로 다릅니다.

엔비디아 CUDA는 개발자 생태계 락인입니다. 코드·라이브러리·인력이 CUDA에 묶여 전환 비용이 누적적이고 영구에 가깝습니다. 반면 XPU 락인은 고객당, 그것도 1세대(약 18개월) 단위입니다. 다음 세대 발주 시점마다 고객은 설계 파트너를 재선택할 수 있습니다.

단, "1세대 단위"가 곧 "1세대 뒤 소멸"은 아닙니다. 컴퓨트 코어는 고객 것이라 발주를 옮길 수 있지만, 옮긴 파트너는 다회 무사고 양산 트랙레코드와 네트워킹 동반설계 통합을 처음부터 다시 쌓아야 하기 때문입니다(3.1). 그래서 18개월은 락인의 천장이 아니라 갱신 주기입니다. 단 그 갱신은 자동이 아닙니다. Marvell처럼 동급 물리 구현 IP를 이미 가진 경쟁사가 있으므로, 매 세대 갱신은 가격·점유 경쟁을 거칩니다. 브로드컴이 트랙레코드·통합으로 그 경쟁을 이기는 한, 우위는 매 세대 방어해 따내는 갱신형 우위입니다.

개념적 시각화. 막대 길이로 락인 수명을 대비했습니다. XPU 락인은 영구(CUDA)도 1회성도 아니라, 매 세대 방어해 따내는 갱신형입니다.

이 대조가 "점유율 70%인데 왜 준독점이 끝나가나"라는 모순처럼 보이는 질문의 답입니다. 점유율의 크기와 그 점유율을 지키는 락인의 수명은 별개이고, 그 수명은 영구도 1회성도 아닙니다.

4. 무엇이 이 그림을 바꾸나: 추적해야 할 반증 신호

브로드컴 커스텀 ASIC 해자의 운명은 일곱 가지 반증 신호로 갈립니다. 강한 해자를 가정하기 전에 반증 조건을 먼저 세우는 것이 정직한 순서입니다. 위협의 두 길은 성격이 다릅니다. 멀티소싱(브로드컴을 교체)은 점유를 직접 깎고, 내재화(맡기는 이유 자체를 없앰)는 가장 치명적이나 양산 장벽으로 느립니다. 그중 멀티소싱이 가장 임박합니다.

외부 시각도 이 하락을 이미 가격에 넣고 있습니다. 맥쿼리는 브로드컴의 구글 TPU 매출 점유율이 약 95%(2026)에서 80%(2027)를 거쳐 2028년 65%까지 내려갈 수 있다고 봅니다(Tradingpedia, Macquarie, 2026-06 등급 하향). 우리 프레임은 이 외부 전망과 충돌하지 않습니다. 우리가 말하는 것은 그 하락의 상당분이 (b) 추론 분모 이동 + 고객 내재화이며 훈련칩 설계권은 아직 브로드컴이 쥔다는 것이지, 훈련 프리미엄이 무풍이라는 뜻이 아닙니다. 추론 멀티소싱이 이미 존재한다는 사실 자체가 훈련칩 단가 협상에서 고객의 카드가 되므로, 가격 압박은 비율이 내려가기 전부터 작동합니다.

반증 신호	어느 엔진	무너지면	모니터링 신호
멀티소싱 (을 교체)	XPU	70% 점유 직접 잠식 (점유 하락·성장 둔화)	훈련칩(고마진 핵심)의 멀티소싱 여부 (추론칩과 분리 추적), 신규 XPU의 복수 파트너 동시 발주, Marvell의 구글 훈련칩 진입
내재화 (을 소멸)	XPU	메인 논제 '맡기는 이유' 자체 부정 (단 양산 장벽으로 속도 느림)	하이퍼스케일러 자체 백엔드 팀의 테이프아웃 완결 여부(설계→양산 단독 완주), 외주 의존 공정 단계의 내부화
추론 단가 압박 (이미 작동)	XPU	훈련칩 단가 협상력 약화	추론 멀티소싱 확대가 훈련 재계약 가격에 미치는 영향, 세그먼트 ASP 추이
범용 GPU 효율 도약	XPU	커스텀 사이클 지연·축소	엔비디아/AMD 차세대 가격-성능 점프 폭, 하이퍼스케일러 capex의 GPU/ASIC 배분 변화
칩렛 표준화(UCIe) 성숙	XPU	진입장벽 약화, 가격 하락	UCIe 기반 멀티벤더 칩렛 조립 상용화, 제3 설계하우스 점유 상승
엔비디아 머천트 네트워킹	네트워킹·스케일아웃	80% 점유 잠식	Spectrum-X의 타사 시스템 채택 확대(메타·오라클 2025-10 채택), CPO 볼륨 경쟁 결과
스케일업 표준 전쟁	네트워킹·스케일업	도전 좌절, 스케일업 진입 실패	NVLink Fusion으로 NVLink가 커스텀 실리콘에 개방(2025-05), NVIDIA의 Marvell $2B 투자·NVLink Fusion 합류(2026-03-31), UALink 양산 출하 시점

일곱 가지 반증 신호. 위쪽 둘(멀티소싱·내재화)이 위협의 두 길이며, 멀티소싱이 가장 임박합니다. (출처: AVGO 기술 분석 / NVIDIA Newsroom / Marvell IR)

위협의 두 길을 표에서 갈라 놓았습니다. 멀티소싱(을 교체)은 점유를 직접 깎고, 내재화(을 소멸)는 "맡기는 이유"라는 전제 자체를 부정합니다. 둘은 모니터링 신호도 다릅니다. 멀티소싱은 신규 XPU의 복수 파트너 동시 발주로 읽히고, 내재화는 하이퍼스케일러 자체 백엔드 팀이 설계부터 양산까지 단독 완주(테이프아웃 완결)하는지로 읽힙니다. 둘 중 더 치명적인 건 내재화지만, 양산 능력 장벽 때문에 속도가 느립니다. 더 임박한 건 멀티소싱입니다.

가장 임박한 신호는 멀티소싱 가속입니다. 단 Zebrafish가 MediaTek으로 간 사건을 "준독점이 깨졌다"로 읽으면 과장입니다. 정확히는 워크로드 분화의 첫 신호입니다. 추론칩(상대적으로 표준화·범용화 압력이 큰 영역)이 먼저 분리돼 나간 것이고, 이건 이미 진행 중인 흐름입니다. XPU 해자의 고마진 심장은 훈련칩이고, 추론 분리는 그 심장을 직접 겨누지 않습니다.

그래서 진짜 반증 조건은 추론칩이 아니라 훈련칩의 멀티소싱입니다. "고객이 차세대 훈련칩 발주를 브로드컴에 계속 주는가"가 갈림길입니다. 추론은 이미 갈라졌으니 추론칩 멀티소싱은 신호가 아니고, 훈련칩이 갈라지는 순간이 준독점 프리미엄의 진짜 종료 신호입니다.

단, 이 신호들이 동시에·즉각 일어나는 것은 아닙니다. 스케일아웃 네트워킹 해자(견고)와 XPU의 트랙레코드·물리 구현 IP·선단공정 줄서기는 멀티소싱이 진행되는 동안에도 시간을 벌어 줍니다. 따라서 "70%가 곧 무너진다"가 아니라, 고마진·고난도 칸(훈련)을 지키며 저마진·범용 칸(추론)을 분모에 내주는 믹스 정상화입니다.

4.1 반론에 대한 선제 답변

"커스텀 ASIC은 결국 표준화되어 누구나 만든다"는 주장과 "70% 점유면 사실상 독점"이라는 주장은 둘 다 절반만 맞습니다. 분모와 수명을 정확히 보면 양쪽이 동시에 교정됩니다.

"결국 칩렛 표준화로 누구나 만들게 된다"(범용화론)에 대해: 방향은 맞지만 시점이 핵심입니다.

💡 핵심: UCIe 기반 멀티벤더 칩렛 조립이 상용 양산에 이르기까지는 IP 검증·패키징 통합·트랙레코드라는 시간 장벽이 남아 있습니다. 표준화는 진입장벽을 낮추는 장기 위협이지, 다음 1~2세대를 뒤집는 단기 위협이 아닙니다.

"70%면 사실상 독점 아닌가"(준독점론)에 대해서는 이렇게 답합니다. 점유율 크기와 락인 수명은 별개입니다(3.3 참조). 고객이 설계 IP를 소유하는 구조에서 70%는 "매 세대 재획득해야 하는 70%"입니다. 게다가 Marvell처럼 동급 물리 구현 IP를 가진 경쟁사가 있어 매 세대 재획득은 가격·점유 경쟁을 거칩니다. 영구 독점이 아니라, 매 세대 트랙레코드·통합으로 방어해 따내는 갱신형 우위입니다.

"그럼 결국 약한 사업 아닌가"(과소평가론)에 대해서는 아니라고 답합니다. XPU가 시한적이라는 것과 사업이 약하다는 것은 다릅니다. 브로드컴은 같은 회사 안에 견고한 네트워킹 해자를 가졌고, XPU의 시한적 우위도 매 세대 재획득에 성공하는 한 유효합니다. 핵심은 "두 엔진을 분리해서 봐야 한다"이지 "약하다"가 아닙니다.

이 해자가 브로드컴의 재무·문화·미래 전략과 어떻게 맞물리는지, 그리고 적정가는 얼마인지는 종목 메인글에서 종합합니다.

🔬AI 네트워킹 전쟁: 거울상 두 엔진의 다른 쪽

XPU와 정반대인 네트워킹 해자. 표준을 쥔 갑(甲)의 견고함이 왜 XPU의 시한성과 다른지, 두 엔진을 분리해서 봅니다.

→

🔬브로드컴 종합 분석

이 해자가 재무·문화·미래 전략과 어떻게 맞물리고 적정가는 얼마인지, 종목 메인글에서 종합합니다.

→

같은 회사 안에 정반대 두 엔진이 산다. 강함과 약함을 동시에 오해하지 않으려면 분리해서 봐야 한다.

XPU(커스텀 ASIC)는 설계 시장 약 70%를 쥐었지만, 고객이 컴퓨트 코어 IP를 소유하는 수탁 모델이라 해자가 1세대(약 18개월)마다 다시 따내야 하는 갱신형입니다.
네트워킹은 표준을 쥔 갑(甲)이라 해자가 견고합니다. 단 견고한 곳은 클러스터 사이를 잇는 스케일아웃이고, 서버 안을 잇는 스케일업은 엔비디아 NVLink에 도전하는 미확정 전장입니다.
70%가 내려가는 경로는 둘입니다. 훈련칩 멀티소싱(아직 0건, 진짜 종료 신호)과 분모 안 추론 비중 이동(이미 진행 중, 약화가 아닌 믹스 정상화)을 갈라 봐야 합니다.
지켜볼 신호: 훈련칩의 멀티소싱 여부와 스케일업 표준 전쟁의 향방을 직접 점검해보세요. 멀티소싱이 가장 임박하고, 내재화가 가장 치명적이나 느립니다.