AI 공급망 해부: 누가 이기든 왜 TSMC가 만드는가 | TSMC 상세 분석

핵심 요약

TSMC는 AI 칩 공급망의 핵심 길목입니다. NVIDIA와 AMD의 GPU든, 구글·아마존·마이크로소프트·메타의 자체 ASIC이든, 첨단 AI칩은 전부 TSMC의 3nm·2nm 공정에서 만들어집니다. TSMC는 파운드리 시장의 약 70%를 점유하고, AI칩의 실질 병목인 첨단 패키징(CoWoS)까지 사실상 독점합니다. 그래서 AI 칩 경쟁의 승자가 누구든, 모든 길은 TSMC로 통합니다.

1849년 캘리포니아로 가보겠습니다.

금을 찾아 서부로 몰려든 광부는 수십만 명이었습니다. 그러나 정작 부자가 된 사람은 금을 캔 광부가 아니었습니다. 대부분의 광부는 빈손으로 돌아갔고, 일부는 빚을 지고 파산했습니다. 같은 골드러시에서 돈을 번 사람은 따로 있었습니다. 곡괭이와 삽을 판 철물상, 그리고 광부에게 질긴 작업복을 판 리바이 스트라우스(Levi Strauss)였습니다. 리바이스는 1853년 샌프란시스코에서 잡화상으로 시작해, 1873년 리벳 청바지 특허를 받으며 골드러시의 대표 수혜자가 되었습니다. (Wikipedia)

이유는 단순합니다. 금이 어느 광맥에서 나오든, 누가 그 금을 캐든, 곡괭이는 항상 팔렸기 때문입니다. 곡괭이 장수는 "누가 금을 더 많이 캐느냐"의 싸움에 끼어들 필요가 없었습니다. 광부들이 경쟁할수록 곡괭이는 더 많이 팔렸습니다.

AI 골드러시에도 똑같은 곡괭이 장수가 있습니다. 📈TSMTSMC입니다.

AI가 금입니다. NVIDIA·AMD·구글·아마존·마이크로소프트·메타가 광부입니다. 이들은 "누가 더 좋은 AI 칩을 만드느냐"로 치열하게 싸웁니다. 그런데 이 모든 칩은 한 곳에서만 만들어집니다. TSMC입니다.

💡 이 글이 푸는 긴장

AI 칩 전쟁에서 누가 이길지는 아무도 모릅니다. 그러나 누가 이기든 그 칩이 TSMC에서 만들어진다면, "곡괭이가 어떻게 만들어지는가"를 이해하는 것이 "AI 반도체 공급망"을 이해하는 가장 빠른 길입니다.

이 글은 그 곡괭이가 어떻게 만들어지는지를 해부합니다. AI칩 한 개가 설계에서 완제품이 되기까지, 범용 GPU와 맞춤 ASIC이 어떻게 다른지, 그리고 진짜 병목이 왜 미세공정이 아니라 첨단 패키징(CoWoS)인지. 이 글을 다 읽으면 머릿속에 "AI 반도체 공급망"의 전체 구조가 한 장의 지도로 그려집니다.

관통하는 질문은 하나입니다. AI 칩 전쟁의 승자가 누구든, 왜 모든 길은 TSMC로 통하는가? 그 곡괭이는 어떻게 만들어지는가?

순서는 이렇게 잡았습니다. 누가 고객인가(1장) → 어떤 곡괭이이고 어떻게 다른가(2장) → 어떻게 완제품이 되는가(3장) → 전체 공급망 지도(4장).

개념적 시각화. 광부(설계사)는 서로 경쟁하지만 곡괭이의 출처는 한 곳으로 수렴합니다.

1. 모두가 TSMC의 고객이다

AI 칩 시장은 둘로 갈라지는 것처럼 보입니다. 한쪽은 NVIDIA와 AMD의 범용 GPU 전쟁, 다른 쪽은 구글·아마존·마이크로소프트·메타가 NVIDIA를 우회하려는 자체칩 반란입니다. 그런데 이 두 전선의 모든 칩이 한 곳에서 만들어집니다. TSMC입니다.

NVIDIA가 이겨도, AMD가 추격해도, 하이퍼스케일러가 자체칩으로 NVIDIA를 갈아치워도, 그 칩은 전부 TSMC의 3nm·2nm 위에 있습니다. 이것이 "AI 칩 승자와 무관하게 모든 길이 TSMC로 통하는" 구조의 정체입니다. 이 장에서는 그 두 전선을 하나씩 따라가며, 왜 두 전선의 모든 곡괭이가 같은 공장에서 나오는지를 확인합니다.

1.1 파운드리란 무엇이고, TSMC는 그 안에서 어디에 있는가

곡괭이 장수를 이해하려면 먼저 "곡괭이 공장"이 무엇인지 알아야 합니다. 칩을 설계하는 일과 칩을 제조하는 일은 전혀 다른 일이고, TSMC는 그중 "제조"만 합니다. 그런데 첨단 칩 제조는 사실상 TSMC밖에 못 합니다.

파운드리(foundry)란 칩을 직접 설계하지 않고 "남이 설계한 칩을 위탁 생산"하는 회사를 말합니다. NVIDIA·AMD·애플은 칩을 설계만 하고(이렇게 공장 없이 설계만 하는 회사를 팹리스라고 부릅니다), 실제 제조는 TSMC 같은 파운드리에 맡깁니다.

왜 설계와 제조가 이렇게 분리됐을까요? 첨단 팹(반도체 공장) 한 곳을 짓는 데 수백억 달러가 듭니다. 설계사가 직접 팹까지 지으면 도저히 감당이 안 됩니다. 그래서 설계는 설계사가, 제조는 TSMC가 나눠 맡습니다. 이 분업 자체가 곧 파운드리 모델입니다.

📖 잠깐, 파운드리가 정확히 어디에 있는 건가요

반도체는 크게 "데이터를 저장하는 메모리"와 "계산하는 로직"으로 나뉩니다. AI칩(GPU·ASIC)은 전부 로직입니다. 파운드리는 이 로직 칩을 위탁 제조하는 공정 단계를 가리킵니다. 설계도(팹리스가 그림)를 받아 웨이퍼에 실제 회로를 새기는 일이죠. 메모리·로직·AI 반도체가 어떻게 연결되는지는 아래 입문 글에서 처음부터 정리합니다.

🔬반도체 산업 완전 입문

파운드리가 로직 칩 제조에서 어디에 위치하는지, 설계와 제조가 왜 분리됐는지 기초부터 정리합니다.

→

그렇다면 TSMC는 파운드리 시장에서 어디에 있을까요? 압도적인 1위입니다.

파운드리 시장 점유율 (2025)

~70%

7.2%

~22.8%

TSMC

삼성

기타 (UMC·GF·SMIC 등)

출처: 출처: TrendForce (2026.03). TSMC와 삼성의 격차는 62.7%p.

전체 점유율 70%도 압도적이지만, AI칩이 쓰는 최첨단 노드(3nm 이하)로 좁히면 격차는 더 벌어집니다. 여기서는 TSMC가 사실상 유일합니다. (TrendForce)

왜 첨단 노드는 TSMC뿐일까요? 핵심은 수율입니다.

📖 잠깐, '수율'이 무슨 뜻인가요

수율(yield)은 웨이퍼 한 장에서 정상 작동하는 칩의 비율입니다. 칩 100개를 찍었는데 50개만 멀쩡하면 수율 50%입니다. 수율이 낮으면 같은 칩을 만드는 데 비용이 두 배로 들어 가격 경쟁이 안 됩니다. 첨단 칩일수록 회로가 미세해서 작은 결함 하나에도 칩이 죽기 때문에, 수율을 끌어올리는 일이 곧 첨단 제조의 핵심 경쟁력입니다.

삼성의 3nm 수율은 약 50%에서 정체된 것으로 알려져 있는 반면, TSMC는 약 90% 수준입니다. (TrendForce) 인텔의 18A 공정도 외부 고객 확보에 고전하고 있습니다. 결과적으로, AI칩이 요구하는 최첨단 노드를 "대량으로" 양산할 수 있는 곳은 TSMC가 사실상 독점입니다.

이 수율 격차가 단순한 일시적 차이가 아니라는 점이 중요합니다. 삼성이 첨단 노드에서 고전하는 근본 이유는, 새 공정을 설계 검증이 충분히 끝나기 전에 양산으로 밀어붙여 미세 결함을 잡아내는 경험 축적이 TSMC보다 부족하기 때문입니다. 이 "왜"는 조직 문화의 문제이고, TSMC 종목 분석의 문화 챕터에서 더 깊이 다룹니다. 여기서는 "첨단 노드 = 사실상 TSMC"라는 사실만 기억하면 됩니다.

1.2 GPU 전선: NVIDIA가 이기든 AMD가 이기든

AI 칩 전쟁의 첫 번째 전선은 NVIDIA 대 AMD입니다. 두 회사는 GPU 시장에서 치열하게 싸웁니다. 그런데 두 회사의 최신 칩은 둘 다 TSMC에서 만들어집니다. 이 전선의 승패가 어떻게 갈리든, 곡괭이를 찍는 공장은 그대로 TSMC입니다.

📖 잠깐, 'N3'이 무슨 뜻인가요

TSMC는 공정 세대를 "N + 숫자"로 부릅니다. N3은 3nm급, N2는 2nm급입니다. 숫자가 작을수록 회로를 더 미세하게 새기는, 더 앞선 공정입니다. 같은 면적에 트랜지스터를 더 많이 담아 더 빠르고 전력 효율적입니다. 뒤에 붙는 P는 개량 버전이라는 뜻입니다(N3P = N3의 성능 강화판). 아래부터 이 표기가 계속 나오니 한 번만 기억해두면 됩니다.

📈NVDA엔비디아의 로드맵을 보면, Hopper(N4)에서 Blackwell(N4P)을 거쳐 2026년 양산되는 Rubin(N3P)까지 전부 TSMC 공정입니다. 패키징도 CoWoS-S에서 CoWoS-L로 진화하는데, 이 패키징 역시 TSMC가 맡습니다. (CoinCentral)

추격자인 📈AMDAMD도 마찬가지입니다. MI300X(N5)에서 MI350X(N3P)를 거쳐 2nm가 예정된 MI400까지, 전부 TSMC에서 CoWoS 패키징을 거칩니다. (7evenguy)

NVIDIA (GPU 로드맵)

Hopper → N4

Blackwell → N4P

Rubin(2026) → N3P

패키징: CoWoS-S → CoWoS-L

제조: 전부 TSMC

AMD (GPU 로드맵)

MI300X → N5

MI350X → N3P

MI400 → N2(2nm 예정)

패키징: CoWoS-L

제조: 전부 TSMC

핵심은 이것입니다. 두 광부가 시장을 두고 다투지만, 곡괭이의 출처는 동일합니다. 어느 쪽이 더 많이 팔리든, 그 곡괭이는 같은 공장에서 나옵니다. GPU 전선의 승부는 TSMC의 고객이 누구냐를 바꿀 뿐, TSMC가 곡괭이 장수라는 사실은 바꾸지 못합니다.

1.3 ASIC 전선: 광부가 직접 곡괭이를 설계해도

두 번째 전선은 더 흥미롭습니다. 구글·아마존·마이크로소프트·메타는 NVIDIA에 의존하기 싫어서 자체 AI 칩을 직접 설계하기 시작했습니다. NVIDIA를 우회하려는 시도입니다. 그런데 이 자체칩들마저 전부 TSMC에서 만들어집니다.

광부가 "NVIDIA 곡괭이를 안 쓰겠다"며 직접 곡괭이를 설계해도, 그 곡괭이 역시 TSMC 공장에서 찍힙니다. 우회의 대상은 NVIDIA였지, TSMC가 아니었던 겁니다.

고객	대표 자체칩	TSMC 공정
Google	TPU (v7 Ironwood → 8세대)	N3P → N2
Amazon	Trainium3 / Trainium4	N3 / 3nm급
Microsoft	Maia 200	N3
Meta	MTIA 300 / 400 / 500	3nm

출처: Tom's Hardware, TheNextWeb. 각 칩의 설계 철학 차이는 2장, 종합 지도는 4장.

이 표가 보여주는 것은 단 하나입니다. "전원 TSMC"입니다. 2026~2027년 모든 하이퍼스케일러의 자체칩이 TSMC의 3nm 또는 2nm 위에 올라갑니다. 구글의 8세대 TPU는 아예 N2(2nm)로 진입합니다. NVIDIA를 우회해도 TSMC는 우회할 수 없습니다. (Tom's Hardware, TheNextWeb)

이것이 "곡괭이 장수" 구조의 완성형입니다. GPU든 ASIC이든, NVIDIA를 쓰든 우회하든, 첨단 AI칩의 모든 경로가 TSMC로 수렴합니다.

💡 핵심: "모든 길이 TSMC로 통한다"의 정체

AI 칩 전쟁에는 두 전선이 있습니다. GPU 전선(NVIDIA 대 AMD)과 ASIC 전선(하이퍼스케일러 자체칩의 NVIDIA 우회)입니다. 두 전선의 모든 칩이 TSMC에서 만들어집니다. 곡괭이 장수는 "누가 금을 더 캐는가"의 승부에 끼어들 필요가 없습니다. 어느 광부가 이기든 곡괭이는 그의 손에 들려 있고, 그 곡괭이는 TSMC에서 나왔으니까요.

1장 결론: 첫 단계든 마지막 단계든, AI칩의 모든 경로는 TSMC로 수렴한다.

파운드리 = 위탁 제조. TSMC는 파운드리 약 70%, 첨단 노드(3nm 이하)는 사실상 독점.
GPU 전선(NVIDIA·AMD)도, ASIC 전선(구글·아마존·MS·메타 자체칩)도 전부 TSMC.
첨단 AI칩의 모든 경로가 TSMC로 수렴한다.
다음 질문: GPU와 ASIC, 둘은 어떻게 다른 곡괭이인가? 왜 둘 다 TSMC인가?

2. GPU vs ASIC: 두 개의 곡괭이를 해부한다

모든 광부가 TSMC 곡괭이를 쓴다고 했습니다. 그런데 곡괭이가 한 종류가 아닙니다. NVIDIA·AMD의 범용 GPU는 "뭐든 캘 수 있는 만능 곡괭이"이고, 하이퍼스케일러의 ASIC은 "특정 광맥 전용 곡괭이"입니다.

이 장에서는 두 칩을 아키텍처·범용성·전력효율·소프트웨어 생태계의 네 축으로 깊이 해부합니다. 그리고 구글·아마존·MS·메타의 자체칩이 각각 어떤 설계 철학으로 만들어졌는지 비교합니다. 두 곡괭이의 차이를 이해하면, AI 반도체 공급망의 절반을 이해한 것입니다.

2.1 아키텍처: 만능 도구 vs 전용 도구

GPU는 원래 그래픽을 그리려고 만든 "대규모 병렬 계산기"입니다. 수천 개의 작은 코어가 동시에 같은 종류의 연산을 처리합니다. 그래서 어떤 AI 모델이든 돌릴 수 있습니다.

ASIC은 정반대입니다. 특정 연산(예: 행렬 곱셈)만 하도록 회로를 통째로 굳혀버린 칩입니다. 한 가지 일만 하지만, 그 일에서는 GPU를 압도합니다.

개념적 시각화. 정확한 회로도가 아니라 구조 이해를 위한 도식입니다. MXU(Matrix Multiply Unit)는 행렬 곱셈만 전담하는 전용 계산 격자입니다.

GPU는 어떤 모델이든 수용하는 "프로그래밍 가능한" 하드웨어입니다. 반면 ASIC은 특정 연산을 하드웨어에 고정합니다. 예를 들어 구글 TPU는 행렬 곱셈만 전담하는 거대한 전용 계산 격자(systolic array, 흔히 MXU라고 부릅니다)를 칩에 직접 박아넣었습니다. AI 연산의 대부분이 행렬 곱셈이라, 이것만 빠르게 하도록 회로를 굳히면 범용 GPU보다 효율이 높아집니다. 유연성을 버리고 효율을 극대화한 설계입니다.

비유로 정리하면 이렇습니다. GPU는 스위스 아미 나이프입니다. 뭐든 되지만 각 기능이 최적은 아닙니다. ASIC은 전용 회칼입니다. 회 뜨는 것만 하지만 그것만은 최고입니다.

핵심 트레이드오프는 단순합니다. 범용성을 포기할수록 효율이 오릅니다. 그래서 워크로드가 고정될수록(뒤에서 볼 추론) ASIC이 유리해집니다.

2.2 범용성·전력효율: 왜 추론은 ASIC으로 가는가

AI 작업은 크게 둘입니다. 모델을 가르치는 "학습"과, 가르친 모델을 쓰는 "추론"입니다. 학습은 매번 새로운 실험이라 유연한 GPU가 유리합니다. 추론은 같은 연산을 수십억 번 반복합니다. 사용자가 프롬프트를 넣을 때마다 발생하죠. 이 반복 작업에서는 전용 ASIC이 전력과 비용에서 GPU를 크게 앞섭니다.

🎓 학습 (Training)

모델 구조가 자주 바뀜 (실험적)

유연한 GPU에 적합

1회성에 가까움

범용성이 가치

⚡ 추론 (Inference)

완성된 모델을 반복 실행

워크로드 고정 → ASIC에 적합

사용자 요청마다 발생 (상시)

효율성이 가치

여기서 핵심은 누적 규모입니다. 한 번 가르친 모델을 수십억 번 쓰기 때문에, 추론은 사용자 요청이 쌓일수록 학습을 압도합니다. OpenAI의 2024년 내부 자료에서도 추론 비용이 학습 비용을 수십 배 단위로 상회하는 것으로 나타났습니다. (TechTimes)

전력 효율에서도 ASIC이 앞섭니다. ASIC은 불필요한 범용 회로가 없어 같은 연산을 더 적은 전력으로 수행합니다. 데이터센터에서 전력이 곧 비용인 시대에, 이 차이는 결정적인 우위가 됩니다.

시장도 같은 방향을 가리킵니다. 2026년 CSP(클라우드 사업자)의 자체 ASIC은 성장률 +44.6%로, GPU의 +16.1%를 크게 앞서고 있습니다. 추론 비중이 커지면서 ASIC이 빠르게 확산되는 중입니다. (TrendForce)

2026 AI 가속기 성장률: ASIC vs GPU

+44.6%

+16.1%

CSP 자체 ASIC

GPU

출처: 출처: TrendForce (2026).

다만 한계도 분명합니다. ASIC은 알고리즘이 바뀌면 칩을 다시 설계해야 합니다. 모델 구조가 급변하면 어렵게 만든 ASIC이 한순간에 무용지물이 될 위험이 있습니다. GPU의 유연성이 일종의 보험인 이유입니다.

2.3 소프트웨어 생태계: CUDA라는 보이지 않는 해자

하드웨어 성능이 전부가 아닙니다. NVIDIA가 강한 진짜 이유는 CUDA라는 소프트웨어 생태계입니다. 20년간 쌓인 라이브러리·도구·개발자 습관이 NVIDIA GPU에 묶여 있습니다. ASIC은 이 생태계를 처음부터 다시 만들어야 합니다. 곡괭이 머리(하드웨어)는 따라 만들어도, 곡괭이를 쓰는 법(소프트웨어)을 따라잡는 건 다른 문제입니다.

CUDA는 NVIDIA가 2007년부터 구축해온 GPU 프로그래밍 플랫폼입니다. 대부분의 AI 프레임워크(PyTorch 등)가 CUDA에 최적화되어 있고, 수백만 명의 개발자가 CUDA에 익숙합니다. 새로운 칩이 아무리 빨라도, 개발자가 그 칩을 쉽게 프로그래밍할 수 없으면 채택되지 않습니다.

그렇다면 ASIC을 만드는 하이퍼스케일러는 이 소프트웨어 부담을 어떻게 감당할까요? 자체칩은 컴파일러·라이브러리·디버깅 도구를 직접 만들어야 합니다. 보통은 엄청난 부담이지만, 하이퍼스케일러는 이걸 감당할 수 있습니다. 자기 데이터센터에서 자기 모델만 돌리므로, 워크로드가 고정돼 있어 "한 번 만들면 계속 쓰기" 때문입니다.

💡 왜 하이퍼스케일러만 ASIC을 만드나

자체 데이터센터에서 자기 모델만 돌리므로 외부 생태계가 필요 없습니다. 외부 판매가 목적이 아니라 자가 소비입니다. 반면 외부 판매를 노리는 칩은 CUDA 같은 생태계 없이는 채택이 어렵습니다. 그래서 ASIC은 "스스로 쓰는 회사"에서만 경제성이 나옵니다.

정리하면, GPU의 해자는 하드웨어와 소프트웨어의 이중 구조입니다. ASIC은 하드웨어 효율로 특정 영역(추론)을 잠식하되, 범용 시장의 소프트웨어 장벽은 여전히 높게 남습니다. 이 생태계 싸움이 GPU 독점의 미래를 어떻게 가를지는 아래 글에서 더 깊이 다룹니다.

🔬GPU 독점은 영원한가?

CUDA 생태계가 만든 NVIDIA의 해자가 ASIC의 부상으로 어디까지 흔들릴 수 있는지 분석합니다.

→

2.4 하이퍼스케일러 4사의 설계 철학 비교

자체칩이라고 다 같지 않습니다. 구글은 가장 오래됐고 가장 공격적이고(8세대에서 학습·추론 칩을 아예 분리), 아마존은 학습 특화, MS는 자사 OpenAI 워크로드 전용, 메타는 추론 중심으로 세대를 빠르게 늘립니다. 각자의 데이터센터에서 무엇을 돌리느냐가 칩의 모양을 결정합니다.

회사	칩	설계 철학	노드	용도
Google	TPU (v7 → 8세대)	가장 성숙. 8세대에서 학습(Sunfish)·추론(Zebrafish) 칩 분리	N3P → N2	학습+추론 (분리 진화)
Amazon	Trainium3/4	학습 비용 절감 특화. AWS 첫 3nm	N3 → 3nm급	학습 중심
Microsoft	Maia 200	자사 OpenAI 워크로드(GPT-5.2) 전용. 140억+ 트랜지스터	N3	추론 (자사 모델 구동)
Meta	MTIA 100 → 500	추론 중심. 세대를 빠르게 늘려 추천·랭킹에 맞춤	N7 → N5 → 3nm	추론 (추천·랭킹)

출처: Tom's Hardware, TheNextWeb.

공통점은 명확합니다. 전원 TSMC 3nm/2nm입니다. 자가 워크로드가 고정돼 있어 ASIC의 효율을 극대화할 수 있는 조건을 갖췄습니다.

차이점은 "무엇을 돌리느냐"에서 갈립니다. 구글은 학습·추론 분리까지 갈 만큼 성숙했고, 메타는 추론 전용 세대를 빠르게 회전시키며, MS는 OpenAI라는 단일 거대 고객(자사)을 위한 전용 설계로 갑니다.

특히 주목할 것은 구글 8세대입니다. 학습용 Sunfish(Broadcom 설계, 2개 컴퓨트 다이)와 추론용 Zebrafish(MediaTek 설계, 단일 컴퓨트 다이, 추론 20~30% 저비용)를 아예 분리했습니다. "한 칩으로 다 하던" 시대에서 "용도별 전용칩" 시대로의 전환을 상징하는 사례입니다. (TheNextWeb, Tom's Hardware)

💡 핵심: ASIC도 결국 TSMC + 패키징을 거친다

자체칩 4사의 설계 철학은 제각각이지만, 제조 경로는 동일합니다. 전부 TSMC 첨단 노드에서 찍고, 상당수가 CoWoS 패키징을 거칩니다. 추론 칩(구글 Zebrafish)을 설계한 MediaTek은 TSMC에 CoWoS 패키징 용량을 7배 늘려달라고 요청했습니다. ASIC이 늘어날수록 다음 장에서 다룰 'CoWoS 관문'도 함께 붐빕니다.

2장 결론: 곡괭이는 두 종류지만, 둘 다 TSMC를 거친다.

GPU는 범용 만능 곡괭이(아키텍처 유연 + CUDA 생태계), ASIC은 전용 곡괭이(효율 극대화 + 생태계 부담).
추론 비중 증가로 ASIC이 빠르게 확산(+44.6%). 단 알고리즘 급변 시 ASIC 무용화 위험이 GPU 유연성의 보험 가치를 남긴다.
하이퍼스케일러 4사는 자가 워크로드에 따라 다른 설계 철학. 구글은 학습·추론 분리까지 진화.
그러나 둘 다, 4사 모두 TSMC 첨단 노드 + 패키징을 거친다. 다음 장: 그 패키징이 진짜 관문이다.

3. CoWoS: 진짜 관문은 미세공정이 아니다

사람들은 TSMC의 해자가 "미세공정(3nm·2nm)"이라고 생각합니다. 절반만 맞습니다. AI칩을 실제로 만들 수 있느냐를 결정하는 진짜 병목은 따로 있습니다. CoWoS라는 첨단 패키징입니다.

AI칩은 거대한 연산 다이에 여러 개의 HBM 메모리를 한 패키지에 정밀하게 붙여야 작동합니다. 이 "붙이는 기술"을 플래그십 AI칩 수준으로 할 수 있는 곳은 TSMC뿐입니다. 곡괭이 머리(미세공정 칩)를 만들 수 있어도, 손잡이를 끼우는 조립소(패키징)가 TSMC밖에 없다면, 곡괭이는 결국 TSMC에서만 완성됩니다.

3.1 AI칩은 칩 하나가 아니다: 왜 패키징이 병목인가

AI 가속기는 단일 칩이 아닙니다. 거대한 연산 칩과 여러 개의 HBM 메모리 스택을 하나의 패키지에 정밀하게 붙인 "집합체"입니다. 이 붙이는 공정이 CoWoS입니다. 그리고 이 공정의 난이도가 AI칩 생산의 실질 한계를 정합니다.

📖 잠깐, 'HBM'이 무슨 뜻인가요

AI칩은 계산을 엄청나게 빨리 합니다. 그런데 계산할 데이터를 메모리에서 제때 못 보내주면, 빠른 계산기가 데이터를 기다리며 놉니다. 그래서 메모리(HBM, High Bandwidth Memory)를 연산 칩 바로 옆에 여러 층으로 쌓고, 아주 넓은 초고속 통로로 연결합니다. HBM은 "연산 칩 옆에 붙여 데이터를 빠르게 공급하는 전용 고속 메모리"라고 이해하면 됩니다. 이 HBM 자체는 SK하이닉스·삼성·마이크론이 만듭니다(4장에서 다룹니다).

AI칩의 구성을 풀어보면, 연산 다이(GPU 또는 ASIC) 하나에 HBM 스택 여러 개가 붙는 구조입니다. 둘을 아주 가까이, 아주 넓은 통로로 연결해야 합니다. 떨어뜨려 놓으면 빠른 계산기가 데이터를 못 받아 놀게 됩니다. 이것을 메모리 병목이라고 합니다.

CoWoS(Chip-on-Wafer-on-Substrate)는 이 문제를 푸는 첨단 패키징입니다. 연산 다이와 HBM을 인터포저 위에 나란히 올려 초고밀도로 연결하는 2.5D 패키징이죠. AI 가속기에는 필수 공정입니다.

개념적 시각화. 연산 다이 1개에 HBM 여러 스택이 인터포저 위에서 초고밀도로 연결됩니다.

여기서 인터포저라는 부품이 핵심입니다.

📖 잠깐, '인터포저'가 무슨 뜻인가요

인터포저(interposer)는 연산 칩과 메모리를 올려놓고 둘 사이를 촘촘한 배선으로 이어주는 실리콘 받침판입니다. 일반 기판보다 배선이 수천 배 촘촘해서, 칩과 메모리 사이에 넓은 고속 통로를 만들 수 있습니다. CoWoS의 핵심 부품이고, 인터포저를 무엇으로 어떻게 만드느냐가 다음 절에서 볼 CoWoS의 종류를 가릅니다.

이제 "왜 패키징이 병목인가"의 답이 보입니다. 미세공정(전공정)으로 연산 칩을 아무리 많이 찍어도, CoWoS(후공정)로 HBM과 붙이지 못하면 AI칩이 완성되지 않습니다. 그래서 CoWoS 용량이 곧 AI칩 공급의 실질 상한이 됩니다. 전공정이 병목이 아니라, 후공정이 병목입니다.

3.2 CoWoS-S / L / R: 세 가지 패키징의 구조와 역할

CoWoS도 한 종류가 아닙니다. 인터포저를 무엇으로 만드느냐에 따라 S·L·R 세 갈래로 나뉩니다. 칩이 커질수록 더 정교한 방식이 필요합니다. NVIDIA Rubin 같은 초대형 AI칩은 가장 진보한 CoWoS-L 없이는 물리적으로 만들 수조차 없습니다.

종류	인터포저	특징	주요 적용
CoWoS-S	단일 실리콘 인터포저	현재 주류. 고대역폭·고밀도. 레티클 한도 내	NVIDIA H100, AMD MI300X
CoWoS-L	로컬 실리콘 브리지(LSI)	표준 레티클의 약 6배 패키지 허용. 초대형 칩용	NVIDIA Blackwell/Rubin, AMD MI350X+
CoWoS-R	유기(InFO) 인터포저	실리콘 대비 비용 절감. 네트워킹 등 중급	중급 제품

출처: 7evenguy, Tom's Hardware.

왜 더 큰 패키지가 필요할까요? 반도체는 빛으로 회로를 새기는 "도장"을 한 번 찍어 만드는데, 그 도장 한 번에 새길 수 있는 최대 면적이 정해져 있습니다. 이것을 레티클 한계(약 858mm²)라고 합니다. 거대 AI칩은 이 한 장보다 커서 한 번에 못 찍습니다. 그래서 여러 조각(연산 다이 + 다수 HBM)을 따로 만들어 한 패키지에 이어붙이는데, 이때 표준 레티클을 넘는 큰 인터포저가 필수가 됩니다.

CoWoS-L의 핵심이 바로 여기 있습니다. 작은 실리콘 브리지(LSI)들을 유기 기판에 박아 큰 면적을 커버하는 방식입니다. NVIDIA와 TSMC가 함께 개발했고, Blackwell·Rubin의 거대 패키지는 CoWoS-L 없이는 제조가 불가능합니다. (Tom's Hardware)

칩은 앞으로도 계속 커집니다. TSMC는 이 흐름을 한발 앞서 준비하고 있습니다. 차세대 패널 레벨 패키징인 CoPoS를 선제 개발 중인데, 파일럿 라인은 2026년 6월, 본격 양산(램프)은 2028~2029년을 겨냥하고 있습니다. 패키징 관문 자체를 미리 확장해두는 전략입니다. (TrendForce)

3.3 OSAT는 왜 대체하지 못하는가

그렇다면 다른 패키징 업체가 CoWoS를 대신하면 되지 않을까요? 이런 전문 패키징·테스트 외주 업체를 OSAT(Outsourced Semiconductor Assembly and Test)라고 부릅니다. 실제로 ASE·Amkor 같은 OSAT가 일부 물량을 받습니다. 그러나 플래그십 AI칩은 받지 못합니다. NVIDIA Rubin, AMD MI350X 같은 최상위 칩의 CoWoS-L은 TSMC가 사실상 독점합니다. OSAT는 "넘쳐나는 중급 물량"만 흡수합니다.

TSMC CoWoS-L

플래그십 AI칩(Rubin·MI350X): 독점 공급

핵심 플래그십 전담

전공정·후공정 수율 연동

NVIDIA와 공동 개발한 아키텍처

OSAT (ASE·Amkor)

플래그십: 불가 (기술·인증 격차)

중급·비핵심(CPU·자동차) 흡수

오버플로우 흡수 역할

약 80K wafer/연 (비핵심 한정)

TSMC가 플래그십 CoWoS를 독점하는 데는 네 가지 구조적 이유가 있습니다.

첫째, 공동 개발입니다. CoWoS-L은 TSMC와 NVIDIA가 함께 개발한 아키텍처입니다. 타사가 같은 구조를 처음부터 구현하기 어렵습니다.

둘째, 수율 연동입니다. TSMC 전공정(연산 다이) 수율과 후공정(CoWoS) 수율이 한 지붕 아래에서 연동됩니다. 이를 분리하면 수율 리스크가 커집니다.

셋째, 칩 크기입니다. Rubin·MI350X는 CoWoS-L 없이는 물리적으로 제조가 불가능합니다. OSAT는 아직 이 수준의 대면적 패키징 역량에 미달합니다.

넷째, 인증 장벽입니다. 플래그십 GPU의 패키징 공정 인증에는 수년이 걸립니다. OSAT는 아직 그 인증을 통과한 라인이 없습니다. (DigiTimes)

결과적으로 OSAT는 TSMC가 못 받는 중급·비핵심 물량(CPU·자동차 등)을 흡수하는 보조 역할에 머뭅니다. 플래그십 AI칩의 패키징은 TSMC가 단일 관문으로 남습니다.

3.4 '완판'의 의미: 곡괭이 조립소가 풀가동이다

TSMC의 CoWoS 용량은 2026년까지 전량 예약(sold out) 상태입니다. 용량을 2023년 대비 약 10배(2026년 말 목표 약 130K WPM)로 늘렸는데도 여전히 모자랍니다. 이 완판은 AI 반도체 공급망의 가장 좁은 길목이 어디인지를 정확히 보여줍니다. (FinancialContent, TrendForce)

기준(1x)

~75K

~130K WPM

2023

2025말

2026E 목표

출처: 출처: FinancialContent. 2023 대비 약 10배. WPM = 월간 웨이퍼 생산량.

이 완판이 말해주는 공급망의 진실은 분명합니다. AI칩 생산의 가장 좁은 길목은 미세공정 팹이 아니라 CoWoS 조립소입니다. 모든 광부가 곡괭이를 더 달라고 줄을 서 있는데, 곡괭이 손잡이를 끼우는 조립소가 풀가동이라 더 못 만드는 상황입니다.

그래서 이 병목이 AI칩 공급 곡선의 모양을 정합니다. CoWoS 용량이 늘어나는 속도가 곧 첨단 AI칩이 시장에 풀리는 속도입니다.

💡 핵심: 진짜 해자는 미세공정 + 패키징의 결합

TSMC의 해자는 "3nm·2nm 미세공정"만이 아닙니다. 미세공정은 삼성·인텔도 따라오려 합니다. 그러나 미세공정(곡괭이 머리)과 CoWoS 패키징(손잡이 조립)을 한 지붕 아래에서 수율 연동까지 맞춰내는 곳은 TSMC뿐입니다. AI칩이라는 곡괭이는 머리와 손잡이가 따로 놀면 작동하지 않습니다. 이 '통합 제조'가 TSMC의 진짜 관문입니다.

3장 결론: AI칩의 진짜 병목은 미세공정이 아니라 첨단 패키징(CoWoS)이다.

AI칩은 연산 다이 + HBM의 집합체. 둘을 붙이는 CoWoS가 완성의 관문이다.
CoWoS는 S·L·R 세 종류. 초대형 AI칩(Rubin)은 CoWoS-L 없이 제조 불가.
플래그십 CoWoS는 TSMC 사실상 독점(공동개발·수율연동·칩크기·인증). OSAT는 중급 물량만 흡수.
CoWoS 완판 = AI 반도체 공급망의 가장 좁은 길목이 어디인지 보여주는 신호.

4. AI칩 한 개가 완제품이 되기까지: 공급망 전체 지도

지금까지 본 것을 하나의 흐름으로 잇겠습니다. AI칩 한 개는 설계 → 제조(전공정) → 패키징(후공정) → 테스트를 거쳐 완제품이 됩니다. 각 단계마다 다른 플레이어가 있지만, 그 흐름의 가장 결정적인 두 단계(첨단 제조 + 첨단 패키징)에 TSMC가 동시에 서 있습니다.

이 지도를 보면 "AI 반도체 공급망"에서 TSMC의 위치가 한눈에 잡힙니다. 그리고 고객이 아무리 늘어나도(NVIDIA·AMD·구글·아마존·MS·메타) 그들이 어떤 칩을 어디서 만드는지가 보입니다.

4.1 설계 → 제조 → 패키징 → 테스트: 4단계 흐름

AI칩은 한 회사가 처음부터 끝까지 만들지 않습니다. 설계사가 그리고, 파운드리가 찍고, 패키징이 조립하고, 테스트가 검증합니다. 이 분업 구조에서 각 단계의 주인공이 다릅니다. 그런데 가장 비싸고 어려운 두 단계를 TSMC가 쥐고 있습니다.

개념적 시각화. ②제조와 ③패키징(보라 강조)을 TSMC가 동시에 점유하고, 메모리(HBM)는 ③패키징 단계에서 합류합니다.

핵심 관찰은 이렇습니다. 설계사는 여섯 곳 넘게 경쟁하고 테스트는 여러 곳이 나눠 갖지만, ②제조와 ③패키징이라는 가장 어렵고 비싼 두 단계는 TSMC로 수렴합니다.

여기서 HBM의 위치를 짚어야 합니다. HBM 메모리 자체는 📈000660SK하이닉스·삼성·마이크론 단 3사가 만듭니다. 곡괭이 손잡이를 만드는 대장간조차 소수 독과점인 셈입니다. 그리고 그 HBM을 연산 다이와 결합하는 ③패키징은 다시 TSMC를 거칩니다. 즉 메모리 3사도 결국 TSMC 조립소에서 칩과 만납니다.

공급망 구조의 함의는 양면적입니다. AI칩 공급망은 단계마다 소수에 집중돼 있습니다. 로직 제조는 TSMC, 패키징도 TSMC, 메모리는 3사입니다. 이 집중은 효율과 품질을 만들지만, 동시에 단일 집중은 단일 취약점이 됩니다. 한 길목이 막히면 공급망 전체가 멈춥니다. (이 취약점의 투자 함의는 본 글의 범위 밖입니다.)

이 구조가 "곡괭이 장수" 비유의 정확한 메커니즘입니다. 광부(설계사)가 누구든, 그 곡괭이는 TSMC의 제조·패키징 라인을 통과해야 완성됩니다.

4.2 고객 지도: 누가 어떤 칩을 어디서 만드는가

광부가 늘어나는 것처럼 보입니다. NVIDIA·AMD에 더해 구글·아마존·MS·메타까지. 그런데 이들이 만드는 칩을 공정별로 정리하면, 전부 TSMC의 같은 라인으로 모입니다. 누가 어떤 칩을 어디서 만드는지를 한 장의 지도로 정리합니다.

설계사	대표 칩	유형	TSMC 공정	패키징
NVIDIA	Rubin	GPU	N3P	CoWoS-L
AMD	MI350X / MI400	GPU	N3P / N2	CoWoS-L
Google	TPU v7 / 8세대	ASIC	N3P / N2	CoWoS
Amazon	Trainium3/4	ASIC	N3 / 3nm급	CoWoS
Microsoft	Maia 200	ASIC	N3	(자체 구성)
Meta	MTIA 300+	ASIC	3nm	CoWoS

출처: Tom's Hardware, TheNextWeb, 7evenguy.

표를 읽는 법은 간단합니다. 유형(GPU/ASIC)도 다르고 설계사도 다르지만, 공정 열은 전부 TSMC N3/N2이고, 패키징 열은 대부분 CoWoS입니다. 고객은 분산돼도 제조 경로는 한 곳으로 수렴합니다.

여기에 메모리(HBM) 공급망까지 겹쳐 보면 구조가 완성됩니다. 위 칩 대부분이 HBM을 탑재하고, 그 HBM과 연산 다이의 결합이 다시 CoWoS입니다. 즉 AI칩 공급망은 "로직(TSMC) + 메모리(HBM 3사) + 패키징(TSMC)"의 삼각 구조이며, 그중 두 꼭짓점을 TSMC가 차지합니다.

참고로, 고객별 매출 규모나 비중 같은 정량 분석은 이 글의 범위가 아닙니다. 이 글은 "누가 어떤 칩을 어디서 만드는가"의 구조만 다룹니다.

4.3 공급망에서 TSMC의 위치가 의미하는 것

공급망 지도를 다 그리고 나면, TSMC의 위치가 명확해집니다. AI칩이라는 곡괭이가 완성되는 길목, 그중에서도 가장 좁고 가장 어려운 두 길목(첨단 제조 + 첨단 패키징)을 동시에 지키는 자리. 이것이 "AI 칩 승자가 누구든 모든 길이 TSMC로 통하는" 구조의 정체입니다.

다만 이 위치는 한 가지 전제 위에 있습니다. "AI칩 수요가 계속된다"는 것입니다. 골드러시가 계속되는 한 곡괭이 장수의 길목은 붐빕니다. 그 수요가 어떤 동력으로 움직이고 언제 둔화하는지는 별도의 주제입니다.

🔬AI Capex 사이클: 골드러시는 언제까지인가

AI 인프라 투자가 어떤 동력으로 움직이고, 어떤 조건에서 둔화하는지 분석합니다. 곡괭이 수요 자체의 지속성을 다룹니다.

→

공급망 관점의 결론은 이렇습니다. AI칩 설계 경쟁(누가 더 좋은 곡괭이를 그리는가)은 격렬하지만, 그 곡괭이가 통과하는 제조·패키징 길목은 단일합니다. 공급망의 권력은 설계의 다양성이 아니라 제조의 집중에 있습니다.

4장 결론: 고객은 분산돼도 제조 경로는 TSMC로 수렴한다.

AI칩은 설계 → 제조 → 패키징 → 테스트의 분업 구조. 가장 어려운 두 단계(제조·패키징)를 TSMC가 동시 점유.
HBM(메모리) 공급망도 결국 CoWoS 패키징에서 TSMC를 거친다. 공급망은 로직+메모리+패키징의 삼각 구조.
고객은 분산(GPU 2사 + ASIC 4사)돼도 제조 경로는 TSMC로 수렴.
공급망의 권력은 설계의 다양성이 아니라 제조의 집중에서 나온다.

5. 모든 길은 TSMC로 통한다: AI 반도체 공급망의 구조

AI 칩 전쟁의 승자가 누구든, 그 곡괭이는 TSMC에서 만들어집니다. 이 글은 그 곡괭이가 어떻게 만들어지는지를 해부했습니다.

GPU와 ASIC은 아키텍처·범용성·전력효율·소프트웨어 생태계에서 다른 도구이지만, 둘 다 TSMC 첨단 노드를 거칩니다. 그리고 AI칩의 진짜 병목은 미세공정이 아니라 첨단 패키징(CoWoS)이며, 그 플래그십 패키징은 TSMC가 사실상 독점합니다. AI칩 한 개가 설계에서 완제품이 되는 4단계 흐름에서, 가장 어렵고 가장 좁은 두 길목을 TSMC가 동시에 지킵니다.

이것이 "AI 반도체 공급망"의 구조이고, 곡괭이 장수의 자리가 어디서 오는지에 대한 답입니다.

💡 AI 반도체 공급망, 한 장의 구조

① 광부는 여럿이다. NVIDIA·AMD(GPU), 구글·아마존·MS·메타(ASIC). 설계 경쟁은 격렬하다.

② 곡괭이는 두 종류다. 만능 GPU(유연 + CUDA 생태계)와 전용 ASIC(효율 극대화). 용도가 곡괭이 모양을 정한다.

③ 진짜 관문은 패키징이다. 미세공정이 아니라 CoWoS가 AI칩 공급의 병목. 플래그십은 TSMC 독점.

④ 모든 길은 TSMC로 통한다. 설계가 누구든, 제조·패키징의 두 길목은 단일하다. 공급망의 권력은 제조의 집중에서 온다.

곡괭이 장수의 자리를 공급망에서 확인했다면, 다음 질문은 자연스럽게 이어집니다. TSMC를 하나의 기업으로서 어떻게 볼 것인가. 제품·재무·문화·미래·밸류에이션 전체를 보려면 종목 분석으로 이어집니다.

🔬TSMC 종목 분석

공급망에서 곡괭이 장수의 자리를 확인했다면, TSMC를 기업으로서 어떻게 볼 것인가. 제품·재무·문화·미래·밸류에이션 전체 분석으로 이어집니다.

→

모든 길은 TSMC로 통한다: AI 반도체 공급망의 구조

AI 칩 전쟁의 승자가 누구든, 그 곡괭이는 TSMC에서 만들어진다. NVIDIA·AMD GPU도, 구글·아마존·MS·메타 ASIC도 전부 TSMC N3/N2.
GPU와 ASIC은 아키텍처·범용성·전력효율·소프트웨어 생태계에서 다른 도구. 그러나 둘 다 TSMC를 거친다.
진짜 병목은 미세공정이 아니라 첨단 패키징(CoWoS). 플래그십 AI칩 패키징은 TSMC 사실상 독점.
AI칩 공급망은 설계 → 제조 → 패키징 → 테스트. 가장 어려운 두 단계(제조·패키징)를 TSMC가 동시 점유.
공급망의 권력은 설계의 다양성이 아니라 제조의 집중에서 나온다.