단백질: 설계는 오픈소스, 곡괭이는 wet-lab

🔎 한눈에 요약

단백질을 설계하는 일은 사실상 공짜가 됐습니다. 알파폴드도, 새 단백질을 그리는 RFdiffusion·ESM도 통째로 오픈소스로 풀렸고, 더 결정적으로 이 분야 회사들이 자기 핵심 모델을 스스로 무료로 공개했습니다(제너레이트→크로마, 프로플루언트→오픈크리스퍼). 단 이것은 왕관의 보석을 던진 게 아닙니다. 회사들은 보석(독점 데이터)을 지키려고 포장지(모델)를 버렸습니다. 그래서 곡괭이는 생성한 단백질을 실제로 만들어 검증하는 wet-lab과 그 위의 독점 데이터로 이동했습니다. 곡괭이는 약하지 않습니다. 빅파마가 단백질 발굴사에 외주로 거액의 통행료를 내고 있고(노바티스 $1B+·AZ 최대 $247M 검증), 자동화 wet-lab은 한 곳에 $156M+·4~6년이 드는 자본설비라 쉽게 우회되지 않습니다. 그런데 역설이 있습니다. 단백질은 검증장벽이 신약 다음으로 높은데도, 2편의 XtalPi 같은 살 수 있는(상장) 곡괭이 승자가 안 보입니다. 곡괭이가 약해서가 아니라, 설계가 더 빨리 공짜가 돼 곡괭이가 한 단계 더 깊은 비상장 데이터 보유사(크래들·차이)로 이동했기 때문입니다. 핵심은 "곡괭이가 약하다"가 아니라 "곡괭이는 있는데 살 수 있는 자리에는 없다"입니다. 곡괭이의 존재와 투자가능성은 다른 축입니다.

모델을 만든 회사가,
그 모델을 스스로 공짜로 풀어버렸다.

단백질 설계 모델

오픈소스

회사들이 자기 모델까지 스스로 공개

빅파마 외주 통행료

$1B+

노바티스-제너레이트(검증). 곡괭이 실재 증거

살 수 있는 곡괭이 승자

없음

단단한 후보는 전부 비상장

왕관의 보석을 스스로 던지는 회사는 없습니다.
그렇다면 진짜 곡괭이는 어디로 갔을까요.

→ 설계가 공짜가 된 시대, 곡괭이가 숨은 자리를 따라가 보세요

도입: 모델을 만든 회사가, 그 모델을 스스로 공짜로 풀어버렸다

2023년, 제너레이트 바이오메디슨(Generate Biomedicines)이라는 회사가 네이처(Nature)에 단백질 설계 모델 하나를 발표했습니다. 크로마(Chroma)라는 이름의 그 모델은 단백질의 전체 원자 구조를 직접 그려내는 확산 모델(노이즈에서 점진적으로 형태를 생성하는 AI 구조)이었습니다. 회사의 핵심 기술이었죠. 그런데 회사는 그 모델을 깃허브에 통째로 올렸습니다. 누구나 무료로 내려받아 쓸 수 있게 말입니다(GitHub Chroma).

비슷한 시기, 프로플루언트(Profluent)라는 회사는 AI로 설계한 유전자 가위, 오픈크리스퍼(OpenCRISPR-1)를 만들었습니다. 자연계에 없던 새 크리스퍼를 AI가 그려낸 것입니다. 회사는 이것도 무료로 풀었습니다. 상업 기관과 대형 제약사 수천 곳이 가져다 쓰도록 말이죠(Fortune, Profluent).

이상한 일입니다. 회사의 핵심 자산을 왜 공짜로 줄까요. 그런데 자세히 보면, 회사들이 푼 것과 쥔 것이 정확히 나뉩니다. 프로플루언트는 오픈크리스퍼를 무료로 풀었지만, 약 800억 개에 이르는 단백질 서열 데이터베이스는 독점으로 쥐고 있습니다(곧 두 배로 늘리겠다고 합니다, Fortune). 차이 디스커버리(Chai Discovery)는 차이-1 모델을 오픈소스로 풀었지만, 화이자에는 화이자의 독점 데이터로 훈련한 전용 모델을 따로 팝니다(PharmExec). 즉 모델은 던지고, 데이터는 지킵니다.

답은 여기 있습니다. 그 모델이 곡괭이가 아니라는 것을, 회사가 누구보다 먼저 알았기 때문입니다. 단백질을 설계하는 능력은 이미 흔해졌습니다. 알파폴드도, RFdiffusion도, ESM도 전부 오픈소스입니다. 여기에 자기 모델을 하나 더 보탠다고 달라질 게 없습니다. 오히려 무료로 풀어 표준을 선점하고, 진짜 해자(독점 데이터)는 더 깊이 묻어두는 편이 낫습니다. 왕관의 보석을 던진 게 아니라, 보석을 지키려 포장지를 버린 것입니다.

그렇다면 그 보석, 즉 진짜 곡괭이는 어디일까요. 이 글은 그 자리를 추적합니다. 단백질을 그리는 일이 공짜가 된 시대에, 그 단백질이 진짜로 작동한다는 것을 증명하는 검증은 누가 쥐고 있는가. 그 검증은 설계만큼 싸졌을까요. 그리고 만약 곡괭이가 분명히 있는데도 우리가 그것을 살 수 없다면, 그건 무슨 뜻일까요.

📌 이 글이 말하는 것 / 말하지 않는 것

말하는 것: 단백질 설계 모델은 오픈소스로 공짜가 됐다(회사들이 자기 모델까지 스스로 공개). 회사들은 데이터 해자가 침식돼서가 아니라 데이터를 지키려고 모델을 미끼로 풀었다(보석을 지키려 포장지를 버림). 곡괭이는 신약과 동형으로 실재한다(빅파마가 외주로 통행료 지불·자동화 wet-lab은 자본설비라 우회 어려움). 단 곡괭이가 한 단계 더 깊은 비상장 데이터 보유사로 이동해, 살 수 있는 상장 승자가 안 보일 뿐이다(곡괭이 존재 ≠ 투자가능). 가장 단단한 길목은 신약과 똑같이 빅파마의 자체 wet-lab과 임상 트랙레코드다.

말하지 않는 것: AI 단백질은 거품이다(X) / AI 단백질 회사는 전부 망한다(X) / AI 바이오는 다 투자 부적격이다(X) / 단백질엔 곡괭이가 없다·곡괭이가 신약보다 약하다(X) / wet-lab 데이터는 영원한 해자다(X)

이 구분을 기억하면, 이 글이 "AI 바이오 거품론"도 "AI 만능론"도 아니라 "설계는 공짜가 됐고 검증(wet-lab) 곡괭이는 분명히 있는데, 그 곡괭이가 비상장으로 한 단계 더 들어가 살 수 있는 자리에는 안 보인다"는 발굴로 읽힙니다. 곡괭이의 존재와 투자가능성은 다른 축입니다.

1장. 설계는 오픈소스로 공짜가 됐다: 회사들이 스스로 증명한다

먼저 설계가 얼마나 공짜가 됐는지를 정직하게 봅니다. 1편에서 본 대로, 단백질의 3차원 구조를 예측하는 모델들은 통째로 오픈소스로 풀렸습니다. 그리고 이 장의 진짜 핵심은 따로 있습니다. 설계가 공짜가 됐다는 가장 강력한 증거는 외부 오픈 모델이 아니라, 정작 이 분야 회사들이 자기 모델을 스스로 풀었다는 사실입니다. 그것이 "설계는 곡괭이가 아니다"라는 가장 솔직한 자기고백입니다.

1.1 구조 예측은 사실상 공공재가 됐다

단백질이 어떤 모양으로 접히는지를 예측하는 일은, 생명과학의 오랜 난제였습니다. 그 난제를 푼 모델들이 무료로 풀렸습니다. 딥마인드의 알파폴드2는 2021년 코드까지 공개됐고, 2억 개가 넘는 단백질 구조를 무료 데이터베이스로 풀었습니다. 메타의 ESMFold, 베이커 연구소의 RoseTTAFold All-Atom(DNA·RNA·소분자까지 지원)도 오픈소스입니다(GitHub AlphaFold, GitHub ESM).

한때 박사 군단이 매달리던 일이, 무료 모델 한 번 돌리면 끝나는 일이 됐습니다. 업계는 구조 예측을 이제 "사실상 공공재"로 봅니다. 1편 검증분 그대로, 설계의 입구는 이미 활짝 열려 있습니다.

1.2 새 단백질을 "생성"하는 일도 빠르게 공짜가 된다

구조를 맞히는 것을 넘어, 아예 없던 단백질을 새로 그려내는 생성형 설계 모델도 빠르게 공짜가 되고 있습니다. 베이커 연구소의 RFdiffusion(새 단백질 백본 생성)과 ProteinMPNN(서열 설계)이 오픈소스이고, 앞서 본 제너레이트의 크로마, 프로플루언트의 오픈크리스퍼가 여기에 더해집니다. 노벨 화학상(2024, 단백질 설계·구조 예측)을 받은 기술의 핵심이, 논문 코드 수준에서 누구나 내려받는 자산이 된 것입니다.

알파폴드·ESM·RFdiffusion·크로마처럼 모델 이름이 줄줄이 나오지만, 이름은 외울 필요가 없습니다. 핵심은 하나입니다. 이게 전부 무료입니다.

다만 정직하게 단서를 답니다. 오픈 모델이 모든 것을 끝내주지는 않습니다. 공개된 설계 모델은 "GPU 한 번 실행으로 중간 난이도 타깃에 후보 수십 개"를 내놓는 수준이라, 실험용 96-웰 플레이트 하나를 채우기도 빠듯합니다(bioxconomy). 상업용 대형 모델(알파폴드3·ESM3 대형)은 여전히 비상업 제한 라이선스입니다. 그러나 방향은 분명합니다. "설계한다"는 능력 자체는 빠르게 흔해지고 있습니다.

여기서 이 장의 핵심으로 돌아옵니다. 설계가 공짜가 됐다는 가장 강력한 증거는, 외부 오픈 모델이 아니라 이 분야 회사들의 행동입니다. 제너레이트는 자기 모델 크로마를 풀었고, 프로플루언트는 오픈크리스퍼와 오픈안티바디(20개 타깃 항체)를 풀었습니다. 모델로 돈을 벌 수 있다고 믿었다면 절대 하지 않았을 일입니다. 회사들이 베팅을 옮긴 것입니다. 모델이 아니라, 그 모델이 그린 단백질을 실제로 만들어 검증하는 wet-lab(생성한 단백질을 실제로 만들어 검증하는 실험실)과 그 위에 쌓이는 독점 데이터 쪽으로 말이죠.

한 가지만 미리 못박아 둡니다. 회사들이 모델을 푼 것은 데이터 해자가 약해져서가 아닙니다. 정확히 그 반대입니다. 데이터가 진짜 해자라서, 모델은 미끼로 풀어 표준을 선점하고 데이터는 더 깊이 묻어둔 것입니다. 이 구분이 4장에서 곡괭이의 위치를 가르는 열쇠가 됩니다.

모델	개발처	하는 일	푼 것 / 지킨 것
AlphaFold2	딥마인드	구조 예측	모델·2억+ 구조 DB 공개
ESMFold	메타(EvolutionaryScale)	구조 예측	모델 공개 (대형 ESM3는 라이선스 분리)
RoseTTAFold All-Atom	베이커 연구소	구조 예측(DNA·RNA·소분자)	모델 공개
RFdiffusion	베이커 연구소	새 단백질 백본 생성	모델 공개
크로마(Chroma)	제너레이트	전원자 구조 생성(확산)	회사가 자체 오픈소스화
오픈크리스퍼-1	프로플루언트	AI 설계 유전자 가위	모델 무료 / 약 800억 서열 DB 독점

외부 모델만이 아니라, 이 분야 회사들(제너레이트·프로플루언트)이 자기 핵심 모델을 스스로 풀었습니다. 푼 것(모델)과 지킨 것(데이터)이 정확히 나뉩니다. 모델이 곡괭이가 아님을 회사가 먼저 인정한 자기고백입니다. (출처: GitHub 각 저장소, Profluent, Fortune)

"AI로 단백질을 설계한다"는 능력 자체는 더 이상 차별점이 아닙니다. 회사들조차 자기 모델을 무료로 풀고 있으니까요. 다음 질문은 "그렇다면 그 단백질이 진짜 작동하는지는 누가 검증하는가"입니다.

2장. 그런데 wet-lab 검증은 안 싸진다: 처리량이 병목으로 옮겨갔다

이 장이 1편 2장(생성은 자릿수로 싸지는데 검증은 그 속도를 못 따라간다는 핵심 논증)의 단백질 클로즈업입니다. 설계가 절벽으로 빠진 그 옆에서, wet-lab 검증이 얼마나 그 속도를 못 따라가는지를 봅니다. AI는 단백질을 한 번에 수백만 개 그려내지만, 그것이 진짜 발현되고 결합하는지는 실험실에서 한 줄씩 만들어 확인해야 합니다. 설계와 검증 사이에 자릿수의 처리량 격차가 생겼고, 병목이 검증으로 넘어갔습니다.

2.1 설계는 수백만, 검증은 수십: 자릿수의 처리량 격차

AI 설계 모델은 한 번 실행에 단백질 후보를 수백만에서 수십억 개까지 쏟아냅니다(RFdiffusion·ESM3 등). 그런데 그 후보가 실제로 단백질로 발현되고(설계한 대로 실제 단백질로 만들어지고), 표적에 결합하고(노리는 표적에 들러붙고), 안정적인지를 확인하는 일은 전혀 다른 속도로 움직입니다. 표준 실험실의 전통적 wet-lab 검증은 수 주에 수십 개 수준입니다(Drug Target Review).

왜 검증은 못 따라갈까요. 단백질 설계 AI에는 근본적 한계가 하나 있습니다. AI가 그려낸 단백질이 "환각(hallucination, 그럴듯하지만 실제로는 작동하지 않는 AI 산출)"인지를, 계산만으로 걸러내는 효과적인 방법이 아직 없습니다. 그래서 wet-lab 실험이 사실상 유일한 검증 수단으로 남습니다(PMC 항체 설계 리뷰). 한 리뷰의 표현이 핵심을 찌릅니다. "실험 처리량이 이제 설계 역량이 아니라 제약이 됐다. 속도 제한 단계가 wet-lab 검증으로 이동했다."

그렇다고 검증이 멈춰 있는 것은 아닙니다. de novo(자연계에 없던 것을 처음부터 새로 설계) 항체 설계의 성공률은 실제로 자릿수로 올랐습니다(Chai-2 16%·AbDiffuser HER2 37.5% in vitro, PMC12137305). 진전은 분명합니다. 그러나 설계가 한 번에 수백만 개를 쏟아내는 속도에 견주면, 검증은 여전히 한 뼘씩 내려갈 뿐입니다. 두 곡선의 격차는 좁혀지는 게 아니라 벌어집니다.

2.2 그래서 곡괭이 후보가 wet-lab으로 이동했다

병목이 검증으로 옮겨갔다면, 1편 닻(곡괭이는 검증을 남이 사야 하는 길목에 박힌다)에 따라 곡괭이도 그쪽으로 이동해야 합니다. 그래서 이 분야의 곡괭이 후보는 두 가지로 좁혀집니다.

하나는 그 wet-lab 병목을 자동화로 뚫는 고처리량 실험실입니다. 앱사이의 ACE는 주 수백만 개의 AI 설계 단백질을 전통 검증 대비 4,000배 처리량으로 평가하고(Absci), 깅코의 네뷸라는 회사 표현으로 "세계 최대의 자율 실험실"입니다(Ginkgo Q1 2026). 다른 하나는 그 실험실에서 쌓이는 독점 데이터입니다. 오픈 모델로는 만들 수 없는, "실제로 만들어 보니 됐다/안 됐다"의 폐쇄형 피드백 데이터(외부 공개 없이 자체 실험으로만 쌓는 데이터)입니다.

여기까지가 1편 닻 그대로입니다. 설계는 공짜, 곡괭이는 검증(wet-lab)으로. 그런데 다음 장부터, 이 곡괭이 후보가 분명히 실재하는데도 왜 우리 눈에 살 수 있는 승자로는 안 보이는지가 드러납니다. 먼저 그 wet-lab을 각자 떠안은 회사들에게 무슨 일이 일어났는지부터 봅니다.

설계(생성)는 자릿수로 급락, wet-lab 검증은 병목으로 남았다

단백질 버전: 같은 작업의 앞뒤에서 처리량이 자릿수로 갈린다

↓ 설계 (자릿수 급락, 오픈소스로 공짜)

한 번 실행 수백만~수십억

모델 비용 사실상 $0

설계는 한 번에 수백만, 검증은 한 줄씩 (환각 거르는 계산법 없음 = wet-lab만이 유일 검증)

↓ wet-lab 검증 (병목, 처리량이 한계)

전통 검증 수주에 수십

자동화 최고도 주 수백만(앱사이 ACE)

AI 이전

AI 이후 / 자동화

설계는 공짜가 됐지만 검증은 병목으로 남았습니다. 자동화 최고 수준(앱사이 ACE, 4,000배)도 설계 처리량을 따라잡지는 못합니다. 그래서 곡괭이 후보가 wet-lab으로 이동했습니다. 단 그 곡괭이가 얼마나 단단한지는 4장이 따로 판정합니다.

출처: 처리량 격차=Drug Target Review, 환각·wet-lab 유일 검증=PMC12137305, ACE=Absci

3장. 죽음의 계곡: wet-lab을 각자 떠안은 발굴사들

1편 닻은 이렇게 말했습니다. 검증이 어렵다는 것만으로 곡괭이가 되지 않습니다. 그 검증을 남이 사야 하는 길목으로 쥔 자에게만 곡괭이가 고이고, 각자 떠안는 곳에서는 검증이 곡괭이가 아니라 죽음의 계곡이 됩니다(곡괭이를 쥔 자).

단백질에서 그 죽음의 계곡을 가장 선명하게 보여주는 것은, 역설적이게도 wet-lab을 가장 크게 깐 회사들입니다. 그들은 자동화 실험실과 자체 파이프라인을 함께 떠안았고, 그 무게에 눌리고 있습니다. 유리한 사례만 고르지 않고 망라합니다.

3.1 깅코 바이오웍스: 세계 최대 자율 실험실, 그런데 사업 전환의 진통이 깊다

먼저 결론부터 박아둡니다. 깅코의 매출 추락은 곡괭이가 약해서가 아니라, 사업 모델을 통째로 갈아엎는 중이라서입니다. 숫자만 보면 충격적이지만, 그 정체를 뜯어보면 곡괭이 강도와는 다른 이야기입니다.

깅코 바이오웍스(Ginkgo Bioworks, NYSE: DNA)는 이 분야에서 가장 큰 자동화 wet-lab을 가진 회사입니다. 상호 연결된 로봇 랙 100개가 넘는 자율 실험실 네뷸라(Nebula)를 운영하고, 회사는 이를 "세계 최대의 자율 실험실"이라 부르며 2026년에 규모를 두 배로 키우겠다고 밝혔습니다(랙 수는 실적 콜 기준 103개+, Ginkgo Q1 2026 콜).

그런데 장부는 진통을 가리킵니다. 계속영업(Cell Engineering) 기준 분기 매출이 2025년 1분기 $38M에서 2026년 1분기 $19M으로, 한 해 만에 약 49% 줄었습니다. 단 이 숫자는 그대로 읽으면 안 됩니다. 1년 전 기저($38M)에 일회성 비현금 매출 $7.5M(바이오에밋BiomEdit 계약 해지에 따른 이연매출 환입)이 끼어 있어 기저가 부풀려져 있었기 때문입니다. 이를 걷어낸 유기적 기준으로는 약 -36%입니다(Ginkgo Q1 2026). 연간으로도 전사 총매출이 FY2024 $227M에서 FY2025 $170.2M으로 줄었습니다(계속영업 Cell Engineering만 떼어 보면 $174M에서 $133M). 그 전에 이미 2024년 6월, 직원의 35% 이상인 약 400명을 잘랐습니다($200M 비용 절감 목표, GeneOnline, FierceBiotech).

여기서 한 가지를 분명히 끊어둬야 합니다. 이 매출 감소가 "깅코의 wet-lab 곡괭이가 약하다"는 증거는 아닙니다. 줄어든 매출의 정체는 깅코의 구(舊) 파운드리 서비스(고객 대신 균주를 설계·개발해 주던 사업) 매출입니다. 이 사업은 오히려 FY2023→FY2024엔 +21% 성장했다가, 회사가 사업 모델을 자동화 실험실 임대 쪽으로 트는 과정에서 줄어들고 있습니다. 즉 이것은 채굴자(사업 모델 전환 중인 회사)의 손익 진통이지, wet-lab이라는 길목의 강도 판정이 아닙니다.

정작 깅코가 wet-lab 곡괭이로 내세운 상품(누구나 실험실을 빌려 쓰는 깅코 클라우드 랩)은 2026년 3월에야 론칭했고, 아직 매출 이력이 없습니다(Ginkgo Cloud Lab). 그래서 이 곡괭이의 강도는 약함도 강함도 아닌 판정 보류입니다. 매출이 무너졌다는 사실만으로 곡괭이가 약하다고 적는 것은, 2편에서 우리가 경계한 바로 그 오류(매출 감소 ≠ 곡괭이 약화)입니다.

3.2 앱사이: 처리량 4,000배의 wet-lab, 그런데 매출은 소수점 단위로

앱사이(Absci, NASDAQ: ABSI)는 77,000제곱피트가 넘는 전용 wet-lab과, 주 수백만 개 설계를 전통 대비 4,000배 처리량으로 검증하는 ACE를 가진 회사입니다(Absci 기술). 2020년부터 "지수적으로 커지는 데이터 해자"를 쌓아 왔다고 자칭합니다.

그런데 매출은 그 처리량과 정반대로 움직였습니다. FY2024 $4.5M에서 FY2025 $2.8M으로 줄었고, 2026년 1분기에는 $0.2M까지 떨어졌습니다(전년 동기 $1.2M에서 급감). 같은 분기 순손실은 $29.6M이었습니다(Absci Q1 2026 콜). 게다가 2026년 1분기에 자체 파이프라인 두 개(ABS-301·ABS-501)를 내부 자원 배분에서 전면 중단했습니다(SEC 파이프라인 공시). 처리량 4,000배의 곡괭이 후보를 가지고도, 매출은 소수점 단위로 쪼그라든 것입니다.

단 정직하게 덧붙입니다. 앱사이가 전부 멈춘 것은 아닙니다. 아스트라제네카와 종양학 항체 협력(최대 $247M 마일스톤+로열티, biobucks: 마일스톤을 다 채웠을 때의 잠재 총액이라 실수령액과는 다릅니다)을 맺어 2024년 9월 첫 마일스톤(AI 설계 항체 서열 전달)을 완료했고(bioprocessintl), 자체 후보 ABS-201(탈모)은 Phase I 반복 투여 코호트에 들어가 2026년 중반 효능 중간 데이터를 앞두고 있습니다. 채굴은 계속됩니다. 다만 그 채굴이 회사를 떠받칠 곡괭이는 아니었습니다.

3.3 제너레이트 바이오메디슨: 임상에 들어갔으나, 손실은 더 커진다

제너레이트 바이오메디슨(Generate Biomedicines, NASDAQ: GENB)은 도입에서 본 크로마를 풀어버린 회사입니다. 모델을 공짜로 푼 대신, 17개의 임상·전임상 프로그램과 그 임상 피드백 데이터에 베팅했습니다. 실제로 중증 천식 항체 GB-0895(anti-TSLP)는 2026년 1월 Phase III에서 첫 환자 투여에 들어갔고, 종양·염증 분야로 파이프라인을 넓혔습니다. 2026년 2월에는 나스닥에 상장해 $400M을 조달했습니다(주당 $16, 누적 자금 약 $1.09B).

그러나 손익은 무거워지고 있습니다. 2026년 1분기 매출은 $7.2M으로 전년 동기 $8.8M에서 줄었고, 순손실은 $61.7M으로 오히려 커졌습니다(전년 동기 $44.3M). 운영 현금 소진도 분기 $80.4M으로 늘었습니다(Generate Q1 2026). 상장으로 확보한 현금($516.6M)으로 2028년 상반기까지 버틸 수 있지만, GB-0895의 Phase III 결과가 그 안에 나오지 않으면 자금 압박을 받습니다. 모델을 풀고 임상·데이터에 베팅했으나, 그 베팅이 회사를 떠받칠 곡괭이가 됐는지는 아직 증명 전입니다.

회사	떠안은 것	무게(채굴자 진척)	시점
깅코 바이오웍스(DNA)	세계 최대 자율 실험실(네뷸라 103+ 로봇랙)	계속영업 분기 -49%(유기적 약 -36%)·직원 35%+ 감원. 구 파운드리 서비스 사업전환 진통(곡괭이 판정 아님). 클라우드 랩 2026-03 론칭·매출 0	2024-06 ~ 2026-Q1
앱사이(ABSI)	77,000sqft wet-lab·ACE(주 수백만·4,000배)	매출 FY2024 $4.5M→Q1 2026 $0.2M·파이프라인 2개(ABS-301·501) 중단	2026-Q1
제너레이트(GENB)	17개 임상·전임상 + 임상 피드백 데이터	매출 $8.8M→$7.2M·순손실 $44.3M→$61.7M 확대	2026-Q1

wet-lab을 각자 떠안고 자체 파이프라인까지 짊어진 회사들의 손익 진통입니다. 단 이 손익 악화는 채굴자 진척이지 wet-lab 길목(곡괭이)의 강도 판정이 아닙니다(매출 감소 ≠ 곡괭이 약화, 2편 교훈). 생존·전진 신호도 망라합니다: 제너레이트 GB-0895 Phase III·앱사이 ABS-201 Phase I·AZ 최대 $247M 마일스톤. 참고로 타깃 발굴 AI사 베네볼런트AI의 임상 실패·상장폐지는 [2편(신약)](/inevitable/generative-era-2)에서 다뤘습니다. (출처: 각 행 인라인 URL)

이 wet-lab이라는 검증이 어렵다고 곡괭이가 자동으로 손에 잡히는 게 아닙니다. 그 wet-lab을 각자 떠안으면 가장 큰 자동화 실험실도 채굴자의 손익을 떠안습니다. 신약에서 본 그대로입니다. 곡괭이는 다른 곳에 있습니다. 그런데 그 다른 곳을 들여다보면, 곡괭이는 분명히 있는데 대부분 우리가 살 수 없는 자리(비상장)에 있습니다. 4장에서 그 자리를 발굴합니다.

4장. 그렇다면 곡괭이는 누가 쥐었는가: 그리고 왜 살 수 있는 자리엔 없는가

곡괭이 후보는 넷입니다. 자동화 wet-lab 인프라를 파는 자(깅코·앱사이), 폐쇄 데이터를 쥔 자(프로플루언트·차이), 설계와 검증을 SaaS로 파는 자(크래들·차이), 그리고 빅파마입니다. 빅파마가 외주로 내는 거액의 통행료가, 이 곡괭이들이 실재한다는 증거입니다. 그런데 가장 단단한 AI-네이티브 후보들(크래들·차이·프로플루언트)은 전부 비상장입니다. 이 장은 그 곡괭이를 발굴하고, 왜 곡괭이는 분명히 있는데 살 수 있는 자리(상장)에는 없는지를 정직하게 따집니다.

4.1 자동화 wet-lab 인프라를 파는 자: 물리 자본이라 우회가 느리다

곡괭이 후보의 첫째는, 그 wet-lab 병목을 자동화로 뚫어 남에게 파는 자입니다. 깅코의 네뷸라가 가장 또렷한 후보입니다. 깅코는 외부 고객(상위 10개 바이오파마 포함)의 실험을 네뷸라로 대신 수행하고, 클라우드 랩으로 그 실험실 접근 자체를 판매하기 시작했습니다(Ginkgo Cloud Lab). 구조만 보면 이것은 "남이 사야 하는 wet-lab 길목", 즉 2편 CRO(임상시험수탁기관)와 닮은 통행료 모델입니다.

여기에 결정적인 강점이 있습니다. 자동화 실험실의 물리적 자본(로봇 랙, 분주 시스템)은 모델과 달리 오픈소스로 풀 수 없습니다. 누군가 같은 처리량을 가지려면 같은 자본을 들여야 합니다. 그 자본이 얼마나 무거운지가 핵심입니다. 깅코가 2021~2023년 자율 실험실 구축에 들인 시설 투자만 누적 $156M이 넘고(SEC 10-K), 업계 기준 새 wet-lab 한 동을 짓는 데만 4~6년이 걸립니다(irecruit). 그래서 빅파마조차 이 설비를 손쉽게 우회하지 못하고, 외부에 통행료를 내고 빌려 씁니다. 데이터 해자보다 침식이 느린 이 물리 자본이, 깅코·앱사이의 강도를 "약"이 아니라 "중"으로 보는 근거입니다.

그러나 강점은 거기까지입니다. 이 길목은 배타적이지 않습니다. 빅파마는 한 공급사에 락인되지 않고 여러 곳을 동시에 씁니다(멀티소싱). 깅코 스스로도 클라우드 랩으로 "누구나 빌려 쓰는" 모델을 밀고, 임대 실험실도 등장해 물리 자본 해자마저 일부 상품화되는 중입니다. 그래서 이 길목의 강도는 "중"입니다. 쉽게 풀면, 中이란 "길목이긴 한데 빅파마가 언제든 갈아탈 수 있어 통행료가 영구적이진 않다"는 뜻입니다. 시한도 멀티소싱·상품화 압력으로 흔들림(🟡)입니다. 이 "중·🟡, 멀티소싱이라 배타성 제한"이라는 성격은 뒤에 나올 데이터·SaaS 곡괭이(4.2·4.3)에도 똑같이 적용되니, 여기서 한 번만 짚고 넘어갑니다. (3장에서 본 깅코의 매출 급감·감원은 채굴자의 사업전환 손익이지 이 곡괭이 강도와는 다른 축입니다.)

4.2 폐쇄형 실험 데이터라는 곡괭이: 회사들은 데이터를 지키려고 모델을 풀었다

곡괭이 후보의 둘째는 독점 실험 데이터입니다. 앱사이의 "지수적 데이터 해자", 크래들의 A/B 테스트 데이터, 깅코의 누적 프로토콜, 프로플루언트의 단백질 서열 DB처럼, 오픈 모델로는 못 만드는 폐쇄형 make-test-learn 데이터입니다. 원리상 이것은 진짜 곡괭이 후보입니다. wet-lab을 직접 돌려야만 나오는 데이터니까요.

여기서 도입의 장면으로 돌아옵니다. 회사들이 자기 모델을 스스로 푼 것은, 흔히 "데이터 해자가 공개로 침식되는 증거"로 읽힙니다. 그러나 자세히 보면 정반대입니다. 회사들은 데이터를 지키려고 모델을 풀었습니다. 프로플루언트는 오픈크리스퍼를 무료로 풀면서도 약 800억 개에 이르는 단백질 서열 데이터베이스는 독점으로 쥐고, 곧 두 배로 늘리겠다고 합니다(Fortune). 차이 디스커버리는 차이-1 모델을 오픈소스로 풀면서도, 화이자에는 화이자의 독점 데이터로 훈련한 전용 모델을 따로 팝니다(PharmExec). 메타에서 갈라져 나온 에볼루셔너리스케일도 ESM3 모델은 비상업용으로 공개하되 상업 라이선스는 분리합니다.

투자사 베서머(Bessemer)의 진단이 정확합니다. 구조 예측·물성 모델은 이제 누구나 쓸 수 있게 됐고(모델은 상품화됐고), 방어 가능한 진짜 해자는 "규모와 일관성을 갖춘 멀티모달 생물 데이터셋"이라는 것입니다(BVP). 모델은 미끼, 데이터는 보석입니다.

💡 핵심: 모델은 미끼, 데이터는 보석

회사들이 자기 모델을 스스로 푼 것은 데이터 해자가 침식돼서가 아니라, 데이터가 진짜 해자라서 모델을 미끼로 풀어 표준을 선점하고 데이터를 지킨 것입니다. 프로플루언트는 오픈크리스퍼를 풀되 약 800억 서열 DB를 독점하고, 차이는 차이-1을 풀되 화이자엔 독점 데이터 전용 모델을 팝니다.

그렇다면 데이터 곡괭이는 생각보다 단단할 수 있습니다. 단 2편의 교훈대로 강도를 무작정 올리지는 않습니다. 진짜 곡괭이가 되려면 모델 가중치가 아니라 실제로 만들어 검증한 실측 데이터(make-test-learn)가 쌓여야 하므로, wet-lab을 직접 돌리는 깅코·앱사이의 데이터와, 아직 wet-lab을 짓는 중인 프로플루언트의 데이터는 깊이가 갈립니다. 그래도 모델을 풀었다는 이유로 "약"으로 깎을 일은 아니어서 강도는 "중"입니다(강도가 중인 공통 이유는 4.1 그대로입니다). 여기서 이 편의 두 번째 축이 처음 또렷해집니다. 이 데이터 보유사들(프로플루언트·차이)은 대부분 비상장입니다. 곡괭이의 강도(배타성)와 그것을 살 수 있는가(상장 여부)는 전혀 다른 축입니다.

4.3 크래들·차이: 단백질판 XtalPi는 있다, 단 비상장이라 안 보인다

곡괭이 후보의 셋째가 이 편의 핵심 발굴입니다. 2편에서 곡괭이를 또렷이 쥔 회사는 XtalPi(엑스탈파이, 약을 직접 만드는 대신 발굴 플랫폼 자체를 제약사에 파는, 상장된 곡괭이 회사)였습니다. 자기 약을 직접 임상까지 끌고 가는 채굴이 아니라, 발굴 플랫폼 자체를 제약사에 파는 길목을 쥔 회사였고, 그래서 매출이 세 배로 뛰는 것이 상장 장부에 찍혔습니다. 단백질에도 정확히 같은 위치의 회사들이 있습니다. 다만 비상장이라 그 장부가 우리 눈에 안 보일 뿐입니다.

크래들(Cradle)이 그 첫째입니다. 크래들은 자체 wet-lab(나노리터 분주 시스템 등)을 처음부터 지어 AI 모델을 지속적으로 A/B 테스트하고, 그 신뢰성을 무기로 제약사에 단백질 설계 플랫폼을 구독으로 팝니다. 즉 설계와 wet-lab 검증 피드백을 묶어 도구(SaaS)로 파는, 단백질판 XtalPi입니다. 글로벌 톱25 제약사 중 6곳(존슨앤드존슨·노보 노디스크 등 실명 공개)을 포함해 누적 21개 고객을 확보했고, 플랫폼에서 개발 중인 분자가 31개이며, 직원은 2025년 한 해에 두 배로 늘었습니다(Cradle PR, 시리즈B $73M·TechCrunch). 톱25 제약사 중 6곳이 통행료를 내고, 고객·분자·직원이 동시에 느는 것은 XtalPi의 매출 급증과 같은 신호입니다. 단지 비상장이라 매출이 공개되지 않을 뿐입니다.

차이 디스커버리(Chai Discovery)가 그 둘째입니다. 차이는 차이-1 모델을 오픈소스로 풀어 표준을 선점하면서, 릴리·화이자 같은 빅파마에는 그들의 독점 데이터로 훈련한 전용 모델을 따로 파는, 모델-미끼·데이터-판매 구조의 회사입니다(PharmExec). 2025년 시리즈B로 약 $1.3B 밸류로 평가받았다고 보도됐습니다(비상장). 역시 빅파마가 통행료를 내고 있다는 점에서 곡괭이 후보이고, 역시 비상장이라 매출이 안 보입니다.

그래서 "단백질엔 top-line 곡괭이 승자가 없다"는 말은 정확히는 "살 수 있는(상장) top-line 승자가 없다"입니다. 크래들·차이가 그 승자 후보이되 비상장이라 매출이 장부로 안 드러날 뿐입니다(강도가 "중"인 이유, 즉 멀티소싱·낮은 전환비용은 4.1과 같습니다). 이 비상장 곡괭이를 알아두면 독자에게 실익이 분명합니다. 이 이름들을 알면, 지금 상장된 회사 중 누가 진짜 곡괭이에 더 가까운지를 재는 잣대가 생기고, 이들이 상장(IPO)하는 순간 1순위로 들여다볼 이름이 됩니다. 그 첫 시험대가, 모델(크로마)을 풀고 임상·데이터에 베팅한 제너레이트의 2026년 IPO입니다.

4.4 빅파마: 외주로 통행료를 내면서, 자체 임상 트랙레코드를 쥔다

빅파마의 행동을 정확히 읽는 것이 이 편의 인과를 가르는 열쇠입니다. 흔한 설명은 "빅파마가 자동화 wet-lab을 내부에 깔아 외부 AI 발굴사를 우회한다(내재화: 외부 도구 대신 회사 내부에 같은 역량을 직접 구축)"입니다. 그러나 증거는 정반대를 가리킵니다. 빅파마는 외부 단백질 발굴사에 거액의 통행료를 외주로 지불하고 있습니다.

가장 분명한, 1차 출처로 확인된 예는 둘입니다. 노바티스는 제너레이트와 선급 $65M에 마일스톤 $1B+를(FierceBiotech), 아스트라제네카는 앱사이와 최대 $247M의 항체 설계 계약을 맺었습니다(bioprocessintl). 여기에 더해, 암젠은 제너레이트와 최대 약 $1.9B 규모(선급 $50M)로(Amgen IR), 다케다는 나블라 바이오와 두 번째 딜만 최대 $1B+로 협력했다고 보도됐습니다(BusinessWire). 모두 마일스톤을 다 달성했을 때의 잠재 총액(biobucks)입니다.

빅파마가 내부에 깔아 우회할 수 있었다면 이런 통행료를 낼 이유가 없습니다. 이 딜들 자체가, 외부 wet-lab·데이터 곡괭이가 실재하고 작동한다는 가장 강력한 증거입니다. 내재화는 진행되지만 외부 대체가 아니라 병행입니다(아스트라제네카 임원 표현으로 "내부 역량 구축과 앱사이 같은 협력을 함께"). 빅파마가 내부 자동화 wet-lab으로 외부 발굴사를 실제로 대체한 사례는 확인되지 않습니다.

그렇다면 단백질에서 가장 단단한 곡괭이는, 신약과 마찬가지로 빅파마가 이미 쥔 다른 자산입니다. 어떤 단백질이 누구의 모델에서 나왔든, 그것이 약이 되려면 임상이라는 게이트(7.5년)를 통과해야 합니다. 그 통과를 반복해 본 경험과 규제 데이터는, 빅파마가 수십 년간 쌓은 가장 깊은 길목입니다(ASPE HHS). 그래서 강도는 강, 시한은 🟢(임상 물리 게이트 + 축적 데이터)에 가깝습니다.

단 빅파마는 단백질 테마의 순수 노출이 아닙니다. 거대 다각화 기업이라, "AI 단백질 곡괭이"만 따로 살 수는 없습니다. (로슈 등 일부 빅파마의 내부 AI 항체 플랫폼 규모는 독립 언론 미확인이라, 이 글은 단정하지 않습니다.)

4.5 그래서 역설: 곡괭이는 있는데, 살 수 있는 자리엔 없다

한 문장으로 줄이면 이렇습니다. 진짜 곡괭이를 쥔 회사들(크래들·차이·프로플루언트)은 아직 상장을 안 했습니다. 그래서 곡괭이가 있는 줄 알면서도, 우리가 그걸 살 수가 없습니다.

곡괭이가 약해서가 아닙니다. 빅파마가 외부 발굴사에 거액의 통행료를 외주로 내고 있으니(4.4), 곡괭이는 신약과 비슷한 강도로 분명히 실재합니다. 그런데도 2편의 XtalPi 같은 상장 장부로 살 수 있는 승자가 안 보입니다. 이 둘을 묶은 것이 이 편의 역설입니다.

그렇다면 우리가 지금 살 수 있는 상장 회사(앱사이·깅코·제너레이트)는 어떻게 봐야 할까요. 정직하게 말하면 이들은 순수한 곡괭이가 아니라 혼합형입니다. 곡괭이 후보(자동화 wet-lab·폐쇄 데이터)를 가졌지만, 동시에 자기 약을 직접 임상까지 끌고 가는 채굴과 사업 전환까지 한 종목 안에 짊어졌습니다. 그래서 한 종목 안에 곡괭이의 강함과 채굴의 손익이 뒤섞여 들어갑니다. 이들을 볼 때는 "곡괭이가 단단한가"와 "채굴이 회사를 갉아먹는가"를 분리해서 저울질해야 합니다. '투자 부적격'이라는 뜻이 아니라, 두 개의 다른 베팅이 한 종목에 섞여 있으니 따로 봐야 한다는 실전 잣대입니다.

여기까지가 핵심이고, 왜 이렇게 됐는지는 한 단계 더 들어가면 보입니다. 신약에서는 설계(생성) 단계가 아직 완전히 공짜가 아니어서, 설계 플랫폼을 파는 XtalPi가 상장 장부에 통행료를 찍을 수 있었습니다. 곡괭이가 비교적 바깥쪽(설계 레이어)에 있었던 겁니다. 그런데 단백질에서는 설계 모델이 통째로 오픈소스로 풀려, 곡괭이가 한 단계 더 안쪽, 실제로 만들어 검증한 폐쇄 데이터로 들어갔고, 그 데이터를 가장 잘 쌓는 회사들이 아직 비상장일 뿐입니다. 정리하면, 곡괭이의 위치를 결정하는 건 검증장벽의 높이가 아니라 설계(생성)가 얼마나 빨리 공짜가 되는가입니다.

그래서 단백질에서 AI-네이티브 곡괭이의 강도는 신약과 비슷한 중·🟡이고, 신약과 다른 칸은 강도가 아니라 살 수 있는가뿐입니다. 가장 단단한 길목(강·🟢)은 신약과 똑같이 발굴 바깥, 빅파마의 자체 wet-lab과 임상 트랙레코드입니다. 1편이 검증장벽으로 곡괭이가 생기는 자리를 그렸다면, 2편과 3편은 거기에 살 수 있는가라는 두 번째 축을 더한 셈입니다. 1편이 "검증이 어렵다고 자동으로 살 수 있는 곡괭이가 생기지는 않는다"고 했는데, 단백질이 그 두 번째이자 한 단계 더 깊은 증거입니다.

기업(실명) · 길목	강도	시한	살 수 있는가
깅코 바이오웍스(DNA) · 자동화 wet-lab 인프라를 판다(네뷸라·클라우드 랩)	중	🟡	상장. 물리 자본설비($156M+·4~6년)라 우회 어려움이 강도 근거
앱사이(ABSI) · 고처리량 검증 자동화(ACE 주 수백만·4,000배)+폐쇄 데이터	중	🟡	상장. AZ 최대 $247M이 통행료 신호. 매출 급감은 채굴자 진척
크래들(Cradle) · 설계+wet-lab 피드백 SaaS를 판다(단백질판 XtalPi)	중	🟡	비상장·직접 노출 불가
차이 디스커버리(Chai) · 차이-1 오픈소스 + 빅파마에 독점 데이터 전용 모델을 판다	중	🟡	비상장·직접 노출 불가
제너레이트(GENB) · 폐쇄형 임상 피드백 데이터 + 17개 파이프라인	중	🟡	상장(2026 IPO·$400M). 크로마를 미끼로 풀고 임상·데이터에 베팅
프로플루언트(Profluent) · 폐쇄 단백질 서열 DB(약 800억 개) + wet-lab(구축 중)	중	🟡	비상장. 800억 서열 독점이 보석, wet-lab 실측 데이터는 아직 얕음
빅파마(AstraZeneca·암젠·노바티스·다케다 등) · 외주 통행료 + 자체 임상·규제 트랙레코드	강	🟢	상장. 가장 단단한 길목은 임상 게이트(7.5년). 단 단백질 순수 노출 아님(거대 다각화)
오픈 설계모델(AlphaFold·RFdiffusion·ESM·크로마·오픈크리스퍼) · 설계 그 자체	약(신기루)	🔴	비매수 대상(오픈소스·공짜). 곡괭이 아님 = 신기루

단백질에서 검증(wet-lab)의 길목과 그 기업입니다. 강도≠투자매력도 · 곡괭이≠싼 주식 · 종목 추천 아님. 강도는 곡괭이(길목) 장악력이지 투자 매력도가 아니며, 정밀 적정가는 개별 기업 분석의 몫입니다. ★역설: 검증장벽은 신약 다음으로 높고 곡괭이 강도도 신약과 대체로 비슷한데(빅파마 외주 통행료가 실재 증거), 가장 단단한 후보들(크래들·차이·프로플루언트)이 전부 비상장이라 살 수 있는(상장) top-line 승자가 없습니다. ★표 보는 법: 강도 컬럼이 아니라 '살 수 있는가' 컬럼이 신약과의 차이를 드러냅니다. (출처: 발굴 단백질 raw, 1편 프레임 계약, 2편 대비)

강도(텍스트 5구간: 최강/강/중강/중/약)는 길목 배타성(남이 반드시 사야 하는가·전환비용)으로만 매깁니다. 강도와 시한은 다른 축입니다. ★ 이 편의 곡괭이 표는 2편과 강도 분포가 대체로 비슷합니다(강·🟢이 빅파마, 나머지 AI-네이티브는 중·🟡). 신약과의 진짜 차이는 강도 컬럼이 아니라 '살 수 있는가' 컬럼에 있습니다(단단한 AI-네이티브 후보 크래들·차이·프로플루언트가 전부 비상장). 이것이 "곡괭이는 있는데 살 수 있는 자리엔 없다"의 시각적 증거입니다. 각주: (a) wet-lab 인프라·SaaS의 강도가 중인 것은 빅파마가 여러 곳을 동시에 쓰고(멀티소싱) 내부도 키우기(병행) 때문입니다. 단 빅파마가 외주로 통행료를 낸다는 사실은 이 곡괭이들이 실재한다는 증거입니다. (b) 채굴자 진척(매출 급감·감원·파이프라인 중단)은 강도가 아니라 다른 축입니다. 깅코 -49%는 구 파운드리 서비스 사업전환 손실이지 wet-lab 곡괭이 판정이 아닙니다(매출 감소 ≠ 곡괭이 약화, 2편 교훈). (c) 회사들의 모델 오픈소스화는 데이터 해자 침식이 아니라 강화의 증거입니다. 데이터가 진짜 해자라서 모델을 미끼로 풀어 데이터를 지킵니다. 폐쇄 실측 데이터 곡괭이는 강도 중이고, 시한은 공개 DB 확장·범용 모델 압력으로 🟡입니다(영구 아님).

단백질은 검증장벽이 신약 다음으로 높지만, 곡괭이는 신약과 비슷한 강도로 실재합니다. 빅파마가 외부 발굴사에 외주로 거액의 통행료를 내고 있기 때문입니다(노바티스 $1B+·AZ $247M 검증, 암젠·다케다 $1B+ 보도). 그런데 가장 단단한 AI-네이티브 후보(크래들·차이·프로플루언트)가 전부 비상장이라, 살 수 있는 상장 승자가 없습니다. 곡괭이가 약해서가 아니라, 설계가 더 빨리 공짜가 돼 곡괭이가 비상장 데이터 레이어로 내려간 것입니다. 그래서 행동은 "AI로 단백질을 설계한다"는 간판을 쫓는 게 아니라, "곡괭이가 어느 레이어에 있는가 / 그것을 상장으로 살 수 있는가 / 그 길목이 얼마나 오래 가는가"를 함께 보는 것입니다. 곡괭이의 존재와 투자가능성은 다른 축입니다.

4장 결론: 곡괭이는 신약과 동형으로 실재한다(빅파마 외주 통행료가 증거). 단 설계가 더 빨리 공짜가 돼, 곡괭이가 한 단계 더 깊은 비상장 데이터 보유사로 내려갔다. 그래서 살 수 있는 상장 top-line 승자가 안 보인다.

곡괭이 후보는 넷: 자동화 wet-lab 인프라(깅코·앱사이, 물리 자본이라 우회 느림)·폐쇄 데이터(프로플루언트·차이, 모델은 미끼·데이터는 보석)·SaaS로 파는 자(크래들·차이, 단백질판 XtalPi)·빅파마(외주 통행료 지불 + 자체 임상 트랙레코드).
강도는 AI-네이티브가 모두 중·🟡(신약과 비슷), 빅파마 강·🟢, 오픈 설계모델 약(신기루)·🔴. 신약과의 진짜 차이는 강도가 아니라 살 수 있는가다.
크래들·차이·프로플루언트가 전부 비상장이라, 단백질판 XtalPi는 분명히 있는데 우리가 살 수 없다. 곡괭이 존재 ≠ 투자가능.
그래서 투자자에게: "AI로 단백질을 설계한다"는 간판이 아니라 "곡괭이가 어느 레이어에 있고, 상장으로 살 수 있고, 얼마나 오래 가는가"를 함께 물어야 한다.

에필로그: 곡괭이가 사라진 게 아니다, 비상장으로 한 단계 더 들어갔다

답사를 마칩니다. 가장 짧게 줄이면 이렇습니다. 진짜 곡괭이를 쥔 회사들은 아직 상장을 안 했습니다. 그래서 곡괭이가 있는 줄 알면서도 우리가 살 수가 없습니다.

곡괭이가 약해진 게 아닙니다. 빅파마는 단백질 발굴사에 외주로 거액의 통행료를 내고 있습니다(노바티스 $1B+·AZ-앱사이 최대 $247M이 1차 출처로 확인된 핵심 예이고, 암젠·다케다 등도 비슷한 규모로 보도됐습니다). 자동화 wet-lab은 한 곳에 $156M 이상·4~6년이 드는 자본설비라, 빅파마조차 쉽게 우회하지 못합니다. 곡괭이는 분명히 작동하고 있습니다.

그렇다면 왜 2편의 XtalPi 같은 살 수 있는 승자가 안 보일까요. 신약에서는 설계가 아직 완전히 공짜가 아니어서 설계 플랫폼을 파는 XtalPi가 상장 장부에 통행료를 찍을 수 있었지만, 단백질에서는 설계 모델이 통째로 오픈소스로 풀려 곡괭이가 한 단계 더 안쪽, 폐쇄 데이터로 내려갔기 때문입니다. 그 데이터를 가장 잘 쌓는 크래들·차이·프로플루언트는 대부분 아직 비상장입니다. 크래들은 톱25 제약사 중 6곳에 통행료를 걷고, 차이는 릴리·화이자에 독점 데이터 전용 모델을 팝니다. 단백질판 XtalPi는 분명히 있습니다. 다만 비상장이라 그 장부가 우리 눈에 안 보일 뿐입니다.

여기에 이 편의 진짜 역설이 있습니다. 곡괭이가 약한 게 아니라, 곡괭이는 분명히 있는데 우리가 살 수 있는 자리에 없는 것입니다. 회사들이 자기 모델을 스스로 푼 것도 데이터 해자가 무너져서가 아니라, 데이터가 진짜 보석이라 모델이라는 포장지를 미끼로 던진 것이었습니다.

그러니 이 글을 "AI 바이오는 다 투자 부적격"으로 읽으면 정반대로 읽은 것입니다. 곡괭이는 실재하고 빅파마가 통행료를 내고 있습니다. 다만 그 곡괭이가 지금은 비상장이라 직접 살 수 없을 뿐이고, 제너레이트의 2026년 IPO가 그 첫 시험대입니다. 그래서 우리는 종목을 찍지 않고 자를 쥐여 드립니다. "AI로 단백질을 설계한다"에 홀리지 말고, 곡괭이가 어느 레이어로 내려갔는지, 그것을 상장으로 살 수 있는지, 그 길목이 얼마나 오래 가는지를 함께 물으십시오. 곡괭이의 존재와 투자가능성은 다른 축입니다.

🧭 다음 편 예고

다음 편(4편)에서는 소재·화학을 답사합니다. AI가 안정적인 새 결정 구조 220만 건을 며칠 만에 예측한 시대에, 그중 실제 합성이 확인된 것은 0.033%이고 산업 양산은 0건이었습니다. 단백질에서 wet-lab이 병목이었듯, 소재에서는 합성·물성·인증·양산이 곡괭이입니다. 비커 안에서 되는 것이 산업 반응기에서 안 되는 죽음의 계곡에서, 누가 그 검증을 파는 길목을 쥐었는지를 발굴합니다.

단백질: 곡괭이는 사라진 게 아니라 비상장으로 숨었다 (한 장 요약)

단백질 설계는 사실상 공짜가 됐다. 알파폴드·RFdiffusion·ESM이 오픈소스이고, 더 결정적으로 이 분야 회사들이 자기 모델을 스스로 풀었다(제너레이트→크로마, 프로플루언트→오픈크리스퍼). 단 이것은 "보석을 던졌다"가 아니다. 데이터가 진짜 해자라서, 모델을 미끼로 풀고 데이터를 지킨 것이다(프로플루언트는 오픈크리스퍼를 풀되 약 800억 서열 DB 독점, 차이는 차이-1을 풀되 릴리·화이자엔 독점 데이터 전용 모델 판매). 곡괭이는 wet-lab과 그 위의 독점 데이터로 이동했다.

곡괭이는 약하지 않다. 빅파마가 외부 발굴사에 외주로 거액의 통행료를 낸다: 노바티스-제너레이트 $1B+·AZ-앱사이 최대 $247M이 1차 출처로 확인된 예이고, 암젠-제너레이트 약 $1.9B·다케다-나블라 $1B+도 보도됐다(모두 잠재 총액 biobucks). 자동화 wet-lab은 한 곳에 $156M+·4~6년이 드는 자본설비라 빅파마조차 쉽게 우회 못 한다. 이 딜들 자체가 곡괭이가 실재한다는 증거다.
★역설: 검증장벽은 신약 다음으로 높고 곡괭이 강도도 신약과 비슷한데, 2편의 XtalPi 같은 살 수 있는(상장) top-line 승자가 없다. 곡괭이가 약해서가 아니라, 설계가 더 빨리 공짜가 돼 곡괭이가 한 단계 더 깊은 비상장 데이터 보유사로 내려갔기 때문이다. 단백질판 XtalPi는 있다(크래들 톱25 중 6곳·직원 2배, 차이 릴리·화이자·약 $1.3B 밸류). 다만 비상장이라 매출이 안 보일 뿐. 곡괭이 존재 ≠ 투자가능.
곡괭이 강도: 깅코·앱사이·크래들·차이·제너레이트·프로플루언트 모두 중·🟡(신약과 비슷), 빅파마 강·🟢, 오픈 설계모델 약(신기루)·🔴. 신약과의 진짜 차이는 강도가 아니라 살 수 있는가(단단한 AI-네이티브 후보가 전부 비상장)다.
깅코 매출 -49%는 구 파운드리 서비스의 사업전환 진통(채굴자 진척)이지 wet-lab 곡괭이 판정이 아니다(곡괭이 상품 클라우드 랩은 2026-03 론칭·매출 0, 판정 보류). 매출 감소 ≠ 곡괭이 약화(2편 교훈).
가장 단단한 길목은 신약과 똑같이 발굴 AI 바깥이다: 빅파마의 자체 wet-lab + 임상·규제 트랙레코드(강·🟢). 단 거대 다각화라 단백질 테마 순수 노출은 아니다.
1편 닻의 두 번째·한 단계 더 깊은 실증: 검증이 어렵다고 자동으로 살 수 있는 곡괭이가 생기진 않는다. 신약은 곡괭이가 설계 레이어(상장 가능)에, 단백질은 데이터 레이어(비상장)에 있다. 곡괭이 위치는 검증장벽 높이가 아니라 생성 레이어 상품화 속도가 결정한다. "AI 바이오 다 투자부적격"이 아니라 "곡괭이는 있되 지금은 못 사는 자리에 있다"가 정확한 진단이다.