비바 규제 운영 해자 완전 분석: 도구가 아니라 규제 프로세스 그 자체
비바의 해자는 좋은 소프트웨어가 아니라 규제가 강제하는 시스템 오브 레코드입니다. 단일 데이터 모델, 전환비용 5중 구조, 임상 진행 중 시스템 동결, 2029 이중 데드라인이 만드는 락인을 R&D·품질 사업부 중심으로 해부합니다.
비바 R&D·품질 해자의 본체는 단일 데이터모델이라는 '레일'이 아니라, 고객이 모듈마다 쌓아 올린 GxP 검증이라는 매몰자산입니다. 단일 데이터모델은 그 자체가 빗장이라기보다, 한 신약의 임상·규제·품질·안전 데이터를 한 레일에 올려 신규 모듈을 거의 0의 마찰로 부착시키는 확장 가속기입니다. 실제로 고객을 묶는 빗장은 모듈마다 다시 받아야 하는 검증이고, 그래서 이것은 소프트웨어가 아니라 프로세스 자체입니다. 상위 20대 제약사 중 규제정보관리는 19곳, 임상 문서 관리는 19곳이 비바를 업계 표준으로 채택했습니다.
비바 규제 운영 해자란 무엇인가
비바의 R&D·품질 사업부는 한 신약의 임상·규제·품질·안전 데이터를 단일 데이터모델 위에 올린 클라우드 플랫폼입니다. 상위 20대 제약사 중 규제정보관리(RIM)는 19곳, 임상 문서 관리(eTMF)는 19곳이 이를 업계 표준으로 채택했습니다. 여기서 GxP란 의약품의 품질·안전을 규제기관이 요구하는 검증된 절차 표준으로, 시스템마다 수십만 달러의 검증을 거쳐야 하고 그 검증 자산은 다른 시스템으로 옮길 수 없습니다. 시스템마다 10만~50만 달러가 드는 이 GxP 검증이 고객 조직에 매몰자산으로 쌓여, 도구가 아니라 프로세스 자체가 되는 것이 이 해자의 정체입니다.
이 글이 던지는 관통 질문은 하나입니다. 비바의 R&D·품질 사업부는 왜 갈아탈 수 없는 해자를 가졌고, 그 해자는 언제 무너지는가. 그 답을 다섯 장에 걸쳐 풀어냅니다. 단일 데이터모델이라는 도로가 어떻게 생겼는지(1장), 한번 올라타면 왜 못 내려오는지(2장), 확률적 AI 시대에도 코어가 버티는 이유(3장), 역사적 1위 메디데이터를 어떻게 침식하는지(4장), 그리고 이 해자가 언제 무너지는지(5장)입니다.
신약은 발견만으로 팔 수 없습니다
어떤 신약 후보 물질이 시험관에서 아무리 뛰어난 효과를 입증해도, 그것만으로는 단 한 알도 환자에게 팔 수 없습니다. 그 물질이 약이 되려면 임상시험을 설계하고 기록하고(Clinical), 규제당국에 방대한 서류를 제출하고(RIM), 제조 품질을 관리하고(Quality), 출시 후 부작용을 평생 감시하는(Safety) 검문소를 전부 통과해야 합니다. 신약 개발은 발견의 게임이 아니라, 거대한 운영의 게임입니다.
여기서 한 가지 결정적인 구분이 생깁니다. 신약 개발에는 두 개의 게이트가 있습니다. 하나는 분자를 더 빨리 찾아주는 과학 게이트입니다. 슈뢰딩거, XtalPi, Insilico Medicine 같은 발굴 AI가 여기 속합니다. 다른 하나는 임상부터 허가까지의 운영 게이트입니다. 비바가 바로 이 운영 게이트의 도로입니다.
두 게이트의 결정적 차이는 강제성입니다. 과학 게이트는 회사가 원하면 전통적인 실험 방식으로 우회할 수 있습니다. AI가 분자를 찾아주지 않아도, 느리지만 사람이 찾으면 됩니다. 반면 운영 게이트는 다릅니다. 임상·규제·품질·안전은 21 CFR Part 11(미국 식약처의 전자기록·전자서명 규정으로, 모든 데이터 변경에 감사 추적과 전자 서명을 의무화) 같은 법으로 강제되어 누구도 건너뛸 수 없습니다 (tscsw).
이것을 통행료에 비유하면 이렇습니다. 과학 게이트는 우회로가 있는 통행료라 강제성이 약하고, 운영 게이트는 법으로 막아 둔 외길의 통행료라 강제성이 강합니다. 비바의 R&D·품질 사업부는 바로 이 강제 통행료 도로 위에 서 있습니다. 신약이 성공하든 실패하든, 임상에 들어간 모든 데이터는 이 도로를 지나야 합니다.
대표 주자: 슈뢰딩거, XtalPi, Insilico
작동 지점: 타깃 발굴 ~ 전임상
건너뛰기: 가능 (전통 실험으로 대체)
통행료 강제성: 낮음
작동 지점: IND 신청 ~ 임상 ~ NDA ~ 허가 후
건너뛰기: 불가 (법적 의무)
근거: 21 CFR Part 11, eCTD
통행료 강제성: 높음
출처: tscsw "Don't Short SaaS", IND = 임상시험계획승인신청(Investigational New Drug), NDA = 신약허가신청(New Drug Application).
이 글은 R&D·품질 사업부(임상·규제·품질·안전)만 다룹니다. 영업(Commercial CRM)에서 벌어지는 세일즈포스와의 충돌, 그리고 AI 위협·기회의 종합은 각각 별도 편으로 분리했습니다. 이 편은 규제가 강제하는 운영 게이트 한 채만 정밀하게 해부합니다.
1장. 단일 레일: Vault는 왜 '모듈 모음'이 아닌가
💡 핵심: Vault의 차별은 모듈 개수가 아니라 단일 오브젝트 모델입니다. eTMF 문서, CTMS 마일스톤, EDC 데이터포인트, RIM 제출, Safety 케이스가 같은 데이터 레이어를 공유합니다. 다만 이 단일 레일 자체가 빗장은 아닙니다. 그것은 신규 모듈을 거의 0의 마찰로 붙이는 확장 가속기이고, 고객을 떠날 수 없게 만드는 본체는 2장의 모듈별 GxP 검증 매몰자산입니다.
이 장에는 약자가 여럿 등장합니다. 먼저 길잡이를 하나 깔아두겠습니다. eTMF는 임상시험 문서 보관, RIM은 규제정보관리(허가 제출·등록), CTMS는 임상시험 운영 관리(일정·사이트), QMS는 품질 관리 워크플로(일탈·변경관리), EDC는 임상 데이터 수집(전자증례기록), Safety는 출시 후 부작용 감시(약물감시)입니다. 더해 eCTD 4.0은 각국 규제당국이 의무화하는 차세대 전자 제출 표준 포맷이고, 21 CFR Part 11은 모든 데이터 변경에 감사 추적·전자 서명을 요구하는 미국 전자기록 규정입니다. 약자가 많아 보이지만, 이 장에서 기억할 것은 하나입니다. 이것들이 전부 같은 하나의 데이터 레일 위에 얹혀 있다는 사실입니다.
1.1 하나의 데이터모델 위에서 데이터가 환승하지 않는다
단일 데이터모델의 핵심 역할은 확장 가속기입니다. 이미 한 모듈로 들어온 고객에게 다음 모듈을 거의 0의 마찰로 붙여 줍니다. Vault Object Framework(VOF, Vault 오브젝트 프레임워크)가 문서와 구조화된 데이터를 하나의 오브젝트 모델로 통합하기 때문입니다. eTMF 문서가 CTMS 마일스톤, EDC 데이터포인트, RIM 제출, Safety 케이스와 같은 데이터 레이어를 공유합니다 (IntuitionLabs).
비유로 풀면 이렇습니다. 한 신약의 데이터가 임상에서 안전까지 가는 동안, 비바 위에서는 데이터가 한 번도 갈아타지 않고 하나의 선로를 끝까지 달립니다. 반면 경쟁사의 베스트오브브리드 조립은 역마다 데이터를 내려 다음 시스템으로 옮겨 싣는 환승 구조입니다. 환승할 때마다 짐을 풀었다 다시 싸고, 형식을 맞추고, 누락이 없는지 검수해야 합니다. 그 마찰이 곧 비용이고, 그 비용이 곧 비바가 새 모듈을 팔 때의 무기입니다.
여기에 한 겹이 더 있습니다. Vault는 고객이 직접 쿼리하는 SQL 데이터베이스가 아니라, API와 오브젝트·문서 모델로만 제어하는 관리형 플랫폼입니다 (IntuitionLabs). 데이터를 꺼내는 일조차 비바의 API를 통과해야 합니다. 즉 통합의 연속성이 그 자체로 통제력이 됩니다. 데이터가 한 레일을 달린다는 것은, 그 레일의 주인이 데이터의 입출입을 쥐고 있다는 뜻이기도 합니다.
개념적 시각화. 출처: IntuitionLabs Vault 아키텍처 가이드.
1.2 진짜 멀티테넌트 + 전 고객 동시 업그레이드 + 검증 패키지 동봉
Vault에는 온프레미스 버전이 아예 없습니다. 클라우드 네이티브 전용으로 설계되어, 연 3회(R1·R2·R3) 릴리즈마다 전 고객이 같은 시점에 같은 최신 버전으로 올라갑니다 (IntuitionLabs). 버전 파편화가 0이라는 뜻입니다. 어떤 고객은 구버전, 어떤 고객은 신버전을 쓰는 일이 없으니, 벤더가 검증 패키지를 중앙에서 한 번만 만들어 모두에게 동일하게 적용할 수 있습니다.
이게 왜 해자인지는 다음 한 가지를 알면 분명해집니다. 규제 환경에서 소프트웨어를 바꾸거나 업데이트할 때마다 고객은 그것이 의도대로 설치·작동하는지를 증명해야 합니다. 비바는 매 릴리즈마다 IQ/OQ(Installation/Operational Qualification, 설치·운영 적격성 검증)를 자동으로 수행하고, 고객에게 요건서·테스트 스크립트·추적 매트릭스로 구성된 검증 패키지를 동봉해 줍니다 (IntuitionLabs). 본래 고객이 직접 져야 할 검증 부담을 벤더가 흡수하는 구조입니다.
그런데 바로 이 친절이 빗장이 됩니다. 벤더가 흡수해 준 검증 부담은, 고객이 떠나는 순간 전부 다시 고객의 어깨로 되돌아옵니다. 평소에는 보이지 않던 비용이, 이탈을 결정하는 순간 한꺼번에 청구서로 날아옵니다.
1.3 경쟁사는 왜 이 통합을 흉내내지 못하는가
경쟁사들도 강한 모듈을 하나씩은 가지고 있습니다. 문제는 그것들을 임상부터 안전까지 하나의 레일로 잇지 못한다는 점입니다. 네 곳을 차례로 보겠습니다.
메디데이터(Dassault)는 Rave EDC라는 역사적 강자를 가졌지만, 임상(eClinical)에 집중되어 있고 RIM·품질·안전으로 단일 모델 수직통합을 이루지 못했습니다. 게다가 Dassault의 3DEXPERIENCE 플랫폼에 편입되면서 통합 오버헤드가 더해졌습니다 (Dassault Q4 2025).
오라클은 InForm(EDC)·Siebel(CTMS)·Oracle Clinical을 이어 붙인(stitched) 레거시 자산의 묶음입니다. 단일 데이터모델이 아니라 온프레미스 시대의 헤리티지를 합쳐 놓은 형태에 가깝습니다.
IQVIA는 CRM에 실사용데이터(RWD) 자산을 결합한 다른 종류의 모델입니다. 비바와 같은 통합 플랫폼 경쟁이라기보다 데이터 자산 경쟁에 가까워, 겨루는 링 자체가 다릅니다.
아리스글로벌은 LifeSphere(RIM·Safety)와 AI 네이티브 NavaX로 규제·안전에 특화했지만, 통합 임상 플랫폼이 없고 고객 규모가 작습니다. LifeSphere가 220곳 이상인 데 비해 비바 RIM은 450곳 이상입니다 (Veeva RIM PR, latterly.org).
네 곳의 공통점은 하나입니다. 단일 데이터모델의 부재입니다. 각자가 강한 모듈은 있어도, 임상에서 안전까지 하나의 선로로 잇는 곳은 비바뿐입니다.
| 경쟁사 | 강한 영역 | 구조적 약점 |
|---|---|---|
| 메디데이터 (Dassault) | Rave EDC (임상 강자) | 임상에 집중, RIM·품질·안전 수직통합 부재 + 3DEXPERIENCE 편입 오버헤드 |
| 오라클 | InForm·Siebel·Oracle Clinical | 이어 붙인 레거시 자산, 단일 데이터모델 아닌 온프레미스 헤리티지 |
| IQVIA | CRM + 실사용데이터(RWD) | 통합 플랫폼이 아닌 데이터 자산 모델, 겨루는 링이 다름 |
| 아리스글로벌 | LifeSphere(RIM·Safety), NavaX | 통합 임상 플랫폼 없음, 규모 작음 (220곳+ vs 비바 RIM 450곳+) |
네 경쟁사 모두 강한 모듈은 있으나 임상에서 안전까지 잇는 단일 데이터모델이 없습니다.
여기서 정직하게 짚을 점이 셋 있습니다. 첫째, "통합은 마케팅 수사 아닌가"라는 반론에 대해, 통합의 실체는 데이터 추출이 API에 의존한다는 아키텍처 사실(SQL DB가 아님)에 있습니다. 둘째, 영업(Commercial)에서는 세일즈포스가 정면으로 충돌하지만, 그 전선은 별도 편의 주제이고, R&D 영역은 GxP·eCTD 규제 강제로 수평 CRM 벤더가 쉽게 진입하기 어려운 다른 시장입니다. 셋째, 가장 중요한 헤지인데, 단일 레일이 곧 락인은 아닙니다. 상위 20대 제약사도 모듈마다 벤더를 섞습니다. RIM은 비바가 19/20이지만 EDC는 8/20입니다. 설치 베이스 전체로 보면 '하나의 레일'은 아직 완성된 사실이라기보다 열망(aspiration)에 가깝습니다. 실제로 고객을 묶는 빗장은 단일 레일 그 자체가 아니라 모듈마다 다시 받아야 하는 GxP 검증(다음 장)이고, 단일 데이터모델은 그 빗장이 아니라 다음 모듈을 0 마찰로 붙이는 확장 가속기입니다.
2장. 도구가 아니라 프로세스: 전환비용 5중 구조
💡 핵심: 비바의 전환비용은 소프트웨어 라이선스가 아니라, 고객 조직이 Vault 위에 쌓은 검증된 SOP와 QA 승인 이력에 있습니다. 매몰자산이 벤더가 아니라 고객 측에 쌓이기 때문에, 떠나려면 그것을 전부 처음부터 다시 만들어야 합니다. 5중처럼 보이는 락인은 사실 이 하나의 메커니즘이 다섯 갈래로 발현한 것입니다.
2.1 데이터 중력과 규제 동결: 진행 중인 시험은 옮길 수 없다
EDC는 임상 데이터의 원장입니다. 한 임상시험에는 수백만 건의 감사 추적(audit trail)과 버전 이력이 쌓이는데, 이것을 다른 시스템으로 동일한 형식 그대로 이관하는 것은 사실상 불가능합니다 (IntuitionLabs). 데이터가 무거울수록 그 자리를 떠나기 어렵습니다. 이것이 데이터 중력입니다.
더 강한 빗장은 규제 동결입니다. 21 CFR Part 11이 요구하는 감사 추적·전자 서명 요건 때문에, 진행 중인 임상시험을 다른 시스템으로 옮기려면 재검증과 데이터 무결성 입증에 큰 비용과 시간이 듭니다. 정직하게 말하면, 활성 스터디의 이전 자체는 일부 벤더가 상품화한 실재 실무입니다. 예컨대 OpenClinica는 1,700명 이상·15만 폼 규모의 활성 스터디 14건을 무중단으로 마이그레이션한 사례를 공개했습니다 (OpenClinica). 다만 상위 20대 제약사의 설치 베이스에서 비바와 경쟁사의 코어 EDC 사이를 대량으로 교차 전환하는 것은 아직 관행이 아니어서, 현실에서는 대체로 신규 시험에서 시스템을 갈아탑니다 (Hollertotide).
여기에 마찰이 한 겹 더 곱해집니다. 제약사는 평균 5개 이상의 검증된 Vault 시스템을 동시에 운용합니다 (tscsw). 시스템 하나를 바꾸는 것도 부담인데, 그 부담이 시스템 수에 비례해 가중됩니다. 체감으로 환산하면 이렇습니다. 시스템당 GxP 검증이 10만~50만 달러이니, 5개 시스템을 갈아타려면 검증 비용만 단순 합산해도 50만~250만 달러입니다. 거기에 고객 QA 조직의 재검증과 승인에 걸리는 수년의 시간이 더해집니다.
| 전환 부담 항목 | 1개 시스템 | 5개 시스템 (평균 운용) |
|---|---|---|
| GxP 검증 비용 | $10만~50만 | $50만~250만 |
| 연간 유지보수 | 초기 검증의 15~25% | 시스템 수만큼 누적 |
| QA 조직 재검증·승인 | 수개월 | 수년 |
| 진행 중 시험 | 규제 동결로 이전 곤란 | 신규 시험에서만 교체 가능 |
검증 비용은 단순 합산이지만, 부담은 시스템 수에 비례해 가중됩니다. 출처: Hollertotide, tscsw.
2.2 GxP 검증 경제와 CSA 프레임워크: 이전·상속·축약이 불가능한 면허
GxP 검증 비용은 시스템 복잡도에 따라 구현당 10만~50만 달러이고, 연간 유지보수가 초기 검증 비용의 15~25%입니다 (Hollertotide). 그리고 이 검증은 벤더가 대신 도장을 찍어 줄 수 있는 게 아닙니다. 고객 자체 QA 조직의 승인과 Change Control Board(변경 통제 위원회)의 서명이 반드시 있어야 합니다.
핵심은 이 검증 작업이 "이전되거나, 상속되거나, 축약될 수 없다(cannot be transferred, inherited, or abbreviated)"는 점입니다 (Hollertotide). 이전이 안 된다는 건 한 시스템의 검증을 다른 시스템에 가져다 쓸 수 없다는 뜻이고, 상속이 안 된다는 건 벤더의 검증이 고객의 검증을 면제해 주지 못한다는 뜻이며, 축약이 안 된다는 건 "이미 비슷한 걸 검증했으니 이번엔 간략히"가 통하지 않는다는 뜻입니다. 벤더를 바꾸면 시스템마다 전액을 처음부터 다시 검증해야 합니다.
여기에 2025년의 변화 하나가 더해집니다. FDA가 처방적 검증(IQ/OQ/PQ)에서 리스크 기반 CSA(Computer Software Assurance, 컴퓨터 소프트웨어 보증)로 프레임워크를 전환했습니다. 그런데 이 전환이 오히려 비바의 빗장을 두껍게 만듭니다. 비바 플랫폼에 맞춰 2년에 걸쳐 구축한 CSA 프레임워크는, 경쟁사로 옮기는 순간 처음부터 다시 짜야 하기 때문입니다 (Hollertotide). 규제가 유연해질수록, 그 유연함에 맞춰 쌓은 고객의 노하우는 더 깊이 특정 플랫폼에 박힙니다.
2.3 2029 eCTD 4.0 데드라인: 강제 교체 창은 양방향이다
R&D 영역의 의무 업그레이드는 FDA eCTD 4.0 필수 채택입니다(미국 2029, EMA 2025-12, 일본 PMDA 2026-04) (Veeva eCTD 4.0). 별도로 레거시 CRM 지원 종료(2029-12)가 있으나 이는 영업(Commercial) 영역의 사건이라 이 편의 범위 밖이며 별도 편의 주제입니다. 두 일정을 하나의 'R&D 순풍'으로 묶지 않습니다.
그리고 강제 교체가 비바에 일방적인 순풍이라고 단정하지도 않습니다. "어차피 한 번 갈아엎어야 한다면 단일 Vault로 통합하는 편이 경제적"이라는 압력은 일부 작동합니다. 하지만 eCTD 4.0은 ICH 표준 포맷이라, 포맷 전환 자체는 본질적으로 벤더 중립입니다. 따라서 강제 교체 시점은 단일 플랫폼 통합의 경제성을 일부 높이는 동시에, 신규 RFP를 열어 경쟁사에게도 교체 창을 내주는 양방향 이벤트입니다(가설). 이 갈래를 5중 중 가장 약한 갈래로 두는 이유입니다.
2.4 "프로세스 자체"라는 말이 기술적으로 성립하는 이유
위 다섯 갈래, 즉 데이터 중력·규제 동결·검증 경제·CSA·2029 강제 교체 창은 별개의 다섯 해자가 아닙니다. 하나의 메커니즘이 다섯 갈래로 발현한 것입니다. 그 하나의 메커니즘은 검증된 매몰자산이 벤더가 아니라 고객 조직 측에 쌓인다입니다. 다만 다섯째(2029 강제 교체 창)는 앞의 넷과 달리 양방향이라(2.3) 가장 약한 갈래이고, 본체는 둘째인 규제 동결과 셋째·넷째인 검증 경제입니다.
그래서 전환비용은 소프트웨어 라이선스가 아니라, 고객이 Vault 위에 구축한 검증된 SOP·CSA 프레임워크·QA 승인 이력입니다. 벤더가 떠나는 비용을 매기는 게 아니라, 고객 스스로 쌓아 올린 자산을 스스로 허물어야 하는 구조입니다. 이것이 "도구가 아니라 프로세스 자체"라는 주장이 마케팅 수사가 아니라 기술적으로 성립하는 근거입니다.
출처: Hollertotide 규제 해자 분석, Veeva eCTD 4.0 블로그, tscsw. ②③④가 본체, ⑤(2029 강제 교체 창)는 양방향이라 가장 약한 갈래입니다.
여기서 두 가지 반론을 정직하게 마주합니다. 첫째, "Bayer가 다운타임 0일로 마이그레이션하지 않았느냐"는 운영 반론이 있습니다. 그 사례는 영업(Commercial CRM)의 마이그레이션이지, 진행 중인 임상시험의 무중단 이전이 아닙니다. 활성 스터디의 무중단 이전 자체는 일부 벤더가 상품화한 실무이지만, 상위 20대 코어 EDC를 비바와 경쟁사 사이에서 대량으로 교차 이전하는 것은 아직 비관행이며, 그 대량 전환의 스케일업이 바로 5장의 최우선 반증조건입니다. 둘째, "5중 락인은 과장 아니냐"는 단순화 반론에는, 위 2.4처럼 단일 메커니즘에 다섯 발현으로 정직하게 정리했습니다.
3장. 결정론의 방어선: AI가 코어 원장은 못 깨지만 워크플로 층은 노출된다
💡 핵심: 결정론은 저장층(검증된 원장)을 지킵니다. 규제 제출물은 법으로 결정론적·재현가능·감사가능한 출력을 요구하고, 확률적 LLM은 시스템 오브 레코드(System of Record, 어떤 사실의 공식 원본 기록을 보관하는 시스템) 그 자체가 될 수 없습니다. 그러나 매출과 지불의사가 집중된 작성·검토 워크플로 층은 AI 네이티브 공격에 노출됩니다. 비바의 방어선은 닫힌 요새가 아니라, 결정론적 원장과 그 위 워크플로 층을 함께 묶는 검증·감사추적·Direct Data API 종속입니다.
3.1 규제 원장은 결정론을 법으로 요구한다
21 CFR Part 11의 감사 추적과 전자 서명은 모든 변경의 결정론적 추적을 요구합니다. 같은 입력에는 같은 출력이, 그리고 누가 언제 무엇을 바꿨는지가 한 치의 모호함 없이 남아야 합니다. 여기에 2025년 1월 FDA의 AI 지침이 한 겹을 더했습니다. 훈련 데이터와 재현성의 입증, 그리고 리스크 기반 신뢰성 평가(credibility assessment)를 요구합니다 (FDA).
문제는 LLM이 본질적으로 확률적·비결정론적이라는 데 있습니다. 같은 질문에도 매번 조금씩 다른 답을 내놓습니다. 따라서 임상 데이터 원장(EDC)·규제 제출(RIM)·품질 레코드(QMS) 같은 시스템 오브 레코드 그 자체가 될 수 없습니다. AI는 초안 작성·요약·분류·트리아지 같은 보조 레이어로만 작동하고, 검증된 레코드는 결정론적 저장소에 남아야 합니다.
결론적으로 AI 네이티브 경쟁자는 규제 코어를 기술적으로 "대체"할 수 없습니다. 코어를 대체하는 게 아니라, 그 "위에 얹히거나 옆에 붙는" 생산성 레이어로만 경쟁할 수 있습니다.
3.2 AI 시대에 데이터 통제가 오히려 강해지는 이유
해자의 본체는 사용자 인터페이스가 아니라 검증된 독점 데이터와 컴플라이언스 래퍼입니다. AI의 가치는 검증된 데이터에 접근할 수 있느냐에 비례하므로, 데이터를 보유한다는 것이 곧 AI 해자가 됩니다. 화면이 예쁜 게 아니라, 그 화면 뒤에 규제가 인정한 데이터가 있느냐가 관건입니다.
핵심은 데이터 추출 파이프(Direct Data API)를 비바가 소유한다는 점입니다. 외부 AI조차 이 API를 통과해야 검증된 규제 데이터에 닿고, 외부 데이터웨어하우스로의 연결도 읽기 전용이라 Vault가 원천(source of truth) 위치를 유지합니다 (Veeva Direct Data API). 역설적이게도, AI가 늘어날수록 저장층에 대한 종속이 강해집니다. 모든 AI가 같은 우물에서 물을 길어야 하고, 그 우물의 주인이 비바이기 때문입니다.
게다가 Vault AI 에이전트는 기존의 접근 제어·권한·감사 추적을 그대로 상속해 Vault 워크플로 안에서만 작동합니다. AI 네이티브 경쟁자가 비바를 따라잡으려면 이 컴플라이언스 래퍼를 처음부터 다시 만들어야 합니다 (Veeva AI). 데이터 규모와 API 성능 수치, 토큰 과금 수익화의 종합은 이 편이 다루지 않고 AI 통행료 편이 본체로 다룹니다.
3.3 갈리는 경계는 '코어 vs 주변'이 아니라 '저장층 vs 워크플로 층'이다
정직하게 말하면, 결정론이 지키는 것은 저장층(임상·규제·품질 원장)입니다. 반면 매출과 지불의사가 몰리는 작성·검토(authoring·review) 워크플로 층은 안전이나 MLR 같은 주변 모듈에만 한정되지 않습니다. 규제 코어(RIM) 안에서도 AI 네이티브 공격에 노출됩니다.
구체적 노출 지점은 타이밍 갭입니다. 비바의 규제문서 자동 작성(agentic authoring)은 2027년 말 출시 예정인 반면, 파트너와 경쟁 도구는 이미 비바 RIM에 연동되는 AI 작성·QC를 제공합니다. 예컨대 AuroraPrime은 2026년 3월 통합 출시로 초안 작성 시간을 최대 50% 단축한다고 표방합니다 (Clinical Trial Vanguard, AlphaLife). 비바가 자기 도구를 내놓기 전까지의 이 공백 기간이, 워크플로 층의 실재 위협입니다.
다만 그 워크플로 층에도 진입장벽이 있습니다. AI가 작성과 검토를 하더라도, 그 결과물은 검증·감사추적을 통과해 결정론적 원장에 남아야 하고, 외부 AI는 Direct Data API를 거쳐야 데이터에 닿습니다(3.2). 즉 워크플로 층은 누구나 들어오는 '열린 평지'가 아니라 비바를 거쳐야 하는 '종속된 통로'입니다.
그래서 "AI가 비바를 파괴한다"는 우려도, "AI는 무조건 비바의 해자"라는 자사 서사도 단일 방향으로 단정할 수 없습니다. 저장층은 강화되고, 워크플로 층은 노출과 종속이 공존합니다. 이 전선의 종합과 출시 타이밍 리스크는 별도 편에서 다룹니다.
출처: FDA AI 지침(2025-01), Veeva AI 발표. 노란 점선 층은 노출되었으나 비바에 종속된 워크플로 층입니다.
4장. 메디데이터를 침식하다: 기술 대치인가 임상 위축인가
💡 핵심: 비바는 표준화 점유 사다리에서 문서·규제·품질문서는 독식했고(eTMF·RIM·QualityDocs 각 19/20, CTMS 17/20), 운영 워크플로(QMS 6/20)·수집(EDC 8/20)·안전(Safety, 성장 단계)에서는 활주로를 달리는 도전자입니다. 메디데이터가 줄어드는 것은 사실이지만, 그것을 '비바가 몇 %p 가져갔다'로 환산할 수 없습니다. 분모·통화·범위·시점이 모두 다르기 때문입니다. 방향성만이 신호입니다.
4.1 표준화 점유 사다리: 어디는 독식, 어디는 도전자
상위 20대 글로벌 제약사가 무엇을 표준으로 채택했는지를 모듈별로 세어 보면, 비바의 위치는 두 층으로 갈립니다. 먼저 시선을 두 단어에 묶어 두겠습니다. 하나는 독식(문서·규제·레코드 레이어)이고, 다른 하나는 활주로(운영 워크플로·수집·안전 모듈, 성장 중)입니다. 아래 막대에서 보라색이 독식, 노란색이 활주로입니다.
출처: Veeva PR (각 모듈, 시점 상이). Safety는 정밀 1차 수치 미확정이라 성장 단계로 별도 표기.
Safety(약물감시)는 상위 20대 중 소수가 채택한 성장 단계로, 정밀 1차 수치가 확정되지 않아 막대에서 제외했습니다. RIM은 2022년 15/20에서 2025년 9월 19/20으로, EDC는 2023년 2월 6/20에서 2024년 3월 8/20으로 올랐습니다.
이 그림의 메커니즘은 1장·2장과 그대로 이어집니다. 전환 마찰이 낮고 규제 데드라인이 강제하는 문서·규제 레이어에서 먼저 표준을 잡고, 단일 데이터모델 위에서 "이미 검증된 플랫폼에 모듈 하나 추가"라는 거의 0에 가까운 마찰로 안쪽(EDC)으로 확장합니다. R&D 고객은 평균 3개 제품을 쓰는데 판매 가능한 제품은 40개가 넘어, 계정 안에서 더 팔 여력이 큽니다 (Intrinsic Investing).
4.2 -2~-7% vs +21%, 차감하면 안 되는 두 숫자
역사적 1위였던 메디데이터(Dassault Life Sciences 세그먼트)는 FY2024 약 €1,144M으로 -1%, FY2025에는 세그먼트 전체 -2%(메디데이터 반복매출은 별도 추정 -7%)였습니다. Dassault는 그 원인을 임상시험 스터디 스타트의 감소로 설명합니다 (Dassault Q4 2024, Dassault Q4 2025).
같은 기간 비바 R&D and Quality 구독매출은 FY2026에 +21% YoY($1,426.6M)였습니다. 세그먼트 총매출 $1,748M과는 별개의 숫자입니다 (Veeva IR).
여기서 가장 흔한 함정을 못박습니다. 이 두 숫자를 빼서 "비바가 메디데이터에서 몇 %p를 가져갔다"는 단일 지표로 환원하면 안 됩니다.
⚠️ 차감 금지: 메디데이터 -7%는 유로화·달력연도·임상 한정 수치이고, 비바 +21%는 R&D and Quality 구독매출 기준으로 달러·1월 회계연도·임상+규제+품질+안전 합산입니다. 분모도, 통화도, 범위도, 시점도 모두 다릅니다. 한쪽이 줄고 한쪽이 느는 방향성만이 신호입니다.
출처: Veeva IR FY2026(USD·1월 회계·임상+규제+품질+안전), Dassault Q4 2025(EUR·달력연도·임상 한정, 별도 추정). 차감 불가.
4.3 거울상 인사이트: 코어를 지키는 빗장이 공격 속도도 묶는다
여기에 이 글에서 가장 아름다운 역설이 하나 숨어 있습니다. EDC는 가장 끈끈한 원장이고, 규제 동결 때문에 진행 중인 시험은 옮길 수 없습니다(2장). 그래서 비바는 메디데이터의 진행 중 시험 설치 베이스를 통째로 빼앗아 올 수 없습니다. 비바가 이기는 곳은 오직 신규 시험(flow)입니다. EDC가 6/20에서 8/20으로 오르고 누적 1,000건 이상의 스터디 스타트를 기록한 것이 그 증거입니다.
결과적으로 메디데이터의 진행 중 시험(stock)은 규제 동결로 방어되고, 신규 스터디의 EDC 선택(flow)은 비바에 한계적으로 침식됩니다. 임상시험이 다년에 걸쳐 진행되므로, 침식은 구 시험이 종료되고 신 시험이 그 자리를 대체하지 않는 형태로, 반복매출 베이스가 천천히 줄어드는 모습으로 나타납니다. 메디데이터의 -2~-7%와 정합하는 그림입니다.
핵심 통찰은 거울상입니다. 메디데이터의 진행 중 시험을 지키는 바로 그 규제 동결 락인이, 동시에 비바의 공격 속도도 제약합니다. 비바의 EDC 침식이 강력하지만 폭발적이지 않은 이유가 여기 있습니다. 자기 코어를 지키는 메커니즘이 남의 코어도 지켜줍니다. 그래서 메디데이터의 쇠퇴를 "순수 임상 위축"으로도, "순수 비바 침식"으로도 단정할 수 없습니다. 비바의 침식은 실재하지만, 규제 동결에 막혀 신규 시험에 한정된 점진적 형태입니다.
마지막으로 정직하게 덧붙입니다. -2~-7%에는 순환적인 스터디 스타트 위축과 유로화 환산, Dassault의 가격·통합 영향이 혼재되어 있습니다. 구조적 침식만 떼어내 단정하지 않고, 방향성으로만 읽습니다.
5장. 이 해자는 언제 무너지는가
💡 핵심: 가장 강한 해자도 무너질 조건이 있습니다. 비바 R&D 해자의 단일 최우선 게이트는 '대형사 활성 스터디의 비바와 경쟁사 간 교차 이전이 분기 N건 이상으로 스케일업하는 것'입니다. 활성 스터디 이전 자체는 이미 실무로 존재하므로, 추적할 것은 그것이 상위 20대 코어 EDC에서 대량으로 스케일하는지입니다. 그 스케일업이 관측되면 규제 동결 락인의 본체가 약해집니다. 나머지는 점진 신호입니다.
이 글은 주가가 아니라 해자 자체로 닫습니다. 무엇이 관측되면 우리가 판단을 바꾸는지를 표로 남깁니다. 정답을 미리 정해 놓고 끼워맞추지 않기 위해, 반증의 조건을 먼저 박아 두는 것입니다.
| 반증조건 | 관측 트리거 | 무너지는 것 |
|---|---|---|
| 대형사 활성 스터디 교차 이전 스케일업 (최우선 게이트) | 상위 20대 코어 EDC에서 비바와 경쟁사 간 활성 스터디 교차 이전이 분기 N건 이상으로 확대 | 규제 동결 락인의 본체 (2장) |
| EDC·Safety 표준화 정체 또는 역전 | EDC 8/20에서 2년 이상 정체, Safety의 상위 20대 신규 채택 정지, 또는 경쟁사 신규 스터디 점유 역전 | 점유 확장 동력 (4장) |
| GxP 검증 비용 붕괴 + 벤더 이전성 확보 | 검증 비용·시간이 업계 50% 이상 하락하고 CSA 프레임워크가 벤더 간 이전 가능 | 전환비용 프리미엄 (2장) |
| AI 네이티브의 코어 모듈 표준 탈취 | 상위 20대 규제 코어 모듈(RIM·QMS) 1건이라도 AI 네이티브로 대체 | 결정론 방어선 (3장) |
첫 행이 단일 최우선 게이트. 활성 스터디 이전 자체는 이미 실무로 존재하므로, 게이트는 '0이 1이 되는가'가 아니라 '1이 N으로 스케일하는가'입니다.
가장 약한 고리는 EDC와 안전(Safety)입니다. 둘 다 낮은 베이스에서 상승 중이지만, 그 속도는 자기 코어를 지키는 바로 그 락인에 의해 점진적입니다.
우리가 추적할 단일 변수는 표의 첫 행입니다. 활성 스터디 이전 자체는 이미 실무로 존재하므로, 게이트는 그것이 처음 등장하느냐가 아니라 상위 20대 코어에서 분기 N건 규모로 관행화되느냐입니다. 그 교차 이전이 관행이 되는 순간, 이 글의 모든 논리가 약해집니다. 그 전까지는 "도구가 아니라 프로세스"라는 명제가 유지됩니다.
비바 R&D·품질 해자의 본체는 단일 데이터모델이라는 레일이 아니라, 고객이 모듈마다 쌓은 GxP 검증 매몰자산입니다. 단일 레일은 빗장이 아니라 신규 모듈을 0 마찰로 붙이는 확장 가속기이고, 실현된 빗장은 모듈마다 다시 받아야 하는 검증입니다.
- 단일 레일(1장): eTMF·CTMS·EDC·RIM·Safety가 한 데이터 레이어를 공유. 데이터 추출도 API를 거쳐야 하는 관리형 플랫폼이라 통합의 연속성이 곧 통제력입니다.
- 전환비용 5중(2장): 데이터 중력·규제 동결·검증 경제·CSA·2029 강제 교체 창은 하나의 메커니즘(검증 자산이 고객 측에 쌓임)의 다섯 발현. 본체는 규제 동결과 검증 경제, 가장 약한 갈래는 양방향인 2029 교체 창입니다.
- 결정론 방어선(3장): 저장층 원장은 LLM이 대체 못 하지만, 작성·검토 워크플로 층은 RIM 안까지 노출됩니다. 다만 그 층도 검증·감사추적·Direct Data API에 종속된 통로입니다.
- 점유 사다리(4장): 문서·규제·품질문서는 독식(19/20), 운영·수집·안전은 활주로. 메디데이터 -2~-7%와 비바 +21%는 분모·통화·범위·시점이 달라 차감할 수 없고 방향성만 신호입니다.
- 반증조건(5장): 단일 최우선 게이트는 대형사 활성 스터디의 코어 EDC 교차 이전이 분기 N건으로 스케일업하는 것. 그 전까지 "도구가 아니라 프로세스"는 유지됩니다.