데이터독 플랫폼 통합·Land-and-Expand 해자
입구는 자동 신호 상관, 깊이는 그 위 AI·워크플로우·600통합. 해자는 land와 expand가 사용량 과금으로 동시에 작동하는 플라이휠만큼 세고, 계측·설정 이전을 푸는 자동화에서 깎인다.
데이터독의 land-and-expand(랜드앤익스팬드)는 고객을 한두 개 제품으로 작게 들인 뒤 사용량과 제품 수를 자동으로 늘려 매출을 확장하는 구조입니다. 4개 이상 제품을 쓰는 고객이 56%로 매년 늘고, 멀티프로덕트 고객일수록 지출이 단연 큽니다. 순매출유지율(NRR)은 약 120%로, 매출 성장의 대부분이 신규 고객이 아니라 기존 고객 확장에서 나옵니다. 다만 영구 해자는 아닙니다. 계측 락인은 OTel로 풀리고 설정조차 자동 이전이 가능해지는 중이라, 진짜로 남는 마찰은 손에 익은 운영 절차(재훈련)와 600통합 재연결 공수이며 그조차 자동화로 깎입니다.
한 명을 들여 스스로 자라게 만드는 기계
도시의 수도나 전기 같은 종량제 유틸리티를 떠올려 보세요. 들어올 때는 계량기 하나만 달면 됩니다. 절차도 간단하고 초기 비용도 작습니다. 그런데 시간이 지나 집을 늘리고 가전을 늘릴수록, 요금은 누가 영업하지 않아도 자동으로 올라갑니다. 쓰는 만큼 청구되니까요. 데이터독(Datadog)이라는 회사를 이해하는 가장 빠른 길이 바로 이 그림입니다.
데이터독을 그냥 "모니터링 도구를 파는 회사"로 보면 핵심을 놓칩니다. 이 회사의 실체는 고객을 작게 들여(Land) 스스로 자라게 만드는(Expand) 엔진입니다. 고객은 보통 인프라 모니터링 한두 개 제품으로 시작합니다. 그러다 로그를 켜고, 애플리케이션 성능 모니터링(APM)을 켜고, 보안까지 켜면서 쓰는 제품 수와 사용량이 함께 늘어납니다. 영업이 한 명 한 명 설득해서가 아니라, 고객이 클라우드를 키우는 그 흐름을 따라 매출이 자동으로 붙습니다.
이 엔진의 성적표를 한 줄로 압축한 것이 순매출유지율(NRR)입니다. NRR(Net Revenue Retention)은 1년 전 그 고객들이 지금 얼마나 더 쓰는지를 보는 지표로, 우리 개념사전의 NDR(순달러유지율)과 같은 것을 가리킵니다. 데이터독의 NRR은 약 120%입니다 (AlphaSpread). 같은 고객 집단이 1년 만에 20% 더 쓴다는 뜻입니다.
결정적인 신호는 성장의 출처입니다. 데이터독의 매출 성장은 대부분 "새 고객을 잡아서"가 아니라 "잡은 고객이 자라서" 나옵니다. 신규 로고(완전히 새로 들어온 고객)의 기여는 최근 약 4분의 1 수준입니다. Q2 2025 약 20%에서 Q3 2025 약 25%로 올랐습니다 (Tomasz Tunguz). 나머지 대부분은 이미 들어와 있던 고객의 확장에서 나옵니다. NRR이 100%를 한참 넘는 약 120%라는 사실이 같은 이야기의 다른 표현입니다.
⚠️ 한 가지 미리 짚어둘 점이 있습니다. "멀티프로덕트 고객이 더 쓴다"는 사실을 곧장 "플랫폼이 한 고객의 지출을 키운다"는 인과로 읽으면 과장입니다. 동일한 규모의 고객을 통제하고 비교한 것이 아니라, "여러 제품을 묶어 쓸 만큼 큰 조직이 원래 지갑도 크다"는 선택 효과(selection effect)가 섞인 상관에 가깝기 때문입니다. 이 글은 멀티프로덕트 지출 점프를 엔진의 "결과 상관"으로 읽고, 무엇이 그 상관을 지탱하고 무엇이 깎는지를 본문에서 따집니다.
이 글은 네 가지 질문에 답합니다. ① 어떻게 작게 들이는가(단일 파이프라인이라는 입구) ② 어떻게 자라는가(멀티프로덕트 + 사용량 과금) ③ 왜 안 떠나는가(락인의 무게중심이 어디에 있는가) ④ 이 엔진의 청구서는 어떤 양날인가(bill shock). 관통하는 한 가지 물음은 이것입니다.
💡 핵심 질문: 데이터독은 어떻게 고객 한 명을 들여 스스로 자라게 만드는가, 그리고 그 고객은 왜 떠나지 못하는가?
먼저 land-and-expand의 전체 그림을 한 장으로 보겠습니다. 왼쪽의 좁은 입구로 들어온 고객이, 오른쪽으로 갈수록 제품 수와 사용량을 함께 키우는 구조입니다.
개념적 시각화. 채택률 출처: Datadog Q1 2026 콜, SEC 8-K (FY2025)
1. Land: 단일 에이전트가 만드는 입구
land-and-expand가 작동하려면 "들어오기"가 쉬워야 합니다. 데이터독의 입구는 단일 에이전트와 단일 데이터 파이프라인입니다. 한 번 수집한 데이터를 26개 제품이 나눠 쓰기 때문에, 새 제품을 켜는 마찰이 거의 없습니다. 이 마찰 제로의 입구가 플라이휠의 첫 바퀴를 돌립니다. 이번 장에서는 그 입구가 기술적으로 어떻게 생겼는지, 왜 그것이 80%대 매출총이익률로까지 이어지는지를 봅니다.
1.1 한 번 수집해 26개 제품이 나눠 쓰는 단일 파이프라인
데이터독의 기술 구조에서 가장 중요한 단어 하나를 고르라면 "단일(unified)"입니다. 호스트(서버)마다 단일 Datadog Agent 하나가 깔립니다. Go 언어로 작성되고 일부는 eBPF(리눅스 커널 수준에서 시스템을 관측하는 기술)를 씁니다. 이 에이전트 하나가 메트릭, 트레이스, 로그, 보안 신호, 사용자 경험(RUM, Real User Monitoring) 데이터를 같은 파이프라인으로 수집합니다.
파이프라인은 세 단계로 흐릅니다. 수집(collector) → 집계(aggregator) → 전달(forwarder)입니다. 핵심은 메트릭이든 트레이스든 로그든 같은 스키마로 한 경로에 적재된다는 점입니다. 여기서 "한 경로"라는 표현이 land-and-expand의 기술적 뿌리입니다.
💡 핵심: 집에 계량기를 하나만 달아두면 수도, 전기, 가스를 한 회사에서 받을 수 있는 구조입니다. 새 서비스를 추가할 때 배선을 새로 깔 필요가 없습니다. 데이터독도 마찬가지로, 한 번 흐르기 시작한 데이터 위에 제품을 켜기만 하면 됩니다.
이게 실제로 무슨 뜻일까요. 어떤 고객이 처음에는 인프라 모니터링만 쓰고 있었다고 합시다. 어느 날 로그 관리나 APM을 켜고 싶어집니다. 보통의 도구 조합이라면 새 수집기를 설치하고, 데이터를 다시 보내도록 설정하고, 태그 체계를 맞추는 작업이 필요합니다. 데이터독에서는 이 과정이 사라집니다. 에이전트를 새로 설치할 필요도, 데이터를 다시 보낼 필요도 없습니다. 이미 흐르고 있는 데이터에 제품을 켜기만 하면 됩니다. 이 마찰 제거가 "작게 들여 쉽게 늘리는" Land의 기술적 토대입니다.
규모를 숫자로 보면 이렇습니다. 데이터독은 공식적으로 60개 이상의 제품 모듈을 제공하고(8개 대분류 + AI), 분기 실적 기준으로는 약 26개 제품으로 집계됩니다. 외부 도구와의 통합(integrations)은 600개가 넘습니다 (Datadog 제품 페이지). 더 인상적인 것은 인수 흡수 방식입니다. 데이터독은 15건의 인수를 별도 제품군으로 따로 떼어두지 않고, 전부 같은 파이프라인에 합류시켜 흡수했습니다 (Tracxn). 인수한 제품도 같은 입구를 통해 들어온다는 뜻입니다.
같은 구조를 오픈소스 조합으로 만들면 어떻게 다른지 비교해 보겠습니다.
개념적 시각화. 출처: Datadog 제품 문서
1.2 자동 상관관계: 설정 없이 신호를 잇는 입구
단일 파이프라인이 입구의 절반이라면, 나머지 절반은 "자동 상관관계"입니다. 데이터독 에이전트는 컨테이너의 환경변수를 자동으로 감지해서, 데이터가 호스트를 떠나기 전에 env, service, version 같은 표준 태그를 붙입니다. 이걸 Unified Service Tagging이라고 부르고, 여기서 쓰는 표준 태그 규약을 semantic conventions라 합니다. 결과적으로 APM 플레임그래프, 인프라 메트릭, 로그가 별도 설정 없이 서로 자동으로 연결됩니다 (Datadog 문서).
이게 왜 중요한지는 장애가 터진 순간을 떠올리면 분명합니다. 새벽 3시에 서비스가 느려졌습니다. 엔지니어는 CPU 스파이크가 진짜 원인인지, APM의 p99 지연(가장 느린 1% 요청의 응답 시간)과 어떻게 맞물리는지를 즉시 봐야 합니다. 이 순간을 줄이는 능력이 MTTR(평균 복구 시간) 단축이고, 운영팀이 가장 중요하게 여기는 지표입니다. 데이터독에서는 태그가 이미 맞춰져 있으니 설정 없이 바로 두 신호를 겹쳐 볼 수 있습니다. 오픈소스 조합 스택은 도구마다 태그 스키마를 수동으로 맞춰야 해서, 바로 이 순간에 연결 공백이 생깁니다.
정리하면 자동 상관관계는 운영 부담과 총소유비용(TCO, Total Cost of Ownership)을 낮추는 강력한 입구입니다. 그리고 이 마찰 제로의 입구가 land-and-expand 플라이휠의 첫 바퀴를 돌립니다. 이 입구로 들어온 고객이 어떻게 자라는지는 2장에서, 무엇이 그 고객을 붙들고 어디서 깎이는지는 3장에서 다룹니다.
1.3 매출총이익률 80%의 기술 원천
land-and-expand 엔진의 효율은 결국 마진으로 드러납니다. 데이터독의 매출총이익률(GM, Gross Margin)은 회계 마법이 아니라 단일 파이프라인 구조의 직접적인 산물입니다. 제품을 추가해도 데이터를 다시 수집하지 않으므로, 제품 하나를 켤 때 드는 한계 인프라 비용이 낮기 때문입니다.
먼저 숫자부터 봅니다. GAAP 기준 매출총이익률은 수년째 80% 부근에서 안정적입니다.
출처: StockAnalysis (https://stockanalysis.com/stocks/ddog/financials/). GAAP 연간 확정치.
기술적 인과는 이렇습니다. 매출원가(COGS, Cost of Goods Sold)의 대부분은 클라우드 호스팅 비용입니다. 데이터독은 단일 파이프라인이라 한 번 수집한 데이터를 26개 제품이 재사용하므로, 제품을 켤 때 데이터를 중복 수집하지 않습니다. 새 제품의 한계 인프라 비용이 낮은 이유가 여기 있습니다 (Datadog 제품 문서).
데이터독은 이 마진을 지키는 장치도 갖췄습니다. BYOC(Bring Your Own Cloud) Log Management와 Observability Pipelines는 고객이 자기 스토리지와 태그 카디널리티(태그 값의 가짓수)를 직접 제어하게 해, 인입 비용 일부를 고객에게 이전합니다. Observability Pipelines는 Timber Technologies 인수로 확보한 Vector 기반 기술입니다 (Datadog 블로그).
⚠️ 한 가지 한계: 매출총이익률 80%는 순수 소프트웨어 SaaS(85% 이상)보다는 낮습니다. 호스팅 비용이 매출에 연동되는 인프라 무거운 사업 특성 때문입니다. 천장은 약 80~82%로 봅니다. BYOC와 Pipelines가 이 천장을 방어할 뿐, 크게 끌어올리지는 못합니다.
1장 결론: 데이터독의 입구는 단일 에이전트와 단일 파이프라인입니다. 한 번 수집한 데이터를 26개 제품이 나눠 쓰기에 새 제품을 켜는 마찰이 거의 없고, 자동 상관관계가 운영 부담을 낮춥니다. 이 구조가 80%대 매출총이익률의 기술 원천이며, land-and-expand 플라이휠의 첫 바퀴를 돌립니다.
2. Expand: 한 고객이 어떻게 몇 배로 자라는가
입구로 들어온 고객은 두 축으로 자랍니다. 제품 수가 늘고(멀티프로덕트), 같은 제품의 사용량이 늘어납니다(사용량 과금). 두 축이 곱해진 결과가 NRR 약 120%, 즉 같은 고객이 1년 만에 20% 더 쓰는 구조입니다. 이번 장에서는 이 두 축을 시계열로 확인하고, 왜 데이터독의 확장이 보통의 SaaS와 다른지를 봅니다.
2.1 제품 수가 늘어나는 시계열
멀티프로덕트 채택률이 모든 구간에서 매년 오르고 있습니다. 아래는 1년 전 대비 Q1 2026 수치입니다.
출처: SEC 8-K (FY2025), AlphaSpread Q1 2026. 회색=1년 전, 보라=현재.
핵심은 "전 구간 동시 우상향"입니다. 단순히 평균이 오르는 게 아닙니다. 깊은 채택을 보여주는 8개 이상 구간이 1년 전 13%에서 20%로 약 7%p 올랐다는 점이 중요합니다. 고객이 점점 더 깊이 들어옵니다. 가장 깊은 10개 이상 구간도 1년 전 6%에서 9%로 올랐습니다.
"land-and-expand는 모든 SaaS의 공통 서사 아닌가?"라고 물을 수 있습니다. 맞습니다. 다만 대부분의 SaaS는 좌석(seat) 기반 확장이라 사용 인원이 늘어야 매출이 늘어납니다. 데이터독은 제품 수 확장과 사용량 확장이 곱해지는 구조라 확장 천장이 다릅니다. 8개 이상 제품 채택률이 두 자릿수로 빠르게 오르는 SaaS는 드뭅니다.
2.2 멀티프로덕트 고객은 훨씬 더 쓰고, 성장은 기존 고객에서 나온다
데이터독이 말하는 3 Core Pillars는 인프라 모니터링, 로그 관리, APM/디지털경험 세 가지입니다. 이 3종을 함께 쓰는 멀티프로덕트 고객은 단일 제품 고객보다 지출 규모가 단연 큽니다.
⚠️ 참고: 흔히 인용되는 "15배" 같은 구체적인 배수는 회사가 공개한 1차 수치가 아니라 2차 분석의 추정값입니다. 그래서 이 글은 단정하지 않고 방향만 씁니다. 멀티프로덕트일수록 크게 더 지출한다, 여기까지입니다 (SaaStr).
그 결과 성장의 대부분이 기존 고객 확장에서 나옵니다. 신규 로고 기여가 최근 약 4분의 1 수준이고(Q2 2025 약 20% → Q3 2025 약 25%), 나머지 대부분이 기존 고객 확장입니다 (Tomasz Tunguz). NRR이 100%를 크게 넘는 약 120%라는 것이 같은 사실의 다른 표현입니다.
여기서 두 가지를 정직하게 짚어야 합니다. 첫째, "멀티프로덕트 고객이 더 쓴다"를 "플랫폼이 한 고객의 지출을 키운다"는 인과로 읽으면 과장입니다. 동일 규모 고객을 통제한 비교가 아니라 선택 효과가 섞인 상관에 가깝습니다. 둘째, "성장의 대부분이 기존 고객"이라는 사실은 강점이자 동시에 의존이기도 합니다. 만약 신규 로고 기여율이 다시 둔화하면(지금은 상승 추세), 확장 여력이 한정된 기존 고객 풀에 성장이 묶이는 포화 위험이 됩니다. 이 양면은 5.2 멈춤 신호에서 추적합니다.
고객 품질 지표도 같은 방향을 가리킵니다. 연 $100K 이상 ARR(연간 반복 매출) 고객이 약 4,550개로 1년 만에 21% 늘었고 (GlobeNewswire Q1 2026), 이들이 전체 ARR의 약 90%를 차지합니다. 연 $1M 이상 ARR 고객은 FY2025에 603개로 늘었습니다(FY2024 462개) (Datadog FY2025 결산).
추상적인 숫자를 사례로 체감해 보겠습니다. 유럽의 대형 통신사가 11개 제품을 포함한 7자리 규모(연 $1M 이상)로 최대 랜딜을 체결했고, 한 핀테크 대형 고객은 14개 제품에 연 $10M 이상을 지출합니다. 한 고객이 14개 제품을 동시에 쓴다는 것은, 데이터독이 그 조직의 운영 전반에 깔려 있다는 뜻입니다.
2.3 사용량 기반 과금: 고객의 클라우드가 자라면 매출도 자란다
데이터독 과금의 핵심은 좌석이 아니라 사용량입니다. 호스트 수, 로그 GB, 스팬(span, 분산 트레이스의 한 구간) 수로 청구하므로, 고객의 클라우드가 커지면 영업 없이도 매출이 자동으로 따라 올라갑니다. 이것이 NRR 플라이휠의 동력입니다.
규모를 체감하기 위해 과금 단위를 봅니다. 인프라 모니터링은 호스트당 월 $15, APM은 호스트당 월 $31, 로그 수집은 GB당 $0.10, 로그 인덱싱(15일 보존)은 100만 이벤트당 $1.70, 데이터베이스 모니터링은 DB 호스트당 월 $70입니다 (SigNoz). 제품마다 별도 미터가 동시에 돌아가는 "유틸리티 요금제" 구조입니다.
자동 연동의 메커니즘은 단순합니다. 인프라 호스트 수는 클라우드 서버 수에, 로그 GB는 애플리케이션 로그 볼륨에, APM 호스트 수는 애플리케이션 서버 수에 비례합니다. 고객이 클라우드 워크로드를 늘리면 데이터독 과금이 자동으로 늘어납니다. 데이터독 CEO 올리비에 포멜(Olivier Pomel)은 이를 한 문장으로 정리했습니다. "우리는 합의한 가격으로 고객이 매달 사용한 만큼 청구합니다."
⚠️ 정밀 포인트: 호스트 카운팅은 최대 부하 순간이 아니라, 매시간 측정한 뒤 상위 1% 시간을 제거한 99번째 백분위(high-water mark) 기준으로 청구합니다 (Datadog 과금 문서). 일시적인 스파이크 하나로 과청구되지 않게 하는 장치입니다.
거시 배경도 사용량 과금에 순풍입니다. 하이퍼스케일러(대형 클라우드 사업자) 4사의 2026년 CapEx(설비투자) 합계가 약 $725B로 전년 대비 약 77% 증가할 전망입니다(2026E 가이던스 합산 기준, Tom's Hardware). 고객들의 클라우드 지출 자체가 커지는 방향이 데이터독에는 순풍입니다.
개념적 시각화. 출처: SigNoz, Tom's Hardware
2.4 NRR 약 120%: 이 엔진의 종합 성적표
이제 두 축의 결과물을 한 지표로 모읍니다. NRR은 1년 전 동일 고객 코호트가 지금 얼마나 더 쓰는지를 봅니다. 데이터독은 정확한 단일 수치 대신 밴드("about 120%" 등)로 공시합니다 (Datadog IR).
시계열로 보면 NRR은 평탄하지 않았습니다.
출처: Software Stack Investing, AlphaSpread Q1 2026. GRR은 같은 기간 mid-high 90s 안정.
여기서 함께 봐야 할 짝지표가 GRR(총수익유지율, Gross Revenue Retention)입니다. GRR은 확장을 빼고 이탈만 본 유지율로, 고객 유지의 바닥을 보여줍니다. 데이터독의 GRR은 수 분기째 "mid- to high 90s%"로 안정적입니다. NRR 약 120%와 GRR 90s%의 간극(약 25~30%p)이 곧 "기존 고객 확장분"입니다.
💡 핵심: GRR이 mid-high 90s라는 건 한번 들어온 고객이 거의 안 빠진다는 뜻이고, NRR 약 120%라는 건 남은 고객이 매년 20%씩 더 쓴다는 뜻입니다. Land(거의 안 빠짐)와 Expand(20% 더 씀)가 동시에 작동하는 직접 증거입니다.
2장 결론: 고객은 제품 수와 사용량 두 축으로 자랍니다. 4+/6+/8+ 채택률은 전 구간 매년 우상향하고, 사용량 과금이 고객 클라우드 성장에 매출을 자동 연동시킵니다. 두 축이 곱해진 결과가 NRR 약 120%이며, GRR mid-high 90s가 그 바닥을 받칩니다.
3. Lock-in: 무엇이 정확히 남는가
자란 고객은 왜 떠나지 못할까요. 흔한 답은 "데이터가 쌓여서"입니다. 그런데 이 글의 결론은 다릅니다. 고객을 붙드는 잔존 전환 마찰의 본체는 두 가지입니다. 운영팀이 손에 익힌 멀티프로덕트 교차 워크플로우(재훈련, 런북 재작성)와 600통합 재연결 공수입니다. "쌓인 데이터"가 아닙니다. 과거의 핵심이던 계측 락인은 OTel 표준화가 풀고 있고, 대시보드와 알림 설정조차 코드로 관리돼 자동 이전이 가능해졌기 때문입니다. 이번 장은 무엇이 깎이고 무엇이 남는지를 정확히 좁힙니다.
3.1 전통적 전환비용: 계측 락인
과거 전환비용의 핵심은 계측 락인이었습니다. 데이터독을 쓰려면 애플리케이션에 데이터독 전용 SDK를 심어 계측해야 했고, 다른 벤더로 갈아타려면 전부 다시 계측해야 했습니다. 이 재계측 비용이 고객을 묶었습니다.
비유하면 이렇습니다. 집 안 배관을 특정 수도 회사 전용 규격으로 깔아두면, 다른 회사로 갈아탈 때 배관을 전부 뜯어야 합니다. 계측 락인이 바로 이 "전용 규격 배관"이었습니다.
3.2 OTel이 푸는 것, 그리고 쌓인 데이터마저 깎이는 이유
OpenTelemetry(OTel)는 벤더에 종속되지 않는 공개 계측 표준입니다. 쉽게 말해 모니터링 데이터를 모으는 방식을 업계가 함께 정한 공통 규격입니다. 애플리케이션을 OTel로 한 번 계측하면 어느 백엔드로든 데이터를 보낼 수 있어, 재계측 비용(전환비용의 전통적 핵심)이 사라집니다. 즉 계측 락인은 풀립니다.
여기서 한 걸음 더 정직해질 필요가 있습니다. 흔히 "데이터가 쌓여서 못 떠난다"(데이터중력)를 해자의 본체로 내세우지만, 그것도 깎이는 중입니다. 대시보드, 알림 규칙, SLO(서비스 수준 목표) 정의는 점점 코드(JSON, Terraform 등 config-as-code, 즉 설정을 코드로 관리하는 방식)로 다뤄집니다. 이런 설정은 본질적으로 이식 가능하고, AI 에이전트가 벤더 간 포맷을 번역하는 자동 마이그레이션이 빠르게 좋아지고 있습니다. 산업 표준 로그 포맷과 메트릭은 외부 도구가 복제하기 쉽다는 분석도 같은 방향입니다. 즉 "쌓인 설정"이라는 전환비용도 깎이는 중이라, 이 글은 데이터중력을 1차 해자에서 내려 "약화 중인 보조 락인"으로 다룹니다.
⚠️ 정직한 한계: 잔존 마찰을 코호트로 정량화하려면 "제품을 많이 쓰는 고객일수록 덜 이탈하는가"를 보여주는 멀티프로덕트 코호트별 GRR이 필요합니다. 그런데 데이터독은 가입 연도나 제품 수 기준 코호트의 확장·유지 배수를 공개하지 않습니다. 우리가 가진 직접 증거는 전사 GRR mid-high 90s(이탈이 매우 낮음)와 멀티프로덕트 채택률의 전 구간 우상향뿐입니다. 이 둘은 "락인이 작동한다"는 정황 증거이지, "제품 수가 락인을 강화한다"는 인과 증거는 아닙니다. 이 한계를 숨기지 않고 5.2 와치리스트에 코호트 단가·병행사용을 추적 지표로 둡니다.
정확한 결론은 이렇습니다. OTel과 자동 마이그레이션은 신규 고객의 진입 협상력을 키우고 기존 고객의 이탈 장벽도 낮춥니다. 그럼에도 이미 깊이 들어온 멀티프로덕트 고객의 즉각적인 이탈을 직접 일으키지는 못합니다. 배관 규격이 표준화돼도, 운영팀이 손에 익힌 절차를 새 회사 방식으로 다시 익히는 재훈련 비용은 시간이 걸리기 때문입니다. 우리의 표현은 "벽에 영구 매설"이 아니라 "깎여 가지만 아직 남아 있는 마찰"입니다.
OTel이 진짜 위협 아니냐는 반문이 자연스럽게 나옵니다. OTel의 위협 정량(신규 고객 선계측 비율, 가격 결정력 압박, 반증 조건)과 Grafana, Dynatrace, CloudWatch와의 정면 경쟁 구도는 별도 편에서 정밀하게 다룹니다. 이 글은 "계측 락인이 풀리고 설정 이전마저 자동화되는 가운데, 정확히 어떤 운영 마찰이 얼마나 남는가"를 좁히는 데 집중합니다.
락인의 무게중심이 어떻게 이동하고 마모되는지를 한 장으로 보겠습니다.
개념적 시각화. OTel = 벤더 비종속 공개 계측 표준. 출처: Datadog 기술 문서·OpenTelemetry 표준.
3.3 남는 마찰의 본체: 운영 워크플로우 + 600통합
남는 마찰을 둘로 좁히면 이렇습니다.
첫 번째 잔존 마찰은 운영 워크플로우입니다. 데이터독은 "Single Pane of Glass"라 불리는 단일 UI에서 인시던트 탐지, 조사, 대응을 한 워크플로우에 묶습니다. 설정 파일은 자동 번역돼도, 운영팀이 손에 익힌 절차와 런북(장애 대응 매뉴얼)은 새 도구 방식으로 다시 익혀야 합니다. 이 재훈련 비용이 즉각적인 이탈을 늦추는 가장 실질적인 마찰입니다. 새벽 3시에 장애가 터졌을 때 손이 먼저 움직이는 그 도구를 바꾸는 데는 시간이 걸립니다.
두 번째 잔존 마찰은 통합 재연결입니다. 600개가 넘는 통합은 고객의 기존 도구 생태계(클라우드, 데이터베이스, 메시지큐, CI/CD 등)에 이미 연결돼 있습니다. 새 백엔드로 옮기면 이 연결을 동일하게 다시 깔아야 하고, 경쟁 백엔드가 같은 폭(breadth)을 재현하는 데도 시간이 걸립니다.
보조 락인인 데이터중력은 어떨까요. 과거 데이터, 대시보드, 알림이 쌓여 있다는 점도 마찰이지만, 3.2에서 보았듯 config-as-code와 자동 마이그레이션이 이 레이어를 깎고 있어 해자 본체가 아니라 "약화 중인 보조 락인"으로만 셉니다.
🔭 와치리스트(해자 근거 아님): 데이터독은 자체 시계열 기초모델 Toto를 자사 텔레메트리 데이터로 학습시켜 이상 탐지 엔진 Watchdog에 적용합니다. 데이터가 쌓일수록 모델이 좋아지는 데이터 플라이휠 "후보"이지만, Toto가 경쟁 대비 실제로 더 나은 정확도를 내고 그것이 이탈을 막는다는 정량 증거(모델 성능 지표, 코호트 효과)는 공개되지 않았습니다. 따라서 이 글은 AI 플라이휠을 해자 근거에서 빼고, 5.2 와치리스트에 "검증되면 해자로 승격할 후보"로만 둡니다.
3장 결론: 잔존 락인의 본체는 운영 워크플로우 재훈련과 600통합 재연결 둘입니다. 계측 락인은 OTel이, 설정 락인은 자동 마이그레이션이 깎는 중이라, 데이터중력은 1차 해자가 아니라 약화 중인 보조 락인입니다. 남는 두 마찰조차 자동화로 좁아지는 "시한이 있는 마찰"입니다.
4. Bill shock: 같은 엔진의 뒷면
사용량 과금은 NRR 플라이휠의 동력인 동시에 청구서 쇼크의 원인입니다. 고객 클라우드가 자라면 자동으로 청구가 오르는 바로 그 구조가, 고객이 비용을 절감하면 자동으로 매출을 깎습니다. 2023년 클라우드 최적화기가 이 양날을 실증했습니다. 이번 장은 엔진의 뒷면을 봅니다.
4.1 검침의 충격
규모를 체감하기 위한 사례부터 봅니다. 엔지니어 50명, 호스트 200개 규모의 중규모 기업이 데이터독에 연간 약 $220,000을 지출하는 사례가 보고됩니다 (OneUptime, SigNoz). 비용이 비선형으로 튀는 핵심은 과금 레이어가 겹겹이 누적되기 때문입니다. 호스트당 요금 + GB 수집 + GB 인덱싱 + 메트릭당 비용 + 보존 프리미엄이 한꺼번에 쌓입니다.
특히 청구를 빠르게 키우는 대표 항목이 custom metrics입니다. 카디널리티(태그 값의 가짓수)가 폭증하면 청구가 급격히 늘어납니다. 사용자 ID나 요청 ID처럼 값의 종류가 무한히 많은 태그를 메트릭에 붙이면, 데이터독이 추적해야 할 시계열의 수가 폭발하기 때문입니다.
비유: 여름에 에어컨을 많이 돌리면 다음 달 검침서가 충격적으로 나오는 것과 같습니다. 쓴 만큼 정직하게 청구되는 구조의 그림자입니다. 청구가 뛰는 항목은 custom metrics, 인덱싱된 스팬(APM 추적 저장), 데이터 보존 기간 연장, 스팬 수집량 초과 등입니다.
4.2 양날: 2023년이 보여준 것
같은 사용량 과금이 양 방향으로 작동합니다. 고객이 클라우드를 키우면 매출이 자동으로 오르지만(상승 양날), 고객이 비용을 절감하면 매출이 자동으로 깎입니다(하강 양날). 고객이 줄이는 방법은 로그 보존 기간 단축, 샘플링율 조정, 모니터링 범위 축소 등입니다.
실증 사례가 2022~2023년 클라우드 최적화기입니다. 2022년 후반부터 고객들이 클라우드 지출을 최적화하기 시작했고, NRR이 130%대에서 내려와 Q3 2023에 120% 아래까지 떨어졌습니다 (Software Stack Investing). 사용량 과금이라 고객의 절감이 즉각 매출에 반영됐습니다.
"NRR 약 120%가 좋아 보여도 한번 130%에서 무너지지 않았느냐"는 지적은 정당합니다. 맞습니다. 그래서 이 엔진은 무적이 아닙니다. 다만 그 하강기에도 GRR은 mid-high 90s를 유지했습니다. 고객이 "덜 쓴" 것이지 "떠난" 것이 아니었다는 뜻입니다. 그리고 2024년 말부터 회복해 Q1 2026에 low 120%로 돌아왔습니다. 이 위험의 무게중심은 이탈이 아니라 사용량 변동에 있습니다.
고객이 덜 쓴 것이지 떠난 것이 아니었다. GRR이 그 증거다.
출처: Software Stack Investing, AlphaSpread
다만 이 하락을 "클라우드 최적화라는 경기적 일시 변동"으로만 읽는 것은 한쪽만 보는 것입니다. 회복 후 NRR이 과거 정점인 130%+가 아니라 약 120%에서 멈춘 점은, 순수 경기 반등이라면 더 올라갔어야 한다는 점에서 구조적(secular) 재설정 가능성도 함께 시사합니다. OTel과 자동 마이그레이션이 신규 가격 결정력을 누르거나, 하이퍼스케일러 번들이 저가 세그먼트를 잠식하는 흐름이 NRR의 새 천장을 구조적으로 낮출 수 있기 때문입니다. 즉 경기적 요인과 구조적 요인이 혼재할 수 있으며, 둘을 가르는 것은 단일 NRR 수치가 아니라 구분 지표(신규 로고 기여율, OTel 선계측 신규 워크로드 비중, 멀티프로덕트 코호트 단가)입니다. 이 구분 지표를 5.2에서 추적합니다.
4.3 데이터독의 응답: 고객에게 검침 통제권을 준다
데이터독의 대응은 청구를 숨기는 게 아니라 고객이 직접 통제하게 하는 방향입니다. Observability Pipelines(Vector 기반)는 불필요한 메트릭 제거, 태그 카디널리티 제한, 인입 비용 제어 기능을 단일 장소에서 제공합니다. BYOC Log Management는 고객이 자기 스토리지에 로그를 저장해 비용을 절감하는 옵션입니다 (Datadog 블로그).
효과는 양면입니다. 이 도구들은 고객 이탈(청구서 쇼크로 떠나는 것)을 막는 안전판이자, 동시에 인입 비용을 고객에게 이전해 매출총이익률을 방어하는 장치입니다(1.3과 연결됩니다). 다만 고객이 청구를 스스로 줄일 수 있게 되면 단기 평균 단가(ASP, Average Selling Price)에는 하방 압력이 될 수 있습니다.
4장 결론: 사용량 과금은 양날입니다. 고객 클라우드가 자라면 매출이 자동으로 오르고, 절감하면 자동으로 깎입니다. 2023년 NRR 하강(130%+ → 120% 미만)이 이를 실증했지만 GRR은 90s를 유지했습니다. 위험의 무게중심은 이탈이 아니라 사용량 변동이며, 경기적인지 구조적인지는 구분 지표로 가립니다.
5. 이 엔진을 어떻게 읽을 것인가
land-and-expand 엔진은 현재 돌고 있습니다. 채택률은 전 구간 우상향, NRR은 회복, 고액 고객은 증가 중입니다. 다만 무적은 아니며, 멈춤 신호는 측정 가능합니다. 그리고 자주 나오는 "GAAP 적자" 오해는 이 엔진의 기술 한계가 아니라 별개의 보상 구조 이슈입니다. 이번 장은 투자자가 이 엔진을 어떻게 읽어야 하는지를 정리합니다.
5.1 엔진이 돌고 있다는 증거
지금까지의 데이터를 모으면 엔진이 돌고 있다는 증거는 네 가지입니다.
마지막 항목이 중요합니다. 출시 속도가 엔진을 넓힙니다. 데이터독은 보안, 디지털경험, 데이터 관측 같은 인접 시장을 신규 카테고리로 흡수해 진출 가능 시장(SAM)을 스스로 키웁니다. 이는 점유율을 "고객 수"가 아니라 "고객 지갑 점유율(wallet share)"로 키우는 land-and-expand의 본질과 정확히 일치합니다.
5.2 무엇이 멈춤 신호인가
이 엔진이 약해지는지는 측정할 수 있습니다. 후행 신호와 선행·구분 신호로 나눠 임계값을 명시합니다.
선행·구분 신호는 NRR이 무너지기 전에, 그리고 그 하락이 경기적인지 구조적인지를 가르기 위해 봅니다.
| 선행·구분 신호 | 무엇을 보는가 | 켜지면 의미 |
|---|---|---|
| 신규 로고 기여율 추세 | 연간 ARR 성장 중 신규 고객 비중 (현재 약 25%, Q2 20%→Q3 25% 상승) | 추세적으로 둔화하면 기존 고객 확장 의존이 포화로 향함 |
| OTel 선계측 신규 워크로드 비중 | 신규 워크로드를 데이터독 전용이 아니라 OTel로 선계측하는 비율 | 높아지면 진입 협상력·잔존 마찰이 구조적으로 깎임 (secular) |
| 멀티프로덕트 코호트 단가(ASP) | 제품을 많이 쓰는 코호트의 호스트당 단가 | 하락하면 번들 프리미엄이 가격 압박에 밀림 |
| side-by-side 병행사용 | 고객이 경쟁 백엔드를 병행 도입해 나란히 쓰기 시작 | 워크플로우 락인이 풀리며 이탈을 준비하는 선행 징후 |
| 8개 이상 채택률 상승세 | 가장 깊은 채택 구간의 증가 속도 | 정체되면 확장 깊이가 한계에 닿음 (보조) |
후행 신호가 켜지기 전에 보는 조기 경보. 출처: Datadog IR, 실적 콜 종합
이 신호들이 "왜" 켜질 수 있는지(OTel 표준화가 신규 가격 결정력을 누르거나, 하이퍼스케일러 번들이 저가 세그먼트를 잠식하거나)의 정밀한 인과와 정량은 AI 양날 편에서 다룹니다. 다만 경기적 요인과 구조적 요인을 가르는 최소한의 구분 지표는 이 글이 직접 책임지고 추적합니다. 그리고 3.3의 Toto AI 플라이휠은 "검증되면 해자로 승격할 후보"로 이 와치리스트에 둡니다. 모델 성능 지표와 코호트 효과가 공개되면 재평가합니다.
5.3 GAAP 적자라는 오해
자주 나오는 오해가 "데이터독은 아직 GAAP 적자니 비즈니스 모델이 덜 익었다"입니다. 사실은 다릅니다. land-and-expand 엔진의 효율은 GAAP 손익이 아니라 매출총이익률과 현금창출력에서 드러납니다.
수치로 보겠습니다. GAAP 영업이익률은 FY2025 약 -1.3%로 손익분기 부근입니다. 그런데 같은 해 Non-GAAP 영업이익률은 22%, 회사가 공식적으로 쓰는 FCF(잉여현금흐름) 마진은 26.7%입니다(Q1 2026에는 28.7%). GAAP과 Non-GAAP의 간극 대부분은 주식보상비용(SBC)이며, 매출의 약 21%에 달합니다. 이는 단일 플랫폼 효율의 한계가 아니라 보상 구조 이슈입니다.
읽는 법은 이렇습니다. land-and-expand 엔진의 효율은 매출총이익률 80%, Non-GAAP 영업이익률 22%, FCF 마진 26.7%로 드러나고, GAAP 희석(SBC와 희석 주식 수)은 별개로 봅니다. 성장률과 FCF 마진을 더한 Rule of 40은 FY2025에 54.4, Q1 2026에 60.9로, 우량 SaaS 기준선인 40을 크게 넘습니다.
💡 한 문장 종합: 이 land-and-expand 엔진의 해자는 "land(거의 안 빠짐, GRR mid-high 90s)와 expand(매년 약 20% 더 씀, NRR 약 120%)가 사용량 과금으로 동시에 작동한다"는 점만큼 세고, "계측 락인을 푸는 OTel과 설정·데이터 이전을 자동화하는 마이그레이션"에서 깎입니다. 엔진 효율은 매출총이익률 80%와 FCF 마진 26.7%로 드러나고, 멈춤은 NRR·GRR·OTel 선계측 비중으로 측정됩니다.
5장 결론: 엔진은 현재 돌고 있습니다. 채택률 전 구간 우상향, NRR 회복, 고액 고객 증가가 그 증거입니다. 다만 NRR·GRR 임계와 OTel 선계측 비중 같은 멈춤 신호는 측정 가능하며, GAAP 적자는 엔진의 한계가 아니라 SBC라는 보상 구조 이슈입니다.
- 입구: 단일 에이전트·단일 파이프라인이 한 번 수집한 데이터를 26개 제품이 재사용. 마찰 제로의 land
- 확장: 멀티프로덕트(4+ 56%, 6+ 35%, 8+ 20% 전 구간 우상향) × 사용량 과금이 곱해져 NRR 약 120%
- 유지: 거의 안 빠짐(GRR mid-high 90s). 그 바닥이 NRR을 받친다
- 깎이는 곳: 계측 락인은 OTel이, 설정 락인은 자동 마이그레이션이 깎는 중. 남는 본체는 운영 워크플로우 재훈련 + 600통합 재연결, 그조차 시한이 있는 마찰
- 양날: 사용량 과금은 NRR 플라이휠이자 청구서 쇼크. 2023년 NRR 130%+→120% 미만 하강이 실증(GRR은 90s 유지)
- 엔진 효율: 매출총이익률 80%, Non-GAAP 영업이익률 22%, FCF 마진 26.7%. GAAP 적자는 SBC 이슈일 뿐