데이터독과 AI의 양날: 관측가능성은 위협받는가, 더 커지는가 | Datadog 상세 분석

핵심 요약

데이터독에게 AI는 양날의 검입니다. AI 워크로드는 관측 데이터를 폭증시켜 사용량 기반 매출을 키우고(LLM 관측 고객이 6개월 만에 10배), 동시에 OpenTelemetry 표준과 하이퍼스케일러 번들이 가격결정력을 압박합니다. 핵심은 데이터독 요금이 사람 수가 아니라 데이터량에 매겨진다는 점이며, 그래서 진짜 위협은 "사람을 줄이는" 쪽이 아니라 "데이터량을 줄이는" 쪽(OTel 표준화, 청구서 쇼크, 지능형 데이터 파이프라인)으로 수렴합니다.

데이터독은 AI 시대에 위협받을까요, 수혜를 받을까요. 답을 먼저 말하면, 데이터독에게 AI는 양날의 검입니다. AI 워크로드는 비결정적이고 복잡해서 관측해야 할 데이터를 폭증시키는데, 데이터독의 요금은 사람 머릿수가 아니라 데이터량에 매겨집니다. 그래서 한쪽 날은 분명한 기회입니다. 그러나 다른 쪽 날에는 OpenTelemetry라는 오픈소스 표준과 하이퍼스케일러의 공짜 번들이 가격결정력을 갉아먹는 위협이 있습니다. 이 글은 그 양날을 관측가능성(observability, 시스템이 지금 어떻게 돌아가는지를 데이터로 들여다보는 일)의 기술적 인과로 분해합니다.

💡 이 글은 데이터독을 중심에 두되, AI 시대 관측가능성의 지형(위협 4종과 경쟁 4진영)도 함께 짚습니다. 다루는 것은 AI가 관측 수요를 키우는 기술적 인과와 위협 4종의 현실성·반증조건입니다. 주가가 어떻게 반응하는지나 점유율 숫자 단정은 다루지 않습니다. 여기서 자주 나오는 NRR(순매출유지율, 기존 고객이 1년 뒤 얼마나 더 쓰는가)은 형제 글인 플랫폼 해자 딥다이브에서 본격적으로 다루고, 이 글에서는 위협이 NRR에 어떻게 발현되는지의 신호로만 씁니다.

AI는 데이터독을 키우는가, 필요 없게 만드는가

AI를 둘러싼 데이터독 논쟁은 둘로 갈립니다. 한쪽은 "AI가 클라우드를 복잡하게 만들어 관측 수요를 키운다"고 하고, 다른쪽은 "AI가 알아서 고치니 사람이 들여다볼 일이 줄어든다"고 합니다. 둘 다 같은 사실(AI가 시스템을 바꾼다)에서 출발해 정반대 결론에 도달합니다. 실제로 모건스탠리는 이를 "복잡성 강풍"이 부는 second-wave 관측 수요의 폭발로 보고, 골드만삭스는 "표준화와 자동화로 가격결정력이 새는 디플레이션의 시작"으로 봅니다(FinancialContent). 같은 회사를 두고 월가의 시각이 이렇게까지 갈리는 일은 드뭅니다.

이 글은 그 양날을 강과 댐의 비유로 풀어봅니다. 관측 데이터는 강물입니다. 데이터독은 강에 세운 수력댐입니다. 결정적으로, 이 댐은 사람이 강을 쳐다보는 데 요금을 매기지 않고, 물이 얼마나 흘러 발전기를 돌리는가에 요금을 매깁니다. AI는 상류에 쏟아지는 폭우입니다. 강물(관측 데이터)을 불립니다. 댐에게는 발전량 증가입니다. 이 과금 구조 하나가 모든 위협의 경중을 다시 계산하게 만듭니다.

💡 핵심: 이 글의 결론을 먼저 말합니다. 네 갈래로 들어오는 위협은 서로 다른 적이 아니라 한 곳을 노립니다. AI의 진짜 위협은 사람을 줄이는 쪽이 아니라 데이터를 줄이는 쪽으로 옵니다.

가장 자주 들리는 위협부터 봅시다. "AI가 사람 대신 시스템을 감시하니 대시보드가 필요 없어진다"는 주장은 직관적이지만 빗나갑니다. 데이터독 요금이 사람 수가 아니라 데이터량에 걸려 있어서, 사람이 화면을 덜 봐도 매출은 직접 줄지 않기 때문입니다. 진짜 위협은 모두 인입되는 데이터량 자체를 깎는 한 벡터로 수렴합니다. OTel 표준화는 협상력으로 단가와 볼륨을 누르고, 청구서 쇼크는 고객이 비용 때문에 볼륨을 자발적으로 줄이게 만들고, 지능형 데이터 파이프라인은 인입량을 자동으로 솎아냅니다. 세 가지가 같은 메커니즘입니다. 다만 이것도 대개 "고객이 떠난다(이탈)"가 아니라 "댐이 받는 통행료가 깎인다(단가와 볼륨 압박)"는 형태로 나타납니다.

용어 하나만 미리 정리해 둡니다. 이 글이 기술적으로 분해하는 위협은 네 갈래(OTel, 하이퍼스케일러, 볼륨 축소, AI 코딩)입니다. 그런데 "진짜 위협 = 데이터량을 깎는 한 벡터"의 구성원은 조금 다릅니다. 네 갈래 중 OTel과 볼륨 축소(지능형 파이프라인)가 이 벡터의 두 축이고, 여기에 네 갈래 분류 밖의 요소인 청구서 쇼크가 같은 방향으로 합류합니다. 하이퍼스케일러와 AI 코딩은 데이터량이 아니라 다른 경로(번들 끼워팔기, 코드 생산량)로 작동해 이 벡터와는 결이 다릅니다.

개념적 시각화. 데이터독 기술 분석 기반.

1장. AI라는 홍수: 왜 데이터 폭증이 곧 수요인가

먼저 기회 측부터 봅니다. AI는 정말 관측 수요를 키울까요. AI는 관측 데이터를 두 가지 방식으로 폭증시킵니다. 직접적으로는 LLM과 에이전트라는 새 관측 차원을 만들고, 간접적으로는 모든 계층의 데이터량을 끌어올립니다. 데이터독 요금이 데이터량에 걸려 있어서, 이 폭증은 거의 그대로 매출로 번역됩니다. 그리고 이 장의 결정적 증거는, AI를 핵심 사업으로 하지 않는 고객의 성장률마저 가속됐다는 사실입니다.

1.1 과금의 비밀: 사람 수가 아니라 데이터량

AI 위협 논쟁의 절반은 이 한 가지 사실 앞에서 무력해집니다. 데이터독은 자리(seat)당 과금이 아니라 호스트, GB, span 같은 데이터량으로 과금합니다. 여기서 span이란 하나의 요청이 시스템을 거쳐 가는 과정의 한 구간을 기록한 추적 단위입니다. 요청 하나가 여러 서비스를 거치면 여러 개의 span이 쌓입니다.

데이터독의 주요 제품은 전부 사용량 단위로 값을 매깁니다. 인프라 모니터링은 호스트당 월 $15, APM(애플리케이션 성능 모니터링)은 호스트당 월 $31, 로그는 수집 GB당 $0.10, LLM 관측은 추적 span 수에 비례해 값을 매깁니다(SigNoz). 규모를 체감하기 위한 가격이며, 핵심은 단위가 전부 "데이터의 양"이라는 점입니다.

왜 이게 중요할까요. "AI가 사람의 운영 업무를 대신하면 관측 도구가 필요 없어진다"는 위협은 자리당 과금 회사에만 성립합니다. 사람이 덜 봐도 시스템이 뿜는 데이터(호스트 수, 로그 GB, 트레이스 span)는 줄지 않습니다. 오히려 AI 시스템은 더 많은 데이터를 뿜습니다.

게다가 사용량 과금은 고객의 클라우드 성장에 매출을 자동으로 연동시킵니다. 고객이 호스트를 늘리고 데이터를 더 흘려보내면, 데이터독은 영업을 더 하지 않아도 매출이 따라 오릅니다. 이 자동 연동이 기존 고객 확장, 즉 NDR(순달러유지율, NRR과 같은 지표)의 동력입니다. NRR 자체의 구조는 형제 글에서 다룹니다.

개념적 시각화. 데이터독 과금 구조 기반.

🔬데이터독 플랫폼 해자: land-and-expand 엔진

사용량 과금과 멀티프로덕트 락인이 NRR을 만드는 구조의 본체

→

1.2 새로운 관측 차원: LLM과 에이전트는 새 강을 판다

AI 애플리케이션은 기존 소프트웨어에 없던 관측 차원을 만듭니다. AI 앱은 비결정적입니다. 같은 입력에 다른 출력이 나오고, 환각이나 프롬프트 인젝션 같은 새 실패 양식이 있으며, 토큰을 얼마나 먹었는지가 곧 비용입니다. 이것은 기존 인프라와 앱 모니터링이 다루던 영역 밖이라, 강에 완전히 새 지류가 생긴 셈입니다.

데이터독은 이 새 지류를 새 제품군으로 흡수했습니다.

제품	출시	무엇을 보는가	현황
LLM Observability	2024 GA	LLM 호출 추적, 비용·지연·품질, 환각·민감정보 탐지	고객 1,000+ (6개월 만에 10배)
AI Agent Monitoring	2025 GA	에이전트 결정 경로 그래프, 툴 호출 추적	OpenAI·Anthropic·LangChain·CrewAI 지원
Bits AI SRE	2025 출시	24/7 자율 인시던트 조사·원인 분석	2,000+ 환경 테스트, Uber Freight 배포
Bits AI Security/Dev	Preview~출시	관측 데이터 기반 보안 조사·코드 수정 제안	확장 중
MCP Server	2026 Q1 GA	Claude Code·Cursor·Codex가 데이터독 데이터 호출	호출량 급증

AI 시대 신규 제품군 (출처: Datadog blog, Q1 2026 어닝콜)

여기서 SRE는 사이트 신뢰성 엔지니어, 즉 시스템이 안정적으로 돌아가게 책임지는 운영 직군을 말합니다. MCP는 AI 코딩 도구가 외부 데이터를 표준 방식으로 불러오는 연결 규약입니다. Claude Code나 Cursor 같은 도구가 데이터독의 관측 데이터를 직접 끌어다 쓸 수 있게 해줍니다.

데이터독의 기술적 차별점은 통합 컨텍스트입니다. 데이터독의 LLM 관측은 LLM span을 APM 트레이스, 인프라 메트릭, 사용자 세션과 같은 화면에서 연결해 보여줍니다. AI 장애가 나면 그 원인이 모델 자체인지, 그 아래 인프라인지, 앞단 앱인지를 한 화면에서 추적합니다. 다만 이 차별점에는 분명한 약점도 있습니다. 전용 스타트업(LangSmith, Arize, Galileo 등) 대비 깊이가 "기존 플랫폼에 기능을 더한 수준"이라는 비판도 있습니다(FinancialContent). 이 통합 대 전용의 대결은 3.3에서 정면으로 다룹니다.

채택 속도는 실측으로도 가파릅니다. 사용량 텔레메트리 기준으로 Q1 2026에 LLM 관측 span은 분기 대비 3배, MCP Server 호출은 4배, 자율 SRE 에이전트의 인시던트 조사는 2025년 12월부터 2026년 3월까지 2배로 늘었습니다.

AI 제품 채택 가속 (분기 대비 배수)

분기 대비

3배

분기 대비

4배

'25.12~'26.3

2배

LLM Obs span

MCP Server 호출

SRE 에이전트 조사

출처: Datadog Q1 2026 보도자료 (GlobeNewswire)

1.3 AI-native 코호트: 폭발과 집중의 양면

AI를 핵심 사업으로 하는 기업(AI-native)이 데이터독 매출에서 차지하는 비중은 가파른 성장의 증거이자, 동시에 한 고객에 쏠린 집중 리스크의 증거이기도 합니다.

이 비중의 궤적부터 봅시다. 2024년 3분기에 약 6%였던 AI-native 매출 비중은 2025년 1분기 8%, 2분기 11%를 거쳐 3분기에 12%로 정점을 찍었습니다. 그리고 그 직후 회사는 비중 공개를 중단했습니다.

AI-native 매출 비중 (달력연도 분기)

약 6%

11%

12% (피크)

Q3 2024

Q1 2025

Q2 2025

Q3 2025

출처: Yahoo Finance, Potential Multibaggers. Q3 2025 12% 피크 이후 비중 공개 중단, 이후는 성장률(high single digits YoY)만 언급

비공개로 돌린 이유 자체가 양면적입니다. 낙관적으로 읽으면 한 부분이 너무 빨리 커져 분기마다 들썩이는 숫자를 더 강조하고 싶지 않은 것이고, 신중하게 읽으면 한 고객에 대한 의존이 너무 커져 그 변동성을 외부에 노출하고 싶지 않은 것입니다. 실제로 최대 단일 고객은 OpenAI로 알려져 있습니다. 다만 그 연환산 반복매출(ARR)을 두고는 제3자 추정치들이 크게 갈리고 회사 공식 공개치가 없으므로, 이 글은 "OpenAI가 최대 고객이고 그 비중 변동성이 크다"는 정성 사실만 씁니다.

이 집중을 받쳐주는 것이 다음 절의 넓은 코호트입니다.

💡 집중을 받치는 것: 데이터독은 AI-native 상위 20개 기업 중 14개를 고객으로 두고 있고, AI 통합 기능을 쓰는 고객은 6,500개를 넘습니다(전체 고객의 약 20%). 단일 고객 의존을 코호트의 넓이로 분산시키는 구조입니다. (출처: alphaspread Q1 2026 어닝콜)

1.4 정합적 신호: AI를 안 쓰는 고객도 가속한다

여기 이 장의 가장 강한 증거가 있습니다. 만약 AI 수혜가 소수 AI-native에만 국한된다면, AI와 무관한 고객의 성장률은 둔화해야 합니다. 그런데 반대로 가속했습니다.

AI를 핵심 사업으로 하지 않는 고객의 매출 성장률 (YoY)

약 19%

약 23%

mid-20%대

Q1 2025

Q4 2025

Q1 2026

출처: Woozle Research(부티크 리서치) 추정치, alphaspread Q1 2026 어닝콜 인용

인과의 핵심은 간단합니다. AI 워크로드가 늘면 그것이 도는 인프라, 로그, 트레이스의 데이터 볼륨이 전부 늘어납니다. "AI 관측 제품"을 따로 사지 않아도, 데이터량 과금이라 core 소비매출이 자동으로 오릅니다. AI는 AI 전용 하위시장만 키우는 게 아니라 강 전체의 수위를 올린다는 그림입니다.

다만 정직하게 대체설명도 병기해야 합니다. 같은 가속을 다르게도 읽을 수 있기 때문입니다. 첫째, 2022년에서 2023년 사이의 클라우드 비용 최적화 역풍이 풀린 기저효과가 있습니다. 이 역풍은 한때 NRR을 130%대에서 mid-110s까지 끌어내렸다가 이후 120%대로 회복시켰습니다(alphaspread). 둘째, 비AI 고객도 여러 제품을 함께 쓰며 지출을 늘리는 멀티프로덕트 효과가 있습니다. 따라서 "AI가 단독으로 강 수위를 올렸다"는 단정보다, "역풍 소멸과 멀티프로덕트 위에 AI 인접 데이터 증가가 더해졌다"가 더 정확합니다. 이 절의 가속은 AI 논거와 정합적인 신호이지, 그것 하나만으로 결정적 증거는 아닙니다.

CEO 올리비에 포멜은 이렇게 표현합니다. "각 계층에서 데이터량이 증가하고 있으며, 이는 AI 기업과 비AI 기업 모두에서 나타나는 동일한 추세입니다"(alphaspread 인용). 데이터독의 최고제품책임자는 이를 클라우드 초기에 비유합니다. 클라우드가 시스템을 프로그래밍 가능하게 만들면서 관리가 훨씬 복잡해졌듯, AI가 애플리케이션 계층에서 같은 일을 하고 있다는 것입니다.

1장 결론: AI는 데이터독에 직접(새 관측 차원)과 간접(전 계층 데이터 폭증) 두 경로로 수요를 만듭니다. 데이터량 과금이 이 폭증을 매출로 번역하고, 비AI 고객의 가속이 그 증거입니다. 다만 이 홍수에는 댐을 위협하는 네 갈래 물길이 따라옵니다. 다음 장에서 그 위협들을 하나씩 분해합니다.

2장. 네 갈래의 위협: 어디까지 진짜인가

데이터독을 향한 위협은 네 갈래로 들어옵니다. OTel 오픈소스 표준, 하이퍼스케일러 번들, AIOps와 self-healing과 지능형 파이프라인, 그리고 AI 코딩 에이전트입니다. 이걸 "위협이다 아니다"로 뭉뚱그리면 안 됩니다. 각각을 기술적 인과로 분해하면 네 갈래가 사실 한 곳을 노린다는 게 보입니다. 진짜 위협은 "사람을 줄이는" 쪽이 아니라 "데이터량을 줄이는" 쪽이며, OTel이 그 선두입니다.

2.1 OTel과 오픈소스: 가장 현실적인 위협

OpenTelemetry(줄여서 OTel)는 관측 데이터를 어떤 벤더에도 종속되지 않게 보내주는 오픈소스 공개 표준입니다. 쉽게 말하면, 어느 관측 회사 제품에도 똑같이 꽂히는 표준 규격의 플러그입니다.

OTel이 무엇을 바꾸는지부터 봅시다. 과거에는 데이터독을 쓰려면 데이터독 전용 SDK로 코드를 계측(instrument, 코드 곳곳에 데이터를 내보내는 장치를 심는 작업)해야 했고, 다른 도구로 갈아타려면 전부 다시 계측해야 했습니다. 이 재계측 비용이 전환비용의 핵심이었습니다. OTel은 표준 규격으로 한 번 계측하면 어느 백엔드로든 보낼 수 있게 합니다. 비유로 돌아가면, 어느 댐으로든 물을 보낼 수 있는 규격 통일 수로입니다.

그리고 OTel은 이미 임계를 넘었습니다.

지표	수치	출처
시그널 안정화	로그·메트릭·트레이스 전부 Stable 1.0 (2024)	icloudcentral
Collector 일일 처리량	약 100억 span/일 (2023 대비 4배)	icloudcentral
OTel 채택 1순위 동기	벤더 이동성 58% (비용 절감 44% 상회)	Honeycomb 서베이
신규 엔터프라이즈 OTel 선설치 비율	34%	Pomel (Q3 2025 콜)
Prometheus 프로덕션 사용률	67%	Grafana 서베이

OTel 확산 지표 (출처: icloudcentral, Honeycomb 2025 서베이, Q3 2025 어닝콜, Grafana 2025 서베이)

특이 동향도 하나 있습니다. Grafana Labs는 데이터독 메트릭 포맷을 표준 규격(OTLP)으로 변환해 자사 백엔드로 라우팅하는 "Datadog Receiver"를 2024년 오픈소스로 공개했습니다(Grafana blog). 사실상 데이터독에서 빠져나가는 경로를 기술적으로 단순하게 만든 것입니다.

그렇다면 "표준화되면 해자가 없다"는 일반론이 맞는 걸까요. 절반만 맞습니다. OTel이 표준화하는 것은 계측과 신호 태그 스키마(어느 데이터가 어느 서비스 것인지 라벨 붙이는 규칙)까지입니다. 그러나 데이터가 실제로 쌓이는 백엔드, 그 위의 자동 상관분석, 데이터독 자체 AI(Toto 시계열 모델, Watchdog 이상탐지, Bits AI), 600개가 넘는 통합, 단일 화면 워크플로우는 OTel이 표준화하지 못합니다. 락인이 그 위에 있다는 최소한의 증거는, 이탈만 보는 유지율(GRR, 기존 고객이 떠나지 않고 남아 있는 비율)이 mid-to-high 90s%로 높다는 점입니다(alphaspread Q1 2026). 게다가 한 고객이 함께 쓰는 제품 수가 계속 늘어, 여러 제품을 함께 쓰는 고객일수록 단일 제품 고객보다 훨씬 많이 지출합니다. 즉 OTel은 신규 고객이 진입할 때 협상력을 키워주지만, 이미 여러 제품을 쓰는 기존 고객을 떠나게 만들지는 못합니다.

그래서 위협의 발현 형태는 이탈이 아니라 두 채널입니다. 첫째, 새로 들어오는 고객에게 받을 단가가 눌립니다. 여기서 ASP란 평균판매단가, 즉 고객 한 곳에서 받는 평균 가격입니다. OTel로 진입 협상력이 커진 신규 고객은 이 ASP를 끌어내립니다. 둘째, 기존 고객은 떠나지 않되, OTel과 데이터 파이프라인을 지렛대로 인입 볼륨을 줄여 확장 매출(NRR)을 깎습니다. 두 채널 모두 댐이 받는 통행료를 줄이는 같은 방향입니다.

여기에 "데이터독 청구서 쇼크"가 겹칩니다. 비용이 비선형으로 튀어 고객이 부담 때문에 볼륨을 자발적으로 줄이는 현상입니다. 고객이 OTel과 파이프라인을 지렛대 삼아 단가를 협상하고 볼륨을 솎아냅니다. 실제로 2022년에서 2023년 클라우드 비용 최적화 국면에서 이 볼륨 축소가 NRR을 130%대에서 mid-110s까지 끌어내린 적이 있습니다(alphaspread). 이탈보다 단가와 볼륨 압박이 먼저 옵니다.

OTel이 푸는 것 (계측 레이어)

전용 SDK 재계측 비용

신규 고객 진입장벽

신호 태그 표준화

OTel이 못 푸는 것 (상위 레이어)

데이터가 쌓이는 백엔드

자동 상관분석

자체 AI (Toto·Watchdog·Bits)

600+ 통합

단일 화면 워크플로우

뭐가 문제?

OTel 표준화가 전환비용의 핵심이던 재계측을 없앤다

왜 위험?

발현은 고객 이탈이 아니라 신규 고객 단가(ASP) 압박 + 기존 고객 볼륨 축소(NRR 경유)

영향 범위

반증조건: 4분기 연속 NRR 115% 미만 + 신규 고객 OTel 선설치 50% 돌파 + 호스트당 단가 하락 동반 + OTel 선설치 코호트의 NRR이 비선설치보다 뚜렷이 낮아짐 (4장 종합)

2.2 하이퍼스케일러 번들: 2순위 위협

하이퍼스케일러인 AWS, Azure, GCP는 자기 클라우드 안에 관측 도구를 기본 내장합니다. AWS CloudWatch는 120개가 넘는 AWS 서비스를 별도 설정 없이(zero-config) 커버합니다. AWS 서비스가 에이전트나 설정 없이 메트릭을 자동으로 뿜게 해주고, Azure Monitor와 Google Cloud Operations도 각자 생태계에 통합돼 있습니다. 계약에 끼워 팔리니 추가 비용이 거의 0입니다. 비유로는 상류에 이미 서 있는 공짜 보조댐입니다. 단일 클라우드만 쓰는 고객, 특히 중소기업(SMB)에게는 "이미 있는데 왜 따로 사?"가 됩니다.

그러나 번들에는 분명한 한계가 있고, 그 한계가 정확히 데이터독의 방어선입니다. 클라우드 네이티브 도구는 자기 클라우드만 봅니다. 여러 클라우드를 함께 쓰는 멀티클라우드(AWS+Azure+GCP)나 클라우드와 자체 서버를 섞은 하이브리드 환경에서는 커버리지가 끊기고, 클라우드를 가로지르는 상관분석이 안 됩니다. APM과 디지털 경험 모니터링(실사용자 모니터링, 합성 모니터링), 보안의 통합 깊이도 부족합니다. 데이터독 매출의 핵심 방어선이 바로 여기입니다. 한 분석가 추정으로는 하이퍼스케일러 네이티브 도구가 데이터독을 위협할 확률을 30~40%로 봤는데, 이는 추정치이고 신뢰도에 주의가 필요한 값입니다(경쟁 분석).

새 변수도 지켜봐야 합니다. 하이퍼스케일러들도 2025년 자사 관측 서비스에 OTel 파이프라인 네이티브 지원을 발표했습니다(icloudcentral). 만약 AWS나 Azure가 여기서 더 나아가 "멀티클라우드 관측 + OTel 백엔드"를 정식 제품으로 내놓으면, 데이터독의 방어선을 정면으로 노리는 셈입니다. 이것이 이 위협의 가장 위험한 진화 경로입니다.

번들의 강점

zero-config, 120+ AWS 서비스 자동

계약 번들로 추가 비용 0

단일 클라우드·SMB에 강력

번들의 한계 (데이터독 방어선)

단일 클라우드만 커버

멀티클라우드·하이브리드 불가

클라우드 간 상관분석 불가

APM·DEM·보안 통합 깊이 부족

2.3 AIOps·self-healing·지능형 파이프라인: 사람이 아니라 데이터를 줄이는 위협

"AI 에이전트가 스스로 문제를 찾아 고치니(self-healing) 사람이 대시보드를 볼 필요가 없어진다"는 위협입니다. 네 갈래 중 가장 직관적이지만, 직관이 가리키는 곳이 틀렸습니다.

위협론의 논리부터 봅시다. 자율 에이전트가 이슈를 탐지하고 진단하고 수정하고 배포까지 자동화하면 인간 SRE의 역할이 줄고, IT 운영 비용을 최대 35%까지 줄일 수 있다는 분석이 있습니다(Algomox 추정, 위협 인과 변수로만 사용). 사람이 덜 보면 대시보드 소프트웨어 수요가 준다는 논리입니다.

그런데 이 응시 시간 경로는 약합니다. 강과 댐으로 돌아가면, self-healing 로봇은 사람 대신 강을 감시하는 로봇입니다. 그런데 로봇도 물을 읽어야 작동합니다. 자율 진단과 수정 에이전트는 텔레메트리(메트릭, 로그, 트레이스)를 입력으로 먹어야 판단합니다. 그러니 사람이 화면을 덜 본다고 데이터 흐름이 줄지 않고, 응시 시간 감소는 데이터량 과금을 직접 때리지 못합니다. 게다가 데이터독은 self-healing을 남이 팔기 전에 자기가 팝니다(Bits AI SRE). 실제로 같은 기간 LLM span은 분기 대비 3배, SRE 조사는 2배로 늘었습니다(1.2 참조). 자율화가 응시 시간만 줄인다면 오히려 데이터를 더 먹습니다.

그러나 볼륨 경로는 진짜입니다. 이것이 이 위협의 핵심입니다. 같은 AI가 "어떤 텔레메트리를 통과시킬지" 고르기 시작하면 이야기가 달라집니다. 자율 에이전트가 노이즈 로그와 중복 메트릭을 자동으로 솎아내고, 지능형 데이터 파이프라인이 인입 전에 데이터를 줄이면(adaptive sampling, 들어오는 데이터를 상황에 맞게 표본만 추려 받는 기법), 과금이 걸린 볼륨 자체가 내려갑니다. 이것은 응시 시간이 아니라 데이터량을 때리므로 데이터독을 직접 압박합니다. Chronosphere처럼 동적 샘플링과 텔레메트리 필터링으로 저장과 운영 비용을 깎는 파이프라인 도구가 정확히 이 길을 팝니다(Taloflow).

흥미롭게도 데이터독도 같은 무기를 자기가 팝니다. Observability Pipelines와 BYOC(Bring Your Own Cloud, 고객 자신의 클라우드에 데이터를 두게 하는 방식)로 고객이 데이터의 가짓수와 인입량을 직접 통제하게 해줍니다. 고객을 붙잡는 방어이자, 호스트당 단가를 스스로 깎는 자기잠식의 양날입니다. 결국 self-healing 위협의 진짜 형태는 OTel이나 청구서 쇼크와 같은 "볼륨을 떼어내는" 한 벡터입니다.

짚어둘 점이 있습니다. "현장에선 self-healing을 도입하면 라이선스를 줄인다"는 반론은 자리당 과금 도구 이야기입니다. 데이터독은 자리당 과금이 아니라서 응시 시간 경로는 약합니다. 그러나 위에서 본 볼륨 경로는 다릅니다. 그래서 이 위협의 현실화 관문은 "사람이 화면을 보는가"가 아니라 "워크로드는 느는데 인입 데이터 볼륨이 따로 노는가", "주요 고객의 adaptive sampling과 파이프라인 도입률이 오르는가"입니다(4장).

규제 변수도 이 수요를 떠받칩니다. EU AI Act는 반자율과 완전자율 운영을 "고위험"으로 분류해 인간 검토 체크포인트를 의무화할 수 있습니다. 완전 자동화를 막는 규제이므로, 역설적으로 인간 감시 레이어(관측 도구) 수요를 유지시키는 요인입니다.

개념적 시각화. 데이터독 기술 분석 기반.

2.4 AI 코딩 에이전트: 대시보드 수요를 죽이는가

Cursor, GitHub Copilot, Claude Code 같은 AI 코딩 에이전트가 코드를 자동으로 생성하고 디버깅하면 개발자가 직접 모니터링할 일이 준다는 위협입니다. 그런데 인과는 양방향입니다.

감소 측 논리는 이렇습니다. 코딩 에이전트가 디버깅까지 도우면 개발자가 대시보드와 알럿을 덜 본다는 것입니다. "팀이 동시에 6개 대시보드를 보다 숨은 상관관계를 놓친다, 그래서 스스로 예측하고 조정하는 솔루션을 원한다"는 업계 목소리도 있습니다.

그러나 증가 측 논리가 있습니다. 비유로는, AI 코딩 에이전트는 수문을 더 많이 여는 기계입니다. 코드를 더 많이, 더 빨리 생산하면 프로덕션에 올라가는 소프트웨어가 늘고, 그 소프트웨어가 전부 관측 대상이 됩니다. 게다가 AI가 짠 코드는 사람이 일일이 검토하지 않은 채 돌아가는 경우가 많아, 오히려 관측의 필요가 커집니다.

정직한 결론은 이렇습니다. 둘 다 작동하는 힘이며, 어느 쪽이 우세한지는 데이터로 봐야 합니다. 현재까지의 신호(데이터 볼륨, 신규 제품 채택 가속)는 증가 측이 우세함을 가리킵니다. 이 위협의 반증 신호는 "워크로드는 느는데 데이터 볼륨 성장이 따로 노는 것"입니다(4장).

이제 네 위협을 한 표로 종합합니다.

위협	기술 현실성	발현 형태	이것을 보면 현실화 (반증조건)
OTel·오픈소스	높음 (1순위)	이탈 아닌 신규 단가 압박 + 기존 고객 볼륨 축소(NRR 경유)	NRR 4분기 연속 115% 미만 + OTel 선설치 50%+ + 호스트당 단가 하락 + 선설치 코호트 NRR 격차
하이퍼스케일러 번들	중간 (2순위)	단일 클라우드·SMB 신규 잠식	AWS/Azure가 멀티클라우드+OTel 백엔드 제품 출시
볼륨 축소(self-healing·파이프라인)	조건부 진짜	인입 데이터량 자체 감소(adaptive sampling·자동 노이즈 제거)	워크로드는 느는데 데이터 볼륨 성장 디커플 + 파이프라인 도입률 상승 + 호스트당·GB당 소비 하락
AI 코딩 에이전트	낮음 (양방향, 현재 증가 우세)	데이터 볼륨 디커플 시에만	워크로드 성장과 데이터 볼륨 성장의 디커플

위협 4종 종합: 기술 현실성·발현 형태·반증조건 (출처: 데이터독 기술 분석, 반증조건 측정 임계값)

2장 결론: 네 위협은 서로 다른 적이 아니라 한 곳을 노립니다. 직관이 가리키는 "사람을 줄이는" 위협(self-healing 응시 시간, AI 코딩)은 데이터량 과금이 완충해 빗나가고, 진짜 위협은 모두 "인입 데이터량 자체를 깎는" 한 벡터로 수렴합니다. OTel(협상력으로 단가·볼륨 압박), 청구서 쇼크(비용 때문에 볼륨 자발 축소), 지능형 파이프라인(adaptive sampling으로 인입 직접 축소)이 같은 메커니즘입니다. 발현 형태는 대개 이탈이 아니라 단가와 볼륨 압박입니다. 위협이 사람이라면, 그 사람들은 누구인가. 3장에서 경쟁 진영을 펼칩니다.

3장. 경쟁구도: 누가 어느 물길을 노리는가

위협의 출처를 사람으로 바꿔 보면, 경쟁 진영이 됩니다. 관측가능성 시장은 네 진영으로 나뉩니다. 독립 전문기업(데이터독, Dynatrace, Elastic), 하이퍼스케일러 네이티브(CloudWatch 등), 오픈소스 진영(Grafana, Prometheus), 그리고 AI 전용 신생기업(LangSmith, Arize 등)입니다. 데이터독은 독립 진영의 압도적 1위이며 5년 연속 Gartner Leader이지만, 이 시장은 100개가 넘는 기술이 공존하는 과밀 시장입니다.

3.1 네 진영 지도

각 진영은 강의 다른 물길을 노립니다.

①

독립 전문기업

데이터독·Dynatrace·Elastic·New Relic. 풀스택 통합으로 강 전체를 댐 하나에 모음

②

하이퍼스케일러 네이티브

AWS CloudWatch·Azure Monitor·GCP Operations. 자기 영토 안의 물을 공짜로 받음

③

오픈소스

Grafana LGTM·Prometheus·OTel. 규격 수로로 물길을 자유화, 비용·종속 해소

④

AI 전용 신생

LangSmith·Arize·Helicone·Fiddler·Galileo. AI라는 새 지류에 특화

이 시장의 본질은 과밀입니다. 한 조직이 동시에 쓰는 관측 도구는 평균 8개이고, 시장에서 동시 사용되는 관측 기술은 100개가 넘습니다(Grafana 2025 서베이). 그래서 데이터독의 싸움은 독점이 아니라 "한 고객의 8개 슬롯 중 몇 개를, 그리고 가장 비싼 슬롯을 차지하느냐"입니다.

3.2 회사별 포지션과 강약점

데이터독은 매출 규모로 독립 전문기업 1위이며 2위 Dynatrace의 약 두 배입니다. 그러나 각 경쟁사는 데이터독이 약한 지점을 정확히 노립니다.

먼저 규모를 체감해 봅시다. 아래는 점유율 환산이나 적정가 계산이 아니라, 회사들의 덩치를 가늠하기 위한 매출 비교입니다.

관측 전문기업 매출/ARR 규모

~$4.2B ARR

$3,427M

$1,699M

$1,483M

$270M ARR

Splunk (Cisco)

SIEM·보안 혼재

Datadog

FY2025 매출, +27.7%

Dynatrace

FY2025, +19%

Elastic

검색·보안 혼재

Grafana Labs

2024-06, 비상장

출처: 각 사 FY2025 실적 ([Investing.com](https://www.investing.com/analysis/observability-wars-datadog-and-dynatrace-vie-for-data-dominance-200654023)). Splunk·Elastic은 보안·검색이 섞여 순수 관측 매출이 아님. New Relic은 2023-11 상장폐지로 비공개

경쟁사	핵심 강점	데이터독을 노리는 지점
Dynatrace	DavisAI 통합 깊이, 대규모 환경 낮은 총소유비용	스케일 환경에서 가격 경쟁력
Grafana Labs	오픈소스 LGTM 스택, OTel·Prometheus 1등급 호환, 100+ 데이터소스	비용 민감·엔지니어링 강한 조직의 셀프호스팅
AWS CloudWatch	zero-config, 120+ AWS 서비스 자동, 번들 무료	단일 클라우드·SMB
Elastic	Elasticsearch 기반 로그 검색, 100% OTel Native, Flex Logs 저비용	로그 중심 워크로드 가격
Chronosphere	쿠버네티스·Prometheus 특화, 동적 샘플링으로 비용 절감	클라우드 네이티브 비용 최적화

경쟁사별 강점과 데이터독이 노출된 약점 (출처: Investing.com, Gartner Peer Insights)

그럼에도 데이터독의 정성적 위치는 견고합니다. Gartner Magic Quadrant(시장 평가 사분면) 관측가능성 부문에서 5년 연속(2021~2025) Leader입니다(Datadog IR). Gartner가 인정한 강점은 엔드투엔드 APM과 모바일·브라우저 통합, Bits AI, LLM 관측, OTel 네이티브 지원입니다.

💡 한 진영 안의 균형추: 이탈은 양방향입니다. 데이터독이 전문 에러 트래킹 도구(Sentry)에 고객을 내주는 비율이 그 반대보다 높다는 관찰도 있습니다(Seeking Alpha). 즉 데이터독은 통합의 강자이지만, 특정 기능의 깊이에서는 전문 도구에 한 슬롯씩 내줍니다. 이것이 과밀 시장의 실제 모습입니다.

3.3 LLM 관측 전쟁: 통합이냐 전용이냐

AI라는 새 지류를 두고, 통합 플랫폼(데이터독)과 전용 신생기업(LangSmith, Arize, Galileo)이 맞붙습니다. 데이터독의 무기는 "한 화면에서 LLM을 인프라·앱·사용자와 함께 본다"는 통합 컨텍스트이고, 신생기업의 무기는 "AI만 깊게 판다"는 전문성입니다.

전용 진영부터 살펴봅니다.

기업	포지셔닝
LangSmith (LangChain)	LangChain 생태계 네이티브
Arize AI	ML 모델·LLM 모니터링 전문
Helicone	LLM 프록시 기반 비용·성능 모니터링
Fiddler AI	설명가능성·공정성 중심
Galileo	LLM 품질 평가·환각 탐지

LLM 관측 전용 신생기업 (출처: Observability Outlook 2026)

"AI 수요가 큰 건 맞지만 그건 전용 도구가 먹지 데이터독이 아니다"는 반론이 가능합니다. 데이터독의 답은 통합 컨텍스트입니다. LLM 호출 하나를 그것이 도는 인프라, 앞단 앱, 사용자 세션과 같은 화면에서 연결해 보면, AI 장애의 진짜 원인을 더 빨리 찾습니다. 전용 도구는 LLM만 보고 그 아래 스택은 못 봅니다.

그러나 정직하게 반대 증거도 병기합니다. 골드만삭스 같은 약세 시각은 데이터독의 LLM 관측을 "전용 플랫폼 대비 깊이가 부족한, 기능 추가 수준"으로 평가합니다(FinancialContent). 통합의 넓이와 전용의 깊이는 실제 trade-off이며, 이 승부는 아직 진행 중입니다. AI 관측이라는 하위시장 자체도 빠르게 상품화될 위험이 있어, 데이터독의 차별점은 "LLM 단독"이 아니라 "LLM을 전체 스택과 묶는 통합"에 걸려 있습니다.

통합 (데이터독)

LLM을 인프라·APM·세션과 한 화면에서 연결해 원인 추적이 빠름. 약점: 개별 깊이는 전용 대비 얕을 수 있음

넓이

전용 (LangSmith·Arize·Galileo)

AI에 특화된 깊은 평가·환각 탐지. 약점: 그 아래 스택과 단절

깊이

3장 결론: 시장은 4진영, 100개 넘는 기술이 공존하는 과밀 시장이고, 데이터독은 독립 진영 1위이자 5년 연속 Gartner Leader입니다. 각 경쟁사는 데이터독의 약점(가격·로그·단일 클라우드·AI 깊이)을 한 칼씩 노립니다. 데이터독의 방어선은 "통합"입니다. 그렇다면 이 통합이 위협을 막아내고 있는지, 무엇을 보면 알 수 있을까요.

4장. 양날의 저울: 무엇을 보면 위협이 현실이 되는가

AI는 데이터독에 홍수(기회)와 네 갈래 물길(위협)을 동시에 가져옵니다. 지금 저울은 어느 쪽으로 기울어 있고, 그 균형이 깨지는 신호는 무엇일까요. 이 장은 주가가 아니라 사업 자체의 측정 가능한 임계값으로 주제를 닫습니다.

4.1 측정 가능한 반증조건

"AI가 양날"이라는 말은 검증 불가능한 수사가 되기 쉽습니다. 그래서 위협별로 "이 숫자가 이 선을 넘으면 위협이 이긴 것"이라는 임계값을 박아둡니다. 아래 신호판은 위협이 현실화하는 일곱 개의 관문입니다.

AI 양날의 균형 신호판 (위협 현실화 관문)

NRR (선설치 코호트 격차 포함)

low 120%대

⚠️ 주의

4분기 연속 115% 미만이면 OTel·청구서 쇼크·볼륨 축소가 확장을 압도하는 1순위 신호

GRR (이탈만 본 유지율)

mid-to-high 90s%

⚠️ 주의

93% 미만이면 멀티프로덕트 락인 균열

신규 고객 OTel 선설치 비율

34% (Q3 2025)

⚠️ 주의

50% 돌파 + 호스트당 단가 하락 동반이면 계측 락인 해소가 가격결정력으로 전이

데이터 볼륨 (호스트·GB·span)

span 분기 대비 3배 등 강한 증가

워크로드 성장과 디커플되면 볼륨 축소 위협의 핵심 관문

호스트당·GB당 소비량 추세

강한 증가 유지

워크로드 증가 속 호스트당·GB당 소비가 하락하면 파이프라인이 인입 단가를 깎는 중

파이프라인 도입률 (주요 고객)

모니터링 시작

⚠️ 주의

빠른 상승이면 볼륨 축소 위협이 실제로 인입을 줄이는 중

AI-native 매출 비중 (재공개 시)

Q3 2025 12% 후 비공개

12% 피크를 하회하면 AI-native 내부화·이탈 신호

출처: NRR·GRR 밴드 alphaspread Q1 2026, OTel 선설치 Q3 2025 콜, 채택 가속 Q1 2026 보도자료

이 일곱 신호는 사실 한 질문을 봅니다. "댐이 받는 통행료(데이터 볼륨 × 단가)가 깎이는가." 1·2·3이 무너지면 OTel과 청구서 쇼크가 단가 채널로 이긴 신호이고, 4·5·6이 무너지면 self-healing과 지능형 파이프라인이 볼륨 채널로 이긴 신호입니다. 두 채널은 다른 위협이 아니라 같은 벡터의 두 얼굴이며, 현재는 둘 다 임계 아래입니다(볼륨은 오히려 강한 증가). 일곱 번째는 집중 리스크의 조기경보입니다.

4.2 지금 저울은 어디로 기울어 있는가

현재 측정값은 기회 측 우세를 가리킵니다. 그러나 "우세"가 "영구 안전"은 아닙니다. 양날의 본질은 균형이 동적이라는 데 있습니다.

기회 측이 이기고 있다는 증거부터 봅시다. AI를 안 쓰는 고객까지 가속하고(mid-20%대), 신규 AI 제품 채택이 폭증하고(span 분기 대비 3배), NRR이 low 120%대로 회복했으며, 멀티프로덕트 채택률이 오르고 있습니다. 데이터 볼륨은 워크로드와 함께 늘고 있어 디커플 신호가 없고, 호스트당 소비도 강세입니다. 볼륨 축소 위협(self-healing, 지능형 파이프라인, AI 코딩)과 하이퍼스케일러는 아직 임계 아래입니다.

그러나 위협은 진행 중입니다. OTel 선설치는 34%로 임계(50%)를 향해 오르고 있고, 청구서 쇼크는 데브옵스 커뮤니티의 관용어가 됐으며, 하이퍼스케일러의 멀티클라우드와 OTel 진화 경로가 열려 있습니다. 가장 위험한 시나리오는 "OTel이 신규 단가를 누르는 동안 AI 관측이 상품화되는" 동시 압박입니다.

여기까지 단서가 많았습니다. 한 줄로 압축하면 이렇습니다.

💡 핵심: AI는 데이터독에게 위협이자 기회입니다. 둘 중 무엇이 우세한지는 믿음이 아니라 측정 가능한 신호판으로 판별됩니다. 현재는 기회 측 우세입니다. 균형이 깨지는 첫 신호는 NRR이 4분기 연속 115% 아래로 내려가며 신규 단가가 동반 하락하거나, 워크로드는 느는데 인입 데이터 볼륨이 따로 노는 것입니다.

AI는 데이터독에 새 강물을 가져오고, 그 강물은 데이터량 과금이라 거의 그대로 매출이 됩니다. 위협은 "사람이 댐을 덜 봐서"가 아니라 "댐을 지나는 물의 양과 통행료가 깎여서" 옵니다. OTel, 청구서 쇼크, 지능형 파이프라인이 그 한 벡터입니다. 그래서 봐야 할 핵심 신호는 NRR과 신규 단가, 그리고 워크로드 대비 인입 볼륨이 따로 노는가입니다.

AI 시대 관측가능성, 양날의 저울

AI는 데이터를 폭증시키고, 데이터독은 데이터량으로 과금합니다. 이것이 기회의 구조입니다.

위협들은 다른 적이 아니라 한 곳을 노립니다. 진짜 위협은 "사람"이 아니라 "데이터량"을 줄이는 쪽이며, OTel·청구서 쇼크·지능형 파이프라인이 한 벡터입니다.

발현 형태는 이탈이 아니라 신규 단가 압박과 기존 고객 볼륨 축소(NRR 경유)입니다.

균형 판별 신호: NRR(선설치 코호트 격차), GRR, OTel 선설치, 데이터 볼륨, 호스트당 소비, 파이프라인 도입률, AI-native 비중. 현재는 기회 측 우세입니다.