Anthropic, DeepSeek·Moonshot·MiniMax가 Claude에 대한 산업 규모의 AI 증류 공격을 벌였다고 비난

앤스로픽(Anthropic), 거대 "산업적 규모(Industrial-Scale)"의 AI 증류 캠페인 폭로

미국과 중국의 인공지능 연구소 간의 지식 재산권 갈등이 크게 고조되는 가운데, 앤스로픽(Anthropic)은 중국의 세 선도 기업인 딥시크(DeepSeek), 문샷 AI(Moonshot AI), 미니맥스(MiniMax)가 자사의 주력 모델인 클로드(Claude)로부터 성능을 빼내기 위해 거대하고 조직적인 캠페인을 벌였다고 공개적으로 비난했습니다. 샌프란시스코에 본사를 둔 AI 안전 스타트업인 앤스로픽은 이번 작업을 정교한 가짜 계정 네트워크를 통해 생성된 1,600만 건 이상의 무단 교환을 포함하는 "산업적 규모의 절도(industrial-scale theft)"로 규정하고 있습니다.

이 폭로는 현재까지 발생한 AI 데이터 절도 혐의 중 가장 구체적이고 수치화된 사례 중 하나로 기록되었습니다. Anthropic에 따르면, 이번 작업은 단순히 기회주의적인 스크레이핑이 아니라 클로드의 고급 추론 및 코딩 결과물을 사용하여 경쟁 모델을 학습시키기 위해 설계된 의도적인 "지식 증류 공격(distillation attack)"이었습니다. 이 사건은 경쟁적 연구와 불법적 추출 사이의 경계가 점점 더 불안정해지고 있는 글로벌 AI 군비 경쟁 속에서 커지는 긴장감을 강조합니다.

공격의 구조: 1,600만 건의 교환

앤스로픽의 보안 팀은 회사의 서비스 약관과 지역별 접속 제한을 우회하는 데 사용된 약 24,000개의 가짜 계정(fraudulent accounts)으로 구성된 방대한 인프라를 확인했습니다. 클로드는 중국에서 상업적으로 이용 가능하지 않기 때문에, 혐의를 받고 있는 기업들은 상업용 프록시 서비스를 이용해 출처를 숨겼으며, 앤스로픽 엔지니어들은 이를 감지를 피하기 위해 서드파티 API에 트래픽을 분산시키는 계정 네트워크인 "히드라 클러스터(Hydra clusters)"라고 명명했습니다.

작업의 규모는 상하이에 기반을 둔 유니콘 기업인 미니맥스에 크게 치우쳐 있었으며, 앤스로픽은 불법 트래픽의 상당 부분이 미니맥스에 의한 것이라고 주장합니다. 최근 DeepSeek가 효율적인 오픈 소스 모델로 상당한 언론의 주목을 받았지만, 이번 사례에서 가장 공격적인 추출 캠페인을 수행한 것은 미니맥스인 것으로 알려졌습니다.

지식 증류 활동 혐의 분석

피소 기업	추정 교환 횟수	주요 목표 기능	작업 규모
MiniMax	> 13,000,000	에이전틱 추론(Agentic reasoning), 도구 사용	거대 / 산업적 수준
Moonshot AI	> 3,400,000	긴 컨텍스트 처리, 코딩	상당함
DeepSeek	> 150,000	생각의 사슬(Chain-of-thought) 추론	표적화됨 / 전략적

2026년 2월 발표된 앤스로픽의 위협 인텔리전스 보고서에 기반한 데이터.

규모의 차이는 각 기업의 서로 다른 전략적 목표를 시사합니다. 미니맥스의 방대한 양은 Claude의 범용 기능, 특히 모델이 자율적으로 행동하는 "에이전틱" 작업 기능을 복제하려는 광범위한 시도를 나타냅니다. 반면, 딥시크의 상대적으로 작은 흔적은 기존 아키텍처를 미세 조정하기 위해 특정 고가치 추론 사슬에 집중한 매우 정밀한 작업이었던 것으로 보입니다.

"AI 증류" 해독: 혁신인가 절도인가?

이 논란의 중심에는 지식 증류(Knowledge distillation) 관행이 있습니다. 정당한 맥락에서 개발자들은 더 작고 효율적인 "학생(student)" 모델을 학습시키기 위해 거대한 "교사(teacher)" 모델을 사용합니다. 이 프로세스는 방대한 시스템의 지식을 더 빠르고 저렴한 버전으로 압축하며, 이는 내부 제품 개발을 위한 표준적인 관행입니다.

그러나 앤스로픽은 경쟁사가 허가 없이 이를 수행할 경우, 이는 약관 위반이자 독점적 지능의 절도에 해당한다고 주장합니다. 중국 연구소들은 클로드에게 수백만 개의 복잡한 프롬프트를 입력하고 그 답변을 수집함으로써, 프런티어 모델을 처음부터 학습시키는 데 필요한 막대한 컴퓨팅 및 데이터 큐레이션 비용을 효과적으로 우회했습니다.

"이 연구소들은 단순히 우리로부터 배우는 것이 아닙니다. 그들은 수십억 달러의 R&D 결과를 사실상 복사하고 있습니다"라고 앤스로픽 대변인은 말했습니다. 보고서는 이러한 쿼리들이 일반적인 사용자 상호작용이 아니었음을 강조합니다. 대신, 그것들은 구조적으로 뚜렷했으며, 종종 학습 데이터셋(Fine-Tuning Data)에 이상적인 복잡한 코딩 과제나 단계별 추론 요청을 포함하고 있었습니다.

국가 안보와 "안전 격차"

앤스로픽은 이 사건을 단순한 상업적 분쟁이 아니라 국가 안보(national security)의 과제로 규정했습니다. 회사는 불법적인 증류가 독특한 위험을 초래한다고 주장합니다. 즉, 원래 모델에 내장된 안전 가드레일을 제거한다는 것입니다.

클로드와 같은 모델이 증류될 때, "학생" 모델은 앤스로픽이 수개월 동안 강화한 안전 거부나 도덕적 정렬을 반드시 학습하지 않고도 능력(멀웨어 작성 방법, 화학 물질 합성 방법 등)을 습득하게 됩니다. 그 결과, 소스 모델의 내장된 제한 없이 권위주의 정권이나 악의적인 행위자에 의해 배포될 수 있는 "보호되지 않은 능력(unprotected capabilities)"이 만들어지게 됩니다.

불법 증류의 영향

수출 통제의 약화: 정교한 능력이 디지털 방식으로 이전되어 물리적 칩 제한을 우회합니다.
안전 분리: 증류된 모델은 종종 교사 모델의 "거부" 행동을 유지하지 못합니다.
시장 왜곡: 절도에 가담하는 기업은 학습 비용을 회피함으로써 가격을 낮출 수 있습니다.
확산 위험: 검열되지 않은 프런티어 모델 버전은 공격적인 사이버 작전에 쉽게 적응될 수 있습니다.

기술적 대응 조치

이 캠페인의 탐지는 고급 행동 분석에 의존했습니다. 앤스로픽의 "신뢰 및 안전(Trust and Safety)" 팀은 유휴 시간 없는 연중무휴의 독특한 쿼리 발생, 모델의 한계를 테스트하기 위해 설계된 고밀도의 "탈옥 스타일(jailbreak-style)" 프롬프트 등 인간 사용자가 거의 보이지 않는 트래픽 패턴의 이상 징후를 발견했습니다.

프록시 서비스와 관련된 IP 주소와 결제 수단을 연관 지음으로써, 앤스로픽은 24,000개의 계정을 세 개의 특정 기업에 귀속되는 별개의 클러스터로 그룹화할 수 있었습니다. 회사는 이후 이 계정들을 정지시키고 API 접속을 위해 더 엄격한 "고객 알기(Know Your Customer, KYC)" 프로토콜을 시행했지만, 프록시 네트워크의 "두더지 잡기(whack-a-mole)"식 특성상 영구적인 방지는 어렵다는 점을 인정하고 있습니다.

업계 반응 및 향후 전망

이번 비난은 오픈에이아이(OpenAI)가 중국 경쟁사들에 대해 비슷하지만 덜 구체적인 혐의를 제기한 지 몇 주 만에 나온 것으로, 업계 전반의 시스템적 패턴을 시사합니다. "증류" 지름길은 뒤처진 경쟁자들이 미국의 프런티어 모델과의 격차를 좁히기 위한 주요 방법이 되고 있습니다.

AI 커뮤니티에서 이 사건은 글로벌 디지털 경제에서 서비스 약관의 집행 가능성에 대한 비판적인 의문을 제기합니다. 모델이 더욱 강력해짐에 따라 결과물의 가치가 높아지고 있으며, 이는 모델을 매력적인 추출 대상으로 만들고 있습니다. 우리는 이것이 입법 조치를 가속화할 것으로 예상하며, 잠재적으로 모델 가중치와 모델 결과물을 현재 중국 수출이 제한된 고사양 GPU와 동일하게 엄격한 감시를 받는 통제 품목으로 취급하는 새로운 미국 규제로 이어질 수 있습니다.

상황이 진정되면서 딥시크, 문샷, 미니맥스가 어떻게 대응할지에 관심이 쏠리고 있습니다. 그들은 역사적으로 이러한 비난에 침묵을 지켜왔지만, 앤스로픽 데이터의 구체성은 공격의 기원에 관한 모호함을 거의 남기지 않습니다.