IT 비즈니스

나 혼자 NVDA를 때려잡았던 건

Quiet Stacker 2025. 6. 20. 00:54

 


https://www.bloomberg.com/news/features/2025-05-13/deepseek-races-after-chatgpt-as-china-s-ai-industry-soars

중국 AI 스타트업 DeepSeek은 2024년 초, GPT-4 대비 5% 수준의 비용으로 자체 개발한 언어 모델 R1을 발표하며 세계적인 주목을 받았다. 이 모델은 주요 AI 벤치마크에서 서구의 대표 모델들을 앞섰고, 미국 증시에서 일시적으로 1조 달러 이상의 매도세를 유발했다. DeepSeek의 창업자 량원펑은 고요한 성격과는 달리 뛰어난 기술적 통찰을 가진 인물로, 내부적으로는 젊은 연구원들에게 파격적으로 실험 기회를 부여하고, AI 모델의 희소 구조 등 첨단 기술 전략을 진두지휘해온 것으로 알려졌다.

미국에서는 DeepSeek이 중국 정부와 연계되어 있고, OpenAI의 데이터를 도용했으며, Nvidia의 금수 칩을 우회 구매했다는 의혹이 제기되었으나, 회사 측은 이에 대해 공식적으로 답하지 않고 있다. 대신 DeepSeek은 자사 모델과 연구 결과를 오픈소스로 공개하면서도 내부 구조와 비용 등은 철저히 비공개하는 전략을 취하고 있다.

DeepSeek은 AI 모델 설계에서도 독특한 접근을 보여주었다. 기존 LLM이 입력마다 전체 모델을 활성화하는 방식과 달리, DeepSeek은 ‘희소성(sparsity)’ 기법을 도입해 입력에 따라 일부 전문가 모듈만 작동하도록 설계함으로써 계산 자원을 효율적으로 활용했다. 이는 성능 저하와 내부 지식 분열 등 복잡한 문제를 수반할 수 있음에도 불구하고, DeepSeek은 이를 적극적으로 실험하며 경쟁사보다 더 많은 전문가 구조를 적용한 모델 설계를 시도했다. RLHF(인간 피드백 기반 강화 학습) 인프라 구축조차 인턴에게 맡길 정도로 개방적이고 실험적인 조직문화 또한 DeepSeek의 빠른 기술 진화를 가능케 한 원동력이었다. 이 같은 기술적 역량은 DeepSeek이 단순히 값싼 대안을 넘어, 고유한 AI 설계 철학을 가진 연구소임을 보여주는 지점이다.

이러한 돌파구는 DeepSeek만의 현상은 아니다. 항저우에는 DeepSeek 외에도 Game Science, BrainCo 등 ‘6마리 작은 용’이라 불리는 차세대 AI 유니콘들이 등장하고 있으며, 알리바바, 화웨이, 바이두 등 기존 대기업도 슈퍼컴퓨터와 LLM 개발을 가속화하고 있다. 중국 정부는 기술 자립과 AI 주권을 국가 과제로 내세우며 관련 산업을 전폭적으로 지원하고 있다.

DeepSeek은 미국의 견제와 의혹에도 불구하고, 오픈소스와 고성능 AI 기술력으로 글로벌 AI 지형에 균열을 내고 있다. 미국과 서구권이 중국 기술을 불신하는 가운데, DeepSeek은 단순한 기술 스타트업을 넘어 중국의 국가적 자부심과 기술 주권의 상징으로 떠오르고 있다.

'IT 비즈니스' 카테고리의 다른 글

만인에 대한 만인의 투쟁  (0) 2025.06.29
우리에게는 여전히 '팡션'이 필요합니다  (0) 2025.06.23
나 때문입니까, 휴먼  (1) 2025.06.19
Sovereignty-as-a-Service  (0) 2025.06.18
AGI is the new ZuckPri  (0) 2025.06.17