‘딥시크’ 가 뭐길래?
💡 중국 AI 스타트업 딥시크가 저렴한 비용으로 고성능 AI 모델을 개발하여 미국 AI 업계를 뒤흔들었다. 챗GPT보다 훨씬 저렴한 API 사용료를 제공하며, 오픈소스 모델로 자유로운 사용과 수정이 가능하다. 이는 엔비디아 등 AI 칩 제조사들에게는 명암이 엇갈릴 수 있는 소식이다. 하지만, 기존 AI 스타트업들에게는 큰 위협이 되고 있다. 딥시크는 중국 내수 시장을 발판 삼아 글로벌 AI 시장에서 새로운 강자로 떠오를 가능성을 보여주고 있다.
딥시크는 ‘딥시크’라는 동명의 거대언어모델(LLM)을 개발하는 중국의 AI회사이다. 챗GPT가 세상에 널리 알려진 2022년 11월 이후 2023년 5월 중국에서 설립됐고, 지난해부터 인상적인 성능의 AI모델을 공개하기 시작했다.
/ 미라클레터 참조
하이플라이어라는 AI를 바탕으로 하는 투자회사가 자회사의 형태로 만들었다. 사실 딥시크는 이미 작년에 중국에서도 유명한 회사였고, 실리콘밸리에서도 알려져 있던 회사였다. 하지만 올해 초에 나온 새로운 모델인 딥시크-R1이 화제가 됐고, 이것이 미국 언론에 의해서 대대적으로 보도되면서 전세계에 알려지게 됐다. 도대체 딥시크가 만든 AI가 어떻길래 이렇게 화제가 된 것일까?
딥시크의 장점은?
딥시크의 가장 큰 장점은 비용이 저렴하다는 것. 챗GPT의 구독료가 월20달러인데 딥시크는 무료로 서비스를 제공한다. 그래서일까? 딥시크가 출시되자 미국 애플 앱스토어 1위에 오르기도 했다.
어떤 AI가 싸다 비싸다 평가하는 것은 이 AI가 소프트웨어 개발자들에게 제공되는 API가격을 기준으로 한다. 개발자들은 직접 모든 AI를 개발하는 것이 아니라 오픈AI, 딥시크 같은 AI 회사가 만들어 놓은 AI를, 사용량에 비례해서 돈을 내는데, 이를 API 사용 비용이라고 한다.
딥시크 같은 경우 딥시크-챗(V3)의 가격이 100만 토큰(단어)당 입력기준 0.014달러, 출력 기준 0.28달러로 되어있다. 딥시크와 경쟁하는 오픈AI와 앤스로픽의 가장 싼 모델을 출력 기준으로만 가격을 비교하면 0.28달러(딥시크) vs 0.6달러(오픈AI) vs 4달러(클로드) 이다. 딥시크가 오픈AI가격의 절반, 클로드 가격의 14분의 1 정도로 저렴하다. 반면에 세 LLM의 성능 차이는 크지 않다고 딥시크는 주장하고 있다. 사용자들의 평가를 살펴보면 딥시크의 성능이 다른 둘과 현격한 차이는 느껴지지 않는 것 같다.
이 API 가격은 어떻게 책정되는 걸까? 여러가지가 반영될 것이다. 얼마나 많은 사람을 고용하는지, 이들의 인건비가 있을테고, 무엇보다 가장 중요한 것은 이 LLM을 학습시키고 추론을 통해 서비스하는 비용이다.
인공지능은 이른바 딥러닝이고, 이는 수천억개의 매개변수를 가진 함수에서 가중치를 찾아내는 것이라는 것이다. 이를 찾아내는 과정에서 엄청나게 큰 데이터와 이를 계산하는 작업이 필요하며, 이는 거대한 데이터센터에 있는 수천대의 컴퓨터들의 협업으로 이뤄진다. 이 컴퓨터에 들어가 있는 AI연산 전문 반도체가 바로 엔비디아의 GPU로 대표된다.
결국, AI를 운영하려면 많은 돈이 필요하다. GPU를 사서 데이터센터를 만들어도 돈이 많이들고, 이미 만들어져있는 데이터센터의 GPU를 사용하는데에도 돈이 많이 든다.
딥시크는 AI 반도체가 없어도 괜찮다?
하여튼 많은 돈을 들여서 인공지능 모델을 만들어내면, 이제부터는 여기에 값을 입력하는 것에 따라 우리가 원하는 답이 나온다. 이것이 학습(Training)과 대비되는 추론(Inference) 과정이다. 우리가 챗GPT에 질문을 던지고 답을 얻어내는 과정이 추론이고, 앞서 언급한 API 사용비용은 학습과 추론과정에서 사용한 GPU 이용료가 중요한 원가가 된다. 딥시크의 비용이 저렴하다는 것은 결국, 개발자들에게 받는 API 사용비가 낮다는 것을 말하며, 이는 딥시크가 저렴하게 학습을 시켰고, 저렴하게 추론을 시킬 수 있다는 뜻이 된다.
그런데 딥시크는 다른 미국 기업들과 달리 불리한 요소를 가지고 있었다. 바로 미국이 중국 기업들에게 우수한 성능의 AI 반도체를 팔지 못하게 했다는 것이다. 엔비디아 반도체는 A100(암페어) -> H100(호퍼) -> B100(블랙웩) 이런 식으로 성능 좋은 반도체가 나오고 있는데, 미국 정부는 H100부터 중국에 팔지 못하게 했다. 그래서 엔비디아는 중국용으로는 H800이라는 성능을 낮춘 GPU를 팔았고, 딥시크도 이 H800으로 학습이 이뤄졌다. 성능이 떨어지는 반도체를 쓰면 같은 데이터를 처리하는데도 시간이 걸릴 것이고, 이는 더 많은 시간을 사용했으므로 학습비용이 늘어나는 결과로 나오게 된다. 성능도 보장할 수 없다.
그럼에도 불구하고 딥시크의 AI는 오픈AI나 클로드보다 훨씬 저렴하게 API 서비스를 제공하고 있다. 대체 어떻게 가능한 것일까?
딥시크의 개발 비용 절감의 비결은?
딥시크는 주어진 제약 아래에서 다양한 창의적인 방법을 시도했다. 최대한 비용을 줄일 수 있는 다양한 공학적 시도를 한 것이다. 예를 들자면 인건비가 많이 드는 사전학습을 줄이고 AI가 스스로 공부하는 강화학습을 확대했다. 또, AI 모델에 사용되는 부동소수점(FP)을 8자리로 줄였다. 보통은 16자리(FP16)를 많이 쓴다. 쉽게 말하자면 표시하는 숫자를 8자리로 줄여서 계산량을 줄였다는 것이다. 가성비 AI를 만들기 위해서 많이 쓰이는 전문가 혼합방식(Mixture-of-Experts)이라는 많이 사용되는 기법도 사용해서 비용을 낮췄다. 또, 데이터를 수집하는 비용을 줄이기 위해서 AI가 만든 데이터를 학습에 사용했다는 것도 있다. 이 과정에서 오픈AI의 챗GPT가 만든 데이터를 사용했다는 의혹도 나오면서 지적재산권 침해 논란도 나오고 있다.
역대 가장 강력한 오픈소스 LLM
딥시크의 저렴한 개발 비용은 미국 AI 개발 회사들에게는 큰 충격이었다. 고성능 반도체도 없는데 더 낮은 가격으로 서비스를 한다니... 그럼 대체 이 AI를 만드는데 얼마나 낮은 비용이 든거지?
게다가 딥시크는 오픈소스 AI 이다. 그중에서도 MIT라이선스라는 허용도가 매우 높은 라이선스이다. 딥시크를 가져다가 마음대로 고쳐서 배포할 수 있고, 이를 이용해서 돈을 벌수도 있다. 오픈AI나 클로드를 쓰려면 API 사용료를 내야하지만, 딥시크는 이를 가져와서 자신의 서버에 두고서 무료로 사용할 수도 있다.
1월에 나온 딥시크 R1은 이른바 ‘사고력(Reasoning)’을 가지고 있는 AI이다. AI가 스스로 여러 번 생각해서 더 좋은 답을 내놓은 것이 특징이다. 이 사고력을 갖고있는 최초의 AI가 오픈AI가 지난해 9월에 공개한 o1 이다. 그런데 불과 4개월만에 딥시크가 사고능력을 갖고 있는 R1을 공개했다. 가격뿐만 아니라 성능에서도 미국 기업들의 AI를 따라온 것이다.
딥시크의 최대 피해자는?
엔비디아는 한 기업의 가치가 하루만에 가장 큰 규모로 사라진 기록을 세웠다. 880조원이 하루만에 사라졌다. 딥시크의 가성비 AI모델인 딥시크 V2가 나온 것은 2024년 5월. 중국에서는 딥시크V2 때문에 API가격 낮추기 전쟁이 벌어졌다. 그리고 V3가 나온 것이 2024년 12월. 그리고 R1이 공개된 것은 1월 20일. R1은 실리콘밸리에서 화제가 되기 시작했고, 그 주에 스위스 다보스에서 열린 세계경제포럼에서도 화제가 됐다. 이를 미국의 언론들이 대대적으로 보도하면서 딥시크는 실리콘밸리와 미국 전반에 크게 알려지게 됐다. 많은 부분에서 2023년 1월 다보스포럼 이후 전세계에 알려진 ‘챗GPT’와 비슷한 수순이다.
투자자들은 다음과 같이 생각했다. “반도체도 없이 훨씬 적은 비용으로 고성능의 AI를 만들었다고? 그럼 엔비디아 GPU 필요없는 것 아냐? 엔비디아 실적이 떨어지고, 그럼 지금 주가가 너무 높은거 아냐?”
이런 우려 때문에 1월 27일 월요일에 엔비디아 주가는 하루만에 17% 폭락다. 880조원이 하루만에 사라진 것이었다. 엔비디아뿐 아니라 AI인프라 관련 주식들이 모두 폭락했다.
딥시크와 제본스의 역설
그런데 하루 정도 시간이 지나보니 투자자들은 이런 것을 알게됐다. 먼저 V3 학습에 사용했다고 하는 80억원은 학습에 쓴 1회성 비용이다. GPU를 학습에 1회 사용한 비용만을 표시한 것이다. 반면 비교대상으로 쓰였던 빅테크기업들의 GPU 투자비용은 데이터센터를 건설하는 비용으로 이 데이터센터는 1번만 쓰고 끝이 아니라 다른 학습이나 추론에 계속 사용할 수 있고, 내가 안 쓰면 남들에게 빌려줄수도 있다. 심지어 80억원에는 인건비나 데이터를 모으는 돈도 포함되어있지 않았다.
두번째로 투자자들은 딥시크의 API 비용이 월등히 낮은 것에 주목했다. 이른바 제본스의 역설에 따라 비용이 낮아지면 전체 사용량은 더 늘어나게 되어있다. 딥시크처럼 AI를 직접 만들려는 회사는 더 늘어날 것이고, 딥시크 처럼 API 비용이 크게 낮아지면 이걸 가지고 할 수 있는 것도 많아지게 된다. 그렇다면 결국 전체 사용량은 증가하게 되는 것이다.
한국에서도 많이 사용되는 퍼플렉시티는 딥시크 R1이 화제가 되자 이를 자신들의 서비스에서 사용할 수 있게 했는데, 이는 오픈AI o1에 비해 저렴한 딥시크의 비용이 퍼플렉시티에게 큰 이점이기 때문이다. 더군다나 딥시크 R1은 오픈소스이기 때문에 이것을 미국 서버로 가져와서 작동시키면 데이터가 중국에 흘러갈 위험도 없다. 참고로 딥시크 R1의 사용료(출력기준)는 2.19달러, 오픈AI의 o1-미니는 12달러로 R1이 5분의 1 가격이다.
결국 엔비디아의 반도체 수요은 증가한다?
이런 점에서 투자자들은 딥시크의 등장이 오히려 엔비디아 반도체의 수요를 늘릴 수 있다고 판단했다. 하루만에 주가가 8%나 오른 이유다. 그런데 그 다음날은 또 4%나 하락했다. 이번에는 딥시크 때문에 미국 정부가 엔비디아의 GPU 중국 수출을 더 강화할 것이라고 생각했기 때문이다. H800 마저 팔수없게 될 수 있다는 것이다.
이렇게 보면 딥시크의 부상으로 가장 큰 피해를 본 것은 오픈AI와 앤스로픽 같은 AI스타트업 회사들이다. 딥시크의 등장으로 API 시장에서 점유율을 상당량 딥시크가 가져갔기 때문이다. AI 소프트웨어 시장에 딥시크라는 강력한 경쟁자가 나타난 것이다. 메타도 일부 피해를 봤다고 할 수 있다. 오픈소스 AI 1등이라는 자리를 딥시크에게 빼앗길수도 있게 됐다.
그런데 딥시크의 낮은 API 비용이 과연 합리적인 계산에서 나온 것인지는 의심스러운 부분도 있다. 딥시크라는 회사가 돈을 벌어야하는 회사가 아니라는 점에서 거의 마진이 없이 가격을 책정했을 수도 있다. 오히려 지금의 딥시크에게 필요한 것은 대중적으로 이름을 알리는 것과 중국시장에서 경쟁에서 승리하는 것이다.
그런 점에서 반도체 규제에도 불구하고 뛰어난 성능을 내놨고, 미국을 뒤흔들어 놨다는 것은 딥시크에게 엄청난 자산이 될 것 같다. 중국의 자존심을 전세계에 알렸기 때문에 이에 따른애국소비가 중국내에서 크게 늘어날 것이고, 정부에서도 딥시크를 정책적으로 더 밀어주게 될 것 같다.
딥시크가 아무리 가격이 싸다고 해도 미국에서 주류가 될 수는 없다. 심지어 구글의 제미나이는 API비용이 딥시크보다도 저렴하다. 제미나이 1.5플래시는 출력 기준 0.3달러, 이보다 가벼운 모델인 제미나이 1.5플래시-8B는 0.15달러다. 딥시크는 0.28달러. 심지어 구글의 제미나이 2.0은 아직 공개 전이다.
우리가 중국에 대해서 갖는 오해 중 하나는 중국이 수출 국가라는 점이다. 사실 중국기업들에게 최우선은 중국 내수 시장이다. 치열한 중국 내수시장에서 경쟁하다보니 세계 1위의 경쟁력을 갖게 됐고, 이를 바탕으로 세계시장에 진출하는 것이 지금 중국의 성공 방정식이다. 이는 AI도 다르지 않다는 것이다.
'돈이 되는 경제 이야기' 카테고리의 다른 글
'무작정 시작 해보기' 의 엄청난 위력, 스타벅스의 성공 스토리 (2) | 2025.02.11 |
---|---|
전력설비 산업 호황기 도래, 지금 투자해도 늦지 않았을까? (1) | 2025.02.07 |
공모주 따상은 이제 옛말, 이유가 뭘까? (2) | 2025.02.06 |
세계 금융시장을 뒤흔든 트럼프발 관세 전쟁의 본격화 (2) | 2025.02.04 |
CES2025 트렌드, 일상속으로 성큼 다가온 로보틱스의 대물결 (3) | 2025.01.24 |
CES2025 트렌드, AI 에이전트의 대거 등장~! 스마트안경 '할리데이' 주목 (2) | 2025.01.23 |
트럼프 취임 첫날, 뭐부터 바뀌나? (2) | 2025.01.21 |
전기차 폐배터리 ‘600조 시장’이 온다. 빛나는 검은 금가루 ‘블랙매스’ (2) | 2025.01.20 |
댓글