꿈달의 미국 주식 장기 투자

엔비디아와 TSMC의 블랙웰 양산 갈등, 누가 더 불리할까?

꿈달(caucasus) 2024. 10. 28.
728x90

엔비디아는 올해 3월 새 GPU인 블랙웰을 공개했다. 블랙웰은 놀랍게도 1년치가 모두 완판 됐다. 블랙웰은 현재 주력인 호퍼 시리즈의 H100과 H200을 잇는 차세대 칩이다. 연내 양산이 목표라고 하니, 1년 가까운 시간을 기다리겠다는 고객들이 문전성시다.

 

 

 

블랙웰을 소개하는 젠슨황 엔비디아 CEO

 

 

 

엔비디아는 “MS 애저가 GB200 기반 AI 서버를 갖춘 블랙웰 시스템을 구동하는 첫 클라우드 솔루션 제공업체가 됐다”고 자평했다. 2024년 3월 18일. 엔비디아 개발자를 위한 연례행사인 GTC 2024에서 젠슨 황은 새 GPU인 블랙웰 B200과 이를 기반으로 만든 AI 슈퍼 칩 GB200을 전격 공개했다. 블랙웰은 미국의 수학자이면서 통계학자인 데이비드 해럴드 블랙웰의 이름에서 땄다. 블랙웰 B200은 연산 단위인 트랜지스터가 2,080억 개로 20페타플롭(PetaFlops) 성능을 내는 GPU다. 페타플롭은 1초당 1,000조 번의 수학 연산 처리를 할 수 있음을 뜻하는 컴퓨터 처리 속도 측정 단위다.

 

 

 

무려 초당 2경번에 달하는 연산이 가능한 것이다. GB200은 GPU인 B200 2대에 자체 개발한 CPU인 그레이스 1대를 결합한 슈퍼 칩이다. 또 SK하이닉스의 HBM 6대가 장착된다. 오픈AI의 챗GPT 근간이 되는 GPT-3.5를 기준으로, GB200은 종전 버전인 H100보다 성능이 7배 뛰어난 것으로 알려졌고, AI 학습 속도 역시 4배나 우수하다.

 

 

 

GB200 72개를 연결하면 하나의 슈퍼컴퓨터가 된다. 엔비디아는 이를 ‘GB200 NVL72’로 이름 붙였다. 즉 GPU 블랙웰 B200 × 2대 → 슈퍼 칩 GB200 × 72대 → 슈퍼컴퓨터 GB200 NVL72로 확장되는 구조다. 이런 슈퍼컴퓨터 여러 대를 연결하면 GPT-3.5와 같은 초거대 AI를 학습하는 데 필요한 AI 데이터센터가 된다. 젠슨 황은 효율을 강조했다. 특정 AI를 학습하는 데 종전에는 GPU 8,000개와 15MW 전력을 투입해야 했다면, 이제는 GPU 2,000개와 4MW만 필요하다고 설명했다.

 

 

 

 

하지만 문제는 양산이었다. 엔비디아처럼 AI 칩을 설계하는 업체는 TSMC처럼 파운드리 기업에 제조를 맡기는데, TSMC는 3나노·5나노와 같은 첨단 공정에서 무려 92%에 달하는 시장점유율을 차지하고 있는 독점 기업이다. 더인포메이션에 따르면, 엔비디아와 TSMC는 블랙웰 생산 차질 이유를 놓고 책임 공방을 벌였다.

 

 

 

파운드리 세계 시장 점유율 92%를 차지하고 있는 TSMC 대만 공장의 전경

 

 

 

블랙웰을 테스트하는 과정에서 TSMC가 납품한 반도체가 고장 난 것을 발견한 것이다. 엔비디아는 TSMC에 고장 이유를 문의했지만, TSMC는 책임을 엔비디아의 설계 탓으로 돌렸다. 하지만 엔비디아는 반도체 패키징 기술 오류로 간주하고 의심의 눈초리를 보냈다.

 

 

 

갈등은 이후에도 나타났다. 젠슨 황 CEO는 올 6월 TSMC를 방문해 엔비디아만을 위한 칩 온 웨이퍼 온 서브 스트레이트(CoWoS)라는 첨단 패키징 라인을 만들어 줄 것을 요구했다. CoWoS는 TSMC의 최첨단 후공정 기술이다. 하지만 한 TSMC 임원은 “엔비디아가 자금을 댈 것도 아닌데 쉽게 이야기 하지 말라”며 목소리를 높인 것으로 전해졌다.

 

 

 

분위기가 살벌해지자, 급기야 웨이저자 CEO가 급격히 말렸다. TSMC 입장에서는 엔비디아 요구를 들어줄 경우, 다른 고객들 역시 같은 요구를 할 가능성이 컸기 때문이다. TSMC는 애플, AMD, 퀄컴, 브로드컴, 소니, 인텔 등과 거래중이다. 엔비디아는 지난해 TSMC 매출의 10%를 차지해 애플에 이어 두 번째로 큰 고객사다.

 

 

 

문제는 AI 반도체 시장이 폭발적으로 성장하고 있어, TSMC가 엔비디아 생산 요구를 충족시키지 못하는 데 있다. 또 아쉬울 것 역시 없다. 엔비디아 3분기 매출액은 지난해 같은 기간보다 39% 늘어난 7597억 대만달러(32.4조원), 순이익은 54.2% 급증한 3253억 대만달러(13조8억원)를 기록했다. 2분기 순이익을 놓고 보면 엔비디아와 TSMC 두 회사가 비슷 비슷 하다.

 

 

 

TSMC는 2026년까지 매년 CoWoS 기반 칩 생산 능력을 60%씩 늘리겠다는 목표를 잡고 있다. 다만, 단기간에 생산 능력을 늘리기는 어렵다는 평가가 지배적이다. 현재 두 회사는 모두 고객들이 줄을 서서 기다릴 정도로 바쁘다. 엔비디아는 AI반도체 시장의 95%를 장악하면서 전 세계 기업 시가총액 2위에 올랐고 TSMC는 압도적인 파운드리 시장 1위로 선단공정 반도체에서는 시장점유율 92%를 차지하고 있다.

 

 

 

 

하지만 지금 상황을 객관적으로 평가하자면 엔비디아 측이 불리하다. TSMC는 엔비디아가 없더라도 다른 고객이 있지만, 엔비디아는 TSMC가 없다면 당장 제조를 할 수 없기 때문이다. 올 6월 TSMC가 가격을 인상했을 때도 엔비디아는 그대로 수용한 것으로 알려졌다. 이미 블랙웰 1년치는 다 팔았는데, 제품이 도착하지 않는다면 도저히 방법이 없었기 때문이다.

 

 

 

상황이 이렇자 엔비디아는 TSMC에 대한 의존도를 낮추려는 조짐마저 보이고 있다. 더인포메이션은 “AI 반도체가 아닌 게임용 GPU를 삼성전자 파운드리 공정에서 생산하는 것을 논의하고 있다”면서 “다만 TSMC의 같은 세대에 비해, 20~30% 낮은 가격으로 생산하는 것으로 논의가 이뤄지고 있다”고 전했다.

 

 

728x90

댓글

💲 추천 글