꿈달의 미국 주식 장기 투자

일론 머스크의 최신 AI 모델 그록3, 성능 얼마나 뛰어난가?

꿈달(caucasus) 2025. 2. 20.
728x90

지난 17일(현지 시각), 테슬라 최고경영자(CEO)인 일론 머스크가 소유한 인공지능(AI) 스타트업인 xAI에서 최신 AI 모델 ‘그록(Grok)3’를 공개했다. 지난 2023년 11월 자사의 첫 모델인 ‘그록1’을 선보인 지 1년 3개월 만이다. 당시에는 오픈AI와 아직 기술적 격차가 크다는 평가를 받았지만, 이번에는 경쟁사의 모델과 비슷하거나, 더 우수한 성능의 AI 개발에 성공한 것으로 보인다.

 

 

 

 

 

 

머스크는 그록3 공개 행사에 나타나 “전작(그록2)에 비해 10배는 유능해진 인공지능 모델이다”라며 세계에서 가장 똑똑한 AI임을 주장했다. 실제로 그록3는 고급 수학·과학·코딩 분야에서 GPT-4o, 클로드 3.5 소네트, 딥시크 V3 등 경쟁사의 모델보다 높은 점수를 받았다.

 

 

 

수학 능력을 평가하는 ‘AIME 2025’에서는 GPT-4o의 39점을 넘는 52점을 기록했고, 박사 수준의 과학 지식을 평가하는 ‘GPQA’에서도 75점을 받으며 GPT-4o의 65점을 넘어서는 등 성과를 거둔 것이다.

 

 

 

이날 시연에서 ‘그록3’는 복잡한 프로그래밍 작업을 척척 해냈다. 테트리스와 블록 색깔을 맞추는 두 가지 유형을 합친 게임의 프로그램 코드를 짜기도 하고, 지구에서 화성에 다녀오는 발사체 궤도를 물리학 계산을 기반으로 애니메이션 코드로 구현하기도 했다. xAI 측은 이 과정을 ‘생각(thinking)’이라고 부르며 강조했다.

 

 

 

 

‘그록3’는 텍스트를 넘어 이미지 처리까지 가능한 대형멀티모달모델(Large Modal Model, LMM)입니다. xAI는 이번에 작은 버전인 ‘그록3 미니’, 추론 모델인 ‘그록3 추론(Reasoning)’ , ‘그록-3 미니 추론’ 등 4가지 버전의 모델을 출시했다. 이 중 추론 모델은 그록3에 ‘생각’을 요청하거나, 더 어려운 질의의 경우 추가 컴퓨팅을 사용하는 추론을 위해 ‘빅 브레인(Big Brain)’ 모드를 사용할 수 있다.

 

 

# 대형멀티모달모델

텍스트, 이미지 등 다양한 형태의 데이터를 동시에 이해하고 처리할 수 있는 거대 인공지능 모델을 뜻한다.

 

 

 

xAI는 그록3를 기반으로 하는 AI 검색 에이전트 ‘딥서치(DeepSearch)’ 함께 공개했다. 단순히 검색을 대신해주는 것이 아니라, 사용자 질문의 의도를 파악하고 다양한 내용을 검토 후 정확한 정보를 전달해준다. 머스크는 딥서치가 구글로 1시간 동안 찾을 내용을 10분 이내에 더 좋은 품질로 가져다줄 것이라고 이야기했다.

 

 

 

 

xAI는 ‘그록3’의 훈련에 엔비디아의 최신 AI 칩 20만 장을 활용했다고 밝혔다. 이를 위해 미국 테네시주 멤피스에 있는 데이터센터를 증축했다. 첨단 AI를 만들기 위해 대규모 데이터센터의 필요성이 증명된 만큼, 앞으로 데이터센터 규모 확대 트렌드가 일어날 것이라는 전망도 나온다. 데이터센터의 규모가 커질수록 데이터 지연, 열관리 측면에서 효율적이기 때문이다.

 

 

 

다만, ‘그록3’의 한계도 지적되었다. 기존 모델 대비 성능이 개선됐긴 하지만, 압도적인 격차를 보여주진 못했다는 것이다. 기존 AI 사용자들에게 익숙한 음성 모드를 아직 지원하지 않는다는 점과 훈련이 완전히 끝나지 않은 베타 버전이었다는 점도 아쉬운 부분으로 꼽힌다. X(구 트위터)의 프리미엄 플러스 회원만 이용할 수 있다는 점도 접근성이 떨어지는 요인이다.

 

 

 

‘그록3’의 기술적 우위가 오래 지속될 가능성도 높지 않게 점쳐진다. 오픈AI도 이른 시일 내에 신규 AI 모델인 ‘GPT-4.5’와 ‘GPT-5’를 공개할 예정이기 때문이다. 샘 올트먼 오픈AI CEO는 “GPT-4.5가 OpenAI의 마지막 ‘비연쇄적 사고 모델’이 될 것이며, GPT-5가 AI의 모든 역량을 통합할 것”이라고 언급했다. 오픈AI는 텍사스에 대규모 데이터센터를 건설하는 등 다시 ‘그록3’를 넘어서기 위해 박차를 가하고 있다.

 

 

728x90

댓글