꿈달의 미국 주식 장기 투자

오픈 AI의 새로운 AI 모델 GPT-4o 핵심요약

꿈달(caucasus) 2024. 5. 22.
728x90

* 오픈 AI가 새로운 생성형 AI 모델 GTP-4o를 선보였다.

** 더욱 고도화된 기능에 시장의 반응이 호의적이다.

*** AI 기술의 주도권을 두고 경쟁사의 긴장이 높아지고 있다.

 

 

GPT-4o 로고

 

 

지난 5월 13일(현지 시각), 챗GPT 개발사 오픈AI가 챗GPT의 신규 버전 ‘GPT-4o’를 공개했다. 샘 올트먼 오픈AI CEO는 “영화에 나오는 AI 같은 느낌”이라고까지 말했다. 왜냐하면 이번에 공개된 GPT-4o는 텍스트는 기본이고, 사람처럼 시각과 청각을 바탕으로 추론하고 말하기 때문이다.

 

 

오픈AI의 GPT-4o는 이용자와 실시간 음성 대화가 가능한 AI 모델이다.

챗봇 형태로 주로 텍스트를 통해 질문과 답변을 주고받았던 기존 모델에서 한층 업그레이드됐다. 평균 응답 시간이 약 0.23초, 인간의 평균 답변 속도(0.32초)와 거의 비슷하다. 감정을 공유하는 듯한 대화도 가능하고, 수학 문제 풀이와 언어 간 통역도 가능하다. 작년 11월 공개된 GPT-4 터보보다 속도는 두 배 더 빠르고 비용은 절반 수준에 불과하다.

 

 

 

# GPT-4o

GPT-4o의 ‘o’는 모든 것이라는 뜻의 ‘옴니/omni’를 뜻한다. 텍스트와 오디오, 비디오 AI를 통합한 멀티모달 AI 엔진이자, 모든 데이터를 다룬다는 점을 강조하기 위한 것이다.

 

 

공개된 GPT-4o와의 대화는 실제 인간과의 대화와 구분이 안 될 정도다.

소개 영상에서는 반려견이 등장하자 이름을 묻고 인간에게 털을 쓰다듬어달라고 요구하거나, ‘아재 개그’를 비웃고 잠을 재우기 위한 이야기를 들려주기까지 한다. GPT-4o는 5종류 목소리와 50개 언어를 지원한다. 한국어와 영어, 영어와 일본어 등 쌍방향 통역이 가능한 언어가 2,450개에 달한다.

 

 

ai에게 강아지를 보여주자 사용자에게 쓰다듬어 달라고 요청하는 영상

 

 

 

GPT-4o는 몇 주 내 정식 출시될 예정이지만, 개발자를 위한 API는 발표 당일부터 바로 이용할 수 있다. 오픈 AI는 개발자들이 새 모델로 애플리케이션을 구축할 수 있게 한다는 방침이다. 또, 모든 이용자에게 GPT-4o를 무료로 제공하겠다고도 했다. 챗GPT에 로그인한 사람이라면 누구나 무료로 사용할 수 있다. 미라 무라티 오픈 AI CTO는 “상호작용과 사용 편의성 측면에서 큰 진전을 이룬 것은 이번이 처음”이라고 말했다.

 

 

# API(Application Programming Interface)

외부 서비스의 기능을 다른 서비스에서도 사용할 수 있도록 정해둔 양식이다. 예를 들어 날씨 앱을 만든다고 가정하면, 기상청에서 제공하는 API를 활용해 기상청의 날씨 정보를 가져오는 식으로 활용한다.

 

 

과학기술계에선 GPT-4o로 인공일반지능(AGI)이 시작됐다며 환영하는 목소리가 들린다. 인간과 거의 구별할 수 없는 가상의 사람이 인간처럼 듣고, 보고, 추론하고, 말한다는 점에서 AGI라고 봐도 무방하다는 것이다. 그동안 AI는 실제 세상과 상호작용에 있어 제약이 있었는데, GPT-4o가 그 한계를 넘었다는 이야기가 나온다.

 

 

 

그러나 한편으로는 실질적인 기능 발전이 없는 ‘잘 짜인 쇼’에 그쳤다는 비판도 일고 있다. 모델 능력이 크게 향상된 게 아닌데도, 다른 빅테크 기업보다 더 큰 주목을 받기 위해 새로운 모델을 먼저 출시하려는 경쟁이 붙었다는 것이다.

 

 

오픈AI의 이번 발표에는 구글과의 AI 기술 경쟁에서 한발 앞서겠다는 의도도 엿보인다. GPT- 4o 공개가 구글의 연례 개발자 콘퍼런스(I/O) 하루 전날 이뤄졌기 때문이다.

 

 

지난 14일(현지 시각) 열린 구글의 I/O에선 제미나이가 도입된 검색 엔진을 비롯해 향상된 AI 기능이 대거 공개됐다. 업그레이드된 제미나이1.5 시리즈는 한 번에 처리할 수 있는 정보의 양이 한층 확대될 전망이다. 구글은 음성 모델 기반의 AI 비서 ‘프로젝트 아스트라/Project Astra’와 AI 사진 검색 기능인 ‘애스크 포토/Ask Photo’ 등도 선보였다.

 

 

오픈AI와 구글에 이어 애플도 다음 달에 세계개발자회의(WWDC)를 열고 AI 전략을 발표할 예정이다. 애플은 생성형 AI 기능이 탑재된 음성인식 비서 ‘시리’를 공개할 전망이다. 아마존 역시 다음 달 세계 최대 규모의 AI 모델 출시를 예고했다.

 

 

728x90

댓글

💲 추천 글