돈이 되는 경제 이야기

대표적인 이미지 생성형 AI 6가지를 소개합니다.

꿈달(caucasus) 2024. 9. 12.
728x90

 

# 이미지 생성형 AI 시장의 경쟁이 치열하다. 

# 달리, V6, 스테이블 디퓨전, 파이어플라이, 그록, 이마젠 등이 있다.

# 그러나 최근 xAI의 그록-2를 중심으로 딥페이크 관련 논란이 커졌다.

# 구글 등 AI 기업은 이미지 생성 AI의 안전장치를 강화하고 나섰다.

 

 

 

대표적인 이미지 생성형 AI 6가지를 소개합니다.

 

 

 

이제는 텍스트나 말로 원하는 이미지를 설명하면 인공지능(AI)이 척척 그림을 그려주는 시대가 되었다. AI 챗봇인 챗GPT의 등장과 함께 AI 기술이 급격하게 발전하면서 이미지 생성형 AI 시장의 성장도 빨라졌다. 대표적인 이미지 생성형 AI 6가지를 소개한다.

 

 

 

1. 달리(Dall-E)

챗GPT 개발사 오픈AI가 2021년 출시한 이미지 생성 AI로, 다양한 프롬프트(명령)를 입력해 원하는 이미지를 생성할 수 있다. 챗GPT와 연결돼 전체 맥락에 대한 이해가 뛰어나다는 장점이 있다. 특히 지난 15일부터는 챗GPT 유료 이용자만 사용할 수 있던 달리3을 무료 이용자에게도 일부 개방했다.

 

달리3 를 이용해서 만든 이미지

 

 

2. V6

미드저니의 이미지 생성 AI로, 편집 옵션이 다양해 일러스트레이션과 디자인 분야에 특화돼 있다. 하지만 커뮤니티 디스코드(Discord)를 통한 접속만 가능하고 영어에 최적화돼 있다는 단점도 있다.

 

미드저니를 이용해서 만든 이미지

 

 

3. 스테이블 디퓨전

스태빌리티 AI의 인공지능 모델로, 달리, 미드저니와 함께 3대 이미지 생성형 AI 모델로 떠오른 스테이블 디퓨전은 커스터마이징이 쉽고, 비용이 저렴하다는 장점이 있다.

 

스테이블 디퓨전을 이용해서 만든 이미지

 

 

4. 파이어플라이

어도비가 작년 9월 출시한 이미지 생성 AI다. 100개 이상의 언어로 텍스트 프롬프트를 지원한다. 파이어플라이로 생성한 이미지는 저작권 문제없이 상업적으로도 안전하게 사용할 수 있다는 것이 장점이다.

 

파이어플라이를 이용해서 만든 이미지

 

 

5. 그록

일론 머스크가 작년 7월 설립한 xAI에서 선보인 AI 챗봇이다. 이미지 생성 AI가 탑재된 그록-2는 대학원 수준의 과학 지식을 평가하는 GP QA 벤치마크에서 56점을 기록해 챗GPT-4 터보(48점)와 구글의 제미나이 프로5(46.2)보다 높은 수준을 자랑했다.

 

 

그러나, 최근 그록은 딥페이크 문제의 중심에 섰다. 그록-2에 선정적이거나 혐오 논란을 야기할 수 있는 프롬프트를 입력해도 그대로 이미지를 제작해주기 때문이다. 머스크가 총기를 난사하고, 트럼프 전 대통령이 9.11 테러를 일으키는 듯한 이미지도 생성돼 인터넷상에서 유포되었다.

 

 

# 딥페이크

인공지능의 딥러닝(Deep Learning)과 가짜(Fake)를 합친 단어로, 인공지능을 이용해 사람의 이미지나 영상, 음성 등을 합성하는 기술. 딥페이크가 여러 분야에 악용되면서 부정적인 뉘앙스를 내포한 단어라고 착각할 수 있지만, 사실 딥페이크라는 용어 자체는 가치중립적이다.

 

그록을 이용해서 만든 이미지

 

 

6. 이마젠

구글이 개발한 이미니 생성형 AI. 최근 구글은 딥페이크 등을 예방하기 위한 안전성을 강화한 ‘이마젠3’를 출시했다. 작년 12월 ‘이마젠2’를 출시한 지 8개월 만이다. 구글은 이마젠3가 원하는 이미지를 언어로 설명하면 그에 맞는 이미지를 생산하는 텍스트 투 이미지(text-to-image) 생성에서 최고의 성능을 보이는 모델이라 자부한다.

 

 

특히 이마젠3는 안전성에 초점을 둔 모델이다. 유해한 이미지 생성은 사전에 차단하고, 유명인의 이미지는 생성 자체가 불가하도록 설정됐다. 또, 이마젠3로 생성한 이미지에는 디지털 워터마크가 표시되는데, 이를 통해 실제 이미지로 착각하는 것을 방지해 이미지 오남용을 막을 수 있다.

 

이마젠3를 이용해서 만든 이미지

 

 

이렇게 최근, 이미지를 생성하는 AI의 오남용 문제가 등장하면서 AI를 개발하는 기업들도 점차 안전장치를 추가하고 있다. 달리3는 공인의 이름을 포함해 이미지를 요청하거나 살아있는 예술가의 모습을 모방해달라고 요청할 경우, 이를 거부하도록 설정돼 있다.

 

 

728x90

댓글

💲 추천 글