돈이 되는 경제 이야기

그림을 그려주는 인공지능(ai) 달리를 소개합니다.

꿈달(caucasus) 2022. 5. 10.
728x90

예전에 인공지능에 대한 주제로 포스팅을 한 적이 있습니다.

인공지능은 다양한 분야에서 이미 활약중인데요. 그 중에는 그림을 그리는 인공지능도 있다고 소개해드렸어요. 오늘은 그림을 그려주는 인공지능 중 하나인 ‘달리’ 에 대해 소개해드리려고 합니다.

 

달리가 작동하는 방식은 다음과 같습니다.

우선 사용자가 텍스트로 원하는 이미지를 입력합니다. 예를 들면 “강아지를 산책시키는 아저씨” 를 입력 한다면, 바로 내용을 반영한 그림이 그려집니다. 다른 예로 “아보카도 모양의 의자” 라고 입력하면 다음 그림처럼 다양한 산업용 이미지가 출력됩니다.

 

 

달리는 이미지가 마음에 들지 않으면 편집도 할 수 있다고 해요. “물속에서 트럼펫을 연주하는 테디베어” 라고 입력을 해보면, 내용을 반영한 그림이 나오는데 트럼펫이 별로라면 “물속에서 기타를 연주하는 테디베어” 라고 입력을 하면 됩니다. 트럼펫을 기타로 바꿔줍니다.

 

달리가 이렇게 그림을 잘 그리는 까닭은 1750억개 매개변수를 활용해 딥러닝을 한 GTP-3 라는 모델을 사용했기 때문이라고 합니다. 글자를 인식하고 이미지를 생성하는데 1280개의 토큰을 활용한대요. 여기서 토큰이란 개별 어휘의 한 기호입니다. 예를 들어 알파벳은 26자이니 토큰이 26개! 1280개 토큰이란 뜻은 1280개를 조합해 텍스트를 인식하고 이미지를 그린다는 뜻.

 

 

달리가 상업적으로 사용된다면, 패션, 산업, 웹툰, 캐릭터 등에 큰 변화가 올지도 모릅니다. 또 달리는 인체 내부에 있는 온갖 장기 조직과 그 세포들까지 그릴 수 있다고 하니, 의학적인 용도로도 사용 가능성이 크다고 합니다.

 

달리는 최근 4월에 한 차원 업그레이드되어 다시 선을 보였습니다.

지난해 1월에 처음 나왔을때보다 더욱 실력이 늘었다고 합니다. 달리1 이 그린 그림들은 어디선가 본 듯한 그림들이었다고 하는데요. 달리2가 그린 그림들은 아주 독창적이고 예술적으로 보인다고 합니다.

 

아래 이미지는 “우주 비행사가 말을 타고 달을 달리고 있다” 라고 입력을 했는데, 출력된 이미지라고 하네요.

 

 

1년 만에 나온 달리2 가 훨씬 발전한 이유는 사람들이 집어넣은 텍스트와 결과 값인 이미지를 인공지능이 학습했기 때문이라고 합니다. 예를 들어 “모자를 쓰고 타이핑을 하는 원숭이”라고 입력을 한다면, 인공지능은 원숭이 그림을 먼저 불러오고 이어 모자의 위치(원숭이 머리 위)를 지운 뒤 모자를 그리고 원숭이 손앞에 있는 배경을 지우고 다시 노트북을 가져다 놓는 작업을 한다고 해요. 개발사인 오픈에이아이에 따르면, 달리2는 달리1에 비해 4배나 더 높은 해상도로 작업을 할 수 있다고 합니다.

 

그런데, 이렇게 그림을 그려주는 인공지능이 상용화되면 우려되는 문제점들이 있습니다.

가령 달리가 의도하지 않은 이상한 그림을 그릴 수 있고, 사회적으로 편견 있는 그림을 그릴 수 있습니다.

 

예를 들어 “테러리스트 그려”하면 자동으로 중동쪽 이미지가 나올 수 있을지도 모릅니다.

또는 범죄에 악용될 소지도 다분하고요. 그래서 달리는 현재 모두가 사용할 수 있는 단계는 아니라고 합니다. 개발사에도 달리를 사용할 수 있는 인원을 400명으로 제한했다고 하네요.

 

하지만 달리와 같은 그림을 그려주는 인공지능이 제대로 쓰이기만 한다면 이로운 효과도 많습니다.

오픈에이아이에 따르면 “우리의 희망은 달리2가 사람들이 자신을 창의적으로 표현할 수 있도록 돕는 것”이라고 말했습니다. 인류에게 도움이 되는 인공지능이 사명이라는 것.

 

달리는 의료분야에서 초고해상도 사진을 얻을 수 있습니다.

이미지의 누락된 부분을 복원하거나, 아니면 질 낮은 이미지를 업스케일링을 통해 초고해상도 이미지로 변경이 가능하다고 해요. 또 노이즈도 제거할 수 있고.

 

MRI 품질을 높이려면 방사선 양을 높여야하는데, 당연히 사람의 몸에 해롭습니다. 그래서 달리를 활용해 해상도를 높이고 누락된 부분을 복원할 수 있는 것입니다.

 

이 같은 그림 인공지능은 패션분야에서도 활용 가능합니다. 가상의 패션 모델을 만들어주거나 그림 속 얼굴이 움직이면서 말을 할 수 있을 수도 있습니다.

 

또는 동영상에 등장하는 인물만 살리고 배경을 제거하거나 반대로 배경만 남기고 인물만 나오게 할수도 있습니다.

 

앞으로 인공지능은 우리들의 생활속에 더욱 깊숙이 들어올 것 같습니다.

아무리 좋은 기술이라도 기술을 사용하는 인간이 어떻게 활용하느냐에 따라 이로울지, 해가 될지 결정되겠지요. 사회적 합의도 중요하겠고요. 어찌되었건 인공지능 산업의 대중화는 다가오는 메가트렌드임에는 분명해보입니다.

 

 

728x90

댓글

💲 추천 글