티스토리 뷰

ChatGPT를 필두로 해서 AI 기반 생성 모델들이 너무 많이 쏟아져 나오고 있습니다. ChatGPT와 같은 텍스트 생성 AI모델만큼 사랑을 받는 기술이 있습니다.

 

'AI 이미지 생성기'

 

사용자가 그림에 소질이 없어도 간단한 프롬프트 하나에 우리가 원하는 그림을 실현한다는 것이 정말 놀랍기 때문인 것 같습니다. 대표적으로 MidJourney, Stable Diffusion, MS Bing Image Creator가 있는데요, 이 중에서 적어도 하나라도 사용해 보신 분들은 느끼셨겠지만, 사용자가 입력한 텍스트를 검토하고 해석하여 완전히 새로운 미술 작품을 생성할 수 있는 능력을 갖추고 있습니다. 이 글에서는 세 가지 AI 이미지 생성기인 MidJourney, Stable Diffusion, Microsoft Bing Image Creator를 소개하고, 같은 프롬프트를 입력했을 때 어떤 결과가 나오는지 비교한 자료를 보여드리겠습니다.

 

 

 

MidJourney (미드저니)

 

 

Midjourney

An independent research lab exploring new mediums of thought and expanding the imaginative powers of the human species.

www.midjourney.com

 

MidJourney는 데이비드 홀츠가 설립한 AI 아트 제너레이터로, 머신러닝을 통해 기존 아트워크의 패턴과 특징을 식별하여 새로운 아트워크를 제작하는 데 사용할 수 있습니다. 그래서 MidJourney의 트레이닝 세트에 다른 아티스트의 저작권이 있는 작품이 포함될 가능성에 대한 우려도 있습니다. 

MidJourney의 인기가 높아지면서 이 기술의 창업자 Holz는 기술과 예술 및 사회에 미치는 영향에 대한 자신의 인사이트를 공유하고 있는데요, 그는 예술가들을 MidJourney의 고객으로 보고 경쟁자가 아니라고 말하며, 이 플랫폼이 아이디어 단계에서 창의성과 실험을 더욱 확장할 수 있다고 주장합니다. Holz는 미드저니가 인간의 능력을 대체하는 것이 아니라 향상하기 위해 설계되었다고 강조하며, 자동차에 비유하여 자동차가 인간보다 빠르다고 해서 다리를 잘라내야 하는 것은 아니라고 설명하고 있습니다.

 

Stable Diffusion 

 

 

Stable Diffusion Online

Stable Diffusion Online Stable Diffusion is a latent text-to-image diffusion model capable of generating photo-realistic images given any text input, cultivates autonomous freedom to produce incredible imagery, empowers billions of people to create stunnin

stablediffusionweb.com

 

Stable Diffusion 역시 텍스트를 기반으로 이미지를 생성하고 수정하거나, 저해상도 또는 저디테일 이미지의 세부 사항을 채울 수 있는 오픈소스 머신러닝 모델입니다. 수십억 개의 이미지로 훈련되어 있으며, DALL-E 2와 MidJourney에서 얻을 수 있는 이미지와 비교할 수 있는 이미지를 생성할 수 있습니다.

Stable Diffusion은 LMU 뮌헨의 CompVis 그룹에 의해 개발된 잠복 확산 모델로, 이전에 Stable Diffusion에 사용된 잠복 확산 모델 아키텍처를 만든 Patrick Esser와 Robin Rombach에 의해 설계되었습니다. Stable Diffusion은 Windows 및 Apple 기기를 포함한 다양한 플랫폼에서 사용할 수 있고, 앱에서 기기 내 사용을 하면 사용자 개인 정보를 보호할 수 있어, 서버 기반 접근 방식보다 바람직합니다. 

 

Microsoft Bing Image Creator

 

 

Bing

Bing은 지능적인 검색 기능은 사용자가 원하는 정보를 빠르게 검색하고 보상을 제공합니다.

www.bing.com

 

Bing Image Creator는 Microsoft의 Edge 내에서 직접 사용자가 창조성과 자기표현을 불러일으키기 위해 만든 창작 도구입니다. 이 Bing Image Creator를 사용하면 사용자는 생활 업데이트를 공유하거나 그 외 필요한 목적에 맞는 개성 있는 이미지를 만들 수 있습니다. 사용자는 Microsoft Edge의 사이드바에서 Image Creator에 쉽게 액세스 할 수 있습니다.

미드저니나 스테이블 디퓨전과의 가장 큰 차이점을 꼽는다면 바로 '도덕성'입니다. Bing Image Creator의 경우, 도덕적으로 사용되도록 조치를 개발되어서, 불쾌한 콘텐츠의 확산을 촉진하지 않도록 하였습니다. MS는 Image Creator 사용에 대한 내용 정책을 설정하고, 이 정책을 위반하는 사용자를 신고할 수도 있습니다. 게다가 Microsoft는 생성 이미지 기술에서 발생할 수 있는 편향을 해결하기 위한 기술을 도입했습니다.

 

 

AI 이미지 생성기 직접 비교

 

그럼 이제 이 세가지 이미지 생성기가 같은 '명령어'에 어떤 그림들을 가져오는지 'GEEKFLARE'라는 사이트에서 비교한 자료를 보여드리겠습니다. 영어로 입력된 명령어를 한글로 바꿔서 비교해 보았습니다. 

 

MidJourney vs Stable Diffusion vs MS Bing Image Creator

 

따뜻하고 화창한 날 고속도로에서 순록이 끄는 썰매를 타고 있는 모던한 산타클로스

 

AI 이미지 생성 비교 1
AI 이미지 생성 비교 1

 

큰 눈을 가진 동물의 순수하고 귀여운 클로즈업 샷

 

AI 이미지 생성 비교 2
AI 이미지 생성 비교 2

 

인간 우주 비행사가 새로운 행성에 착륙하는데, 외계 생명체가 적대적으로 환영하는 모습

 

AI 이미지 생성 비교 3
AI 이미지 생성 비교 3

 

뉴욕을 배경으로 한 소설의 책 표지를 대담하고 밝은 색상의 현대 추상 예술

 

AI 이미지 생성 비교 4
AI 이미지 생성 비교 4

 

가난하고 실업자가 된 '일론 머스크'

앞서 말씀 드렸듯이 도덕적으로 편향된 명령어를 입력했을 때, Bing Image Creator의 경우에는 정책적인 이유로 이미지를 생성할 수 없다는 팝업창과 함께 이미지를 생성하지 않고 있습니다. 

AI 이미지 생성 비교 5
AI 이미지 생성 비교 5

 

마무리

 

여기까지 요즘 대세인 AI 이미지 생성기인 MidJourney, Stable Diffusion, Microsoft Bing Image Creator를 소개하고 비교했습니다. 이 도구들은 정말 놀라운 정도로 현실감 있는 이미지를 생성하며, 사용자의 창의력을 자극하고 새로운 아이디어를 생각하는데 도움을 주고 있습니다. 그러나 이러한 기술의 발전에 따라 저작권, 도덕성, 편향성과 같은 문제가 동시에 제기되고 있습니다. 기술이 발전할수록 이런 문제점들도 하나하나 해결해 나갈 것이라고 기대합니다.

이 글이 도움이 되셨다면, 주변 분들과 공유해 주시고, 오늘도 즐거운 하루 보내세요~!