<(24.03) Stable Diffusion AI실사 모델별 인물표현 차이 모음>
“Stable Diffusion AI실사 모델은 카드 꾸러미 같은것이다”
대단 한거마냥 얘기했지만 즉 카드 꾸러미 안에 들어간 내용으로만 조합이 가능한
데이터의 모음같은것이다
물론 AI의 성능이 우수하기에 어느정도 유추를 통해서 표현을 할수 있지만 표현의 한계가 있다
이번에는 몇가지 AI 실사 모델을 예시로 프롬프트에 어떻게 동작하는 모델이 좋은 모델인지
그리고 이 모델의 데이터들이 어떤 표현을위해서 만들어진것인지
몇가지 프롬프트를 분석해보면 예시로 분석이 다소 가능한 부분이 있다
물론 틀릴수도 있긴 하지만…
예컨대 말하자면 “한두가지 모델로 원하는 모든 경우는 표현할수 없다”
이것이 현재의 Stable Diffusion AI실사 모델의 한계점이다
반대로 말하자면 내 입맛대로 용도대로 커스텀이 가능하다는 점이 큰 장점이기도 하다
* Stable Diffusion 줄여서 SD라고 축약
Stable Diffusion AI실사 모델 소개
RealisticVision
서구권 인물의 데이터셋을 학습해놓은
사실적인 표현에 굉장한 강점이 있고 인기가 많은 모델이다
picxReal
동일한 서구권 인물 데이터셋을 학습해놓은 사실적인 표현의 모델
MajicmixRealistic
동양권 미인형 데이터셋을 학습해놓은 모델로 출력물이 굉장히 많이 돌아다닌다
중국인 모델 제작자가 제작한 만큼 중국형 미인형 인물이 출력된다
beautifulRealisticAsian
일본인 모델 제작자가 제작한 BRA 시리즈로 꽤 꾸준히 업데이트 되는 모델이다
AI틱한 고정된 매력을 최대한 배제하고 자연스러우면서도 아름답다고 느끼는
형태가 목표라고 한다
모델상세 페이지
해당 모델들에 대한 정보는 CIVITAI에 업로드 되어있으니
찾아보고 모델을 한번 활용해보시는걸 추천드린다
무상으로 이러한 모델을 제작해준 모델 제작자들에게 감사도르
Stable Diffusion AI실사와 다른 AI실사의 차이
DallE-3 (빙 이미지 크리에이터)
마이크로 소프트의 빙 이미지 크리에이터이다
상세한 프롬프트의 설정이 없이 간단한 문장 몇줄로
퀄리티 높은 표현들이 가능한 모델로 활용성이 높은편
앞에 실사모델을 소개한 프롬프트를 보자면 다음과 같다
(realistic, realistic background, high resolution, distinct image:1.2), (detailed light, detailed shadow:1.2), (F4, 1/800s, ISO 100, RAW, in magic hour, dynamic angle, depth of field), __thePromptBuilder_v13/camera_shot2__, (On the way to work in the city center of Manhattan, USA, paparazzi concept photoshoots in huge crowds), beautiful cuite Spanish girl, __thePromptBuilder_v13/face_expression__, windy whether, __M/헤어__, (Bodycon Dress: Opt for a form-fitting bodycon dress that accentuates your curves and highlights your figure)
*굵은선으로 표시한건 와일드 카드, 프롬프트가 아니다 추후 설명
이전에 말씀드렸던 프롬프트를 분석하는 방법을 아신다면 이 영단어 모음집들이
무엇을 말하는지 잘 아실것이다
같은 프롬프트라도 이걸 다른 프로그램에 동일하게 입력하여도 출력된 내용은 굉장히 상반된다
차이 분석 BRA Vs DallE-3
이렇게 비교해서 보면 차이는 극명하다
- 피부의 질감표현 피부의 빛 반사와 질감 텍스쳐에 대한 표현
- 광원이 들어오는 방향의 표현 현실감에 큰 척도중 하나는 빛이다
- 디테일에 대한 표현 얼굴 이목구비 빛 헤어의 질감과 표정표현
용도에 따라서 취사선택은 가능하지만 상세한 모델표현이 필요하다면 역시 아직은 SD를 선택할수밖에 없다
만약 제한없는 극 사실사주의 이미지 출력물이 필요하다면 SD를 사용
간단한 리소스로만 사용하면어 어느정도 퀄리티 라면 마소의 빙 AI를 사용
서구권 모델과 동양권 모델의 차이
지향점이 다르다
그간의 수많은 모델들을 사용해본 바로 느끼자면
배경이나 사물 그리고 전체적인 현실감각에 훨씬 집착적인것이
서구권에서 만들어진 모델이다 그렇다고 동양권모델이
요즘에는 배경이 구리다거나 빛표현이 구리거나 그러지는 않은데
예시를 들어보자면 이말에 감이 확 오게되는데
현실적인 아름다움을 추구하는것이 서구권 지향이지만
초현실적 아름다운 “인물”에 초점이 많이 가있는것이 동양권 모델의 특징이다
왜 이런 차이가 나타나는 걸까?
이유는 단순하다
해당 단어에 사람들이 떠올리는 심상이 다르기 때문인데
일반적으로 동양권에서 Beautiful 라는 의미는 이목구비가 뚜렷하고
청순하면서도 여성적인 매력을 가지고 있는 의미의 데이터가 많이 존재한다
하지만 서양권은 어떨까? Beautiful이라는 의미가 우리가 생각하는것과 동일할까?
조금 다를수도 있다 기본적으로 서구권에서는 극동아시아에 비해서
다양한 인종들이 살아가고 있기도 하고
미의 기준도 복잡하다 단순히 “아름다운” 이라는 단어만으로 우리가 생각하는 정도의
차이가 나오지 않는다
체형에서도 그런 차이가 많이 드러나는데 재미있는 체형 표현인
“Curvy body”를 예로 들어보자
Curvy Body
동양에서 말하는 매력적인 몸매랑 서구권에서 생각하는 매력적인 몸매의 차이가
이런 단어에서 두드러 진다
한번 다시 동일한 프롬프트로 curvy body라는 단어만 추가해서 모델별 차이를 살펴보자
RealisticVision(서구권 모델)
서구권에서 바라보는 매력적인 체형이란 의미는 이정도의 느낌이 강하다
건장하면서도 풍만한 체형인데 배나 팔쪽 체형을 살펴본다면 조금 체격이 있는편을
확실하게 선호하는 공통된 의식의 미의 형태가 이러한것 같다
턱의 형태를 보면 조금 각진 형태에 광대가 나온것을 알 수 있는데 이건
Beautiful 이나 attractive와 같은 단어를 인물을 설명할때 같이 딸려나오는 특징
MajicmixRealistic(동양권 모델)
그에반에 동양권의 매력적인 체형이란건 머리가 작고 턱선이 갸름하고 코가 오똑하고
팔다리는 가는데 반해서 가슴이나 엉덩이는 어느정도 표현을 해준다는점이 다르다
건장한 체격보다는 마른데 반해서 여성미가 짙게 나타나는 것을 더 선호한다고 알수있다
picxReal(서구권 모델)
이 모델의 경우 현실적인 사진출력이 좀더 목적성이 강하다 보니
출력된 이미지를 살펴보아도 셀럽의 미형보다는 확실히 좀더 현실적인 형태에 집중한다
조금 나온 배가 아무래도 좀더 어필이 되는 모습인듯 하다
크롤링된 데이터셋이 인터넷 셀럽들 보다는 폭넓은 사람들의 형태를 학습한듯 하다
beautifulRealisticAsian(동양권 모델)
일본인 모델러가 제작한 BRA 시리즈는 중국계 모델과 다르게 전체적으로 동글동글한
귀여운 인상이 강한편인데 그에 반해서 Curvy body라는 프롬프트를 아무리 강조해도
*(프롬프트:1.2) 이런식으로 가중치를 조절할 수 있다
체형이 과하지 않게 출력된다
크롤링된 일본 웹상에서의 데이터셋이 기반한 매력적인 몸매라는것이 이 형태에 귀결되는듯
Stable Diffusion AI실사 모델 가중치 조절
가중치란?
실제로 Stable Diffusion AI실사 모델을 사용한 이미지를 출력할때에는
프롬프트 문법을 사용해서 가중치를 조절하는것이 가능한데
“아주 대단히 매력적인 사람”
이렇게 표현되는것이 아니다
(((Beautiful attractive people:1.5)))
이런식으로 표현된다
잠깐 설명하자면 괄호 ( ) 안에 있는 문장은 일반적으로 강조되고 우선순위가 되고
((( ))) 이렇게 3단으로 괄호를 한다는것은 아주 대단히 강조하고 최우선 순위로 나타낸다고 볼수있다
그렇다면 “:1.2” 이것은 무엇이냐고 물을 수 있다
쌍점 이후 숫자는 % 가중치라고 말할수 있는데
1.1 은 110%, 1.2 는 120% 강조라고 생각하시면 된다
이번에는 저 위의 네개의 모델이 아닌 다른 모델을 사용해서 가중치별 표현차이를 살펴보자
Stable Diffusion AI실사 모델 가중치별 출력
analogMadness(서구권 모델)
실사표현에 아주 큰 능력을 보여주는 아날로그 매드니스 모델을 사용해보자
이번에도 도심속 화보촬영 컨셉트의 maxi dress를 기본으로 잡고 몇단계를 확인해보자
가중치 1.0
가장 기본이 되는 기본강조 (curvy body:1.0) 의 결과물
이걸 기준으로 분석할것이기 때문에 이걸 원형이라고 생각하면 된다
단순히 비교만 확인할 예정이니 디테일이 뭉개진건 그냥 무시하도록 하자
가중치 1.1
시드를 고정했지만 디노이즈(다시 노이즈를 가해 업스케일링하는 정도) 때문인가
배경이 좀 바뀌긴 했다 중심이 되는 피사체의 변형은 그리 크지 않다 아직
가중치 1.2
아직 변화가 크게 느껴지지 않을수도있다
눈썰미가 좋으신분들이라면 뭔가 바뀌었다는걸 눈치챌수도 있는데
조금씩 강조한 문장이 반영되고 있는것이 보인다
가중치 1.3
슬슬 변화가 눈에 확연히 드러나고 있다 시드를 고정했음에도 불구하고
팔이나 전체적인 체형 그리고 배쪽에 집중해서 살펴본다면
변화가 이제 확연히 드러나기 시작한다
사실 1.3의 가중치는 꽤 높은 가중치이다
*시드를 고정했다는것은 가중치 1.0의 형태를 대부분 고정했다는 말
가중치 1.4
이렇게 변화를 살펴보면서 오면 하나는 확실해진다
“해당 프롬프트가 피사체 어떤부분에 직접적인 영향을 주고 있는지 확인”
이 부분이 확인이 가능해지기 때문에 프롬프트를 변화하거나 약화해서
Thin arms 라는 프롬프트 대신 {curvy body} 와 같은 약화 문법으로
팔다리를 얇게 그리고 마른 체형으로 표현할 수 있는 방법이 한가지 더 생긴것이다
5가지 가중치 변화 한눈에 살펴보기
자료를 확인해보면서 놀란것인데 체격이 늘어나면서 살이 접히는 부분에
표현이 강해졌다는 점을 알게되었다
별로 중요한 점은 아니지만 이런 디테일 표현도 따로 넣지 않아도
구현이 된다는점에서는 대단한 모델이다
정리
Stable Diffusion AI실사 모델별 인물표현 차이를 살펴보았다
중요한점을 정리해보자면
- 모델의 제작자가 크롤링한 데이터셋에 따라서 프롬프트별 출력물 차이가있다
- Beautiful과 같은 단어가 모두에게 동일한 심상을 나타내지 않는다
- 가중치에 따라서 영향을 받는 부위가 모델별로 차이가 있다
이정도로 간략하게 정리할수 있고
만약 취미로 배워보고 싶고 어떤모델이 가장 괜찮은것 같냐고 물어보신다면
24년 3월 기준으로는 Stable Diffusion AI실사 모델중에서는 다음과 같다
동양권 = beautifulRealisticAsian
추천이유 : 빼어난 인물표현 프롬프트가 별게 없어도 만족할만큼 범용성 넓은 표현
서양권 = RealisticVision
추천이유 : 사물, 동물, 배경, 인물 표현 모두 최상급의 우수한 모델 다만 동양권 인물은 다소 전형적이다