(24.03) AI그림 AI실사 프롬프트 실전활용 프롬프트 분석 : 훈련하는 여성 배구선수(Feat. StableDiffusion)

<(24.03) AI그림 AI실사 프롬프트 실전활용 프롬프트 분석 : 훈련하는 여성 배구선수(Feat. StableDiffusion)>

AI그림 AI실사 프롬프트 실전활용 프롬프트 분석
AI그림 AI실사 프롬프트 실전활용 프롬프트 분석
AI그림 AI실사 프롬프트 실전활용 프롬프트 분석
AI그림 AI실사 프롬프트 실전활용 프롬프트 분석
SD를 이용해 출력한 사진들

AI그림 AI실사 프롬프트 입력하여 출력된 결과물들입니다.

최근에는 기술력이 많이 좋아져 SD(Stable diffusion)이 아니더라도 니지저니, 미드저니등

기술력이 좋아진 Nai까지 그리고 많은 커뮤니티 사이트에서도 ai 짤방과도 같은걸 지원하고 있습니다

하지만 니지저니나 미드저니도 “프롬프트”를 입력하여 원하는 출력물을

얻는다는 기본구성에서는 똑같다고 할 수 있습니다.

AI그림 AI실사 프롬프트

(24.03) AI그림 AI실사 프롬프트 실전활용 프롬프트 분석 : 훈련하는 여성 배구선수(Feat. StableDiffusion)
WebUI 화면

스테이블 디퓨전의 WebUI 화면입니다.

노란색 네모박스가 프롬프트

초록색 박스가 네거티브 입니다.

대부분의 인터넷에서 그림을 만드는 방식은 스테이블 디퓨전의 방식을 많이 채용하고있습니다

기본적으로 모델설정, VEA설정, DT설정, BMAB등 다양한 익스텐션이 있지만 이번에는

프롬프트에 한해서만 설명드리도록 하겠습니다.

사용된 프롬프트는 아래와 같습니다

thePromptBuilder_v13/photo_style, (realistic, realistic background, high resolution, distinct image:1.2), (detailed light, detailed shadow:1.2), (analog photo, rich color, film grain:1.2), (F4, 1/800s, ISO 100, RAW, in magic hour, dynamic angle, depth of field), (wide side shot, {cowboy shot|facial|upper body}, {from below|from above|from forward}), (A city in Milan, Italy, on a sidewalk in the city with crowds, street lights, and traffic lights), attractive blonde caucasia girl sweetheart beautiful gorgeous sexy face and curvy body medium breast, gentle smile, soft windy weather, summer casual dress

상당히 복잡하죠? 하지만 구분지어서 나눠서 본다면 그리 어려운 내용도 아닙니다

퀄리티 프롬프트

먼저 그림에는 퀄리티를 설정하는 프롬프트가 앞에 오게 됩니다.

(realistic, realistic background, high resolution, distinct image:1.2), (detailed light, detailed shadow:1.2)

이 프롬프트는 AI그림 AI실사 프롬프트에 동일하게 사용되는 프롬프트 입니다

현실적인 그림, 현실적인 배경과 고해상도 이미지 그리고 사실적인 빛 표현에 관한 내용입니다

스테이블 디퓨전은 엄청 세세한 설정이 가능한 만큼 자유도가 높지만

이런 기본적인 퀄리트에 필요한 프롬프트를 처음부터 쌓아나가는것이 어렵게 느껴질수 있습니다.

퀄리티에 대한 명령이 설정되었다면

화풍 프롬프트

(analog photo, rich color, film grain:1.2), (F4, 1/800s, ISO 100, RAW, in magic hour, dynamic angle, depth of field)

화풍에 관련된 프롬프트를 쌓아줍니다

아날로그 사진, 풍부한 색감, 필름그레인 부분은 현실적인 사진의 느낌을 만들어내기 위해 사용됩니다

아날로그 사진이라는 프롬프트를 사용하게 되었을때 현실감이 배가되지만

채도가 빠져버리는 단점을 rich color로 보완해주는 역할입니다

(F4, 1/800s, ISO 100, RAW, in magic hour, dynamic angle, depth of field)

특히 이 부분은 카메라 옵션설정 입니다

in magic hour는 사진이나 영상 촬영시에 가장 잘나온다는 대명사인 매직아워라는 내용을 넣어준것이고

뎁스 오브 필드는 원근감에 대한 설정으로 전문 촬영사진같은 느낌을 넣어주기 위해 채용하게 됩니다.

사진의 구도

(wide side shot, {cowboy shot|facial|upper body}, {from below|from above|from forward})

와이드샷은 피사체와 배경을 같이 포함하기 위한 프롬프트로

wide side shot은 무조건 채용되는 프롬프트이고 { } 중괄호의 경우 내부 | 로 구분된 내용중

랜덤하게 채용하게 됩니다

카우보이샷은 상체촬영구도이고 페이셜은 얼굴사진 어퍼보디는 상체 배 위쪽을 찍는 내용으로

시점에 대한 프롬프트가 from 이후에 있는 내용들입니다 여러장 출력시 대상내용들이 랜덤하게 채용됩니다

일종의 프롬프트 문법을 사용한것입니다

배경 프롬프트

(A city in Milan, Italy, on a sidewalk in the city with crowds, street lights, and traffic lights)

밀라노 도시 인도, 관중들, 가로등, 신호등 같은 세세한 사물의 설정을 포함해주게 될수록

출력되는 배경의 사실감을 더해줄수 있습니다

인물 프롬프트

attractive blonde caucasia girl sweetheart beautiful gorgeous sexy face and curvy body medium breast, gentle smile

매력적인 여성이란 말로 퉁쳐버린다면 생각보다 부족한 외형으로 출력되게 되는데요

매력적인, 금발, 코카시안, 여성, 아름다운 얼굴과 굴곡진 체형의 여성이라는 세세한 설정을 통해서

매력적인 피사체를 만들수 있습니다

최근에는 모델이 많이 발전함에 따라서 이렇게까지 세세하게 넣지 않아도 필요한 만큼

매력적으로 나오긴 하나 일단 보험같은 느낌으로 채용해 보았습니다.

부가적인 프롬프트

soft windy weather, summer casual dress

바람부는 날씨로 자연스러운 현실감을 만들어보기 위해서 채용하였으며

피사체의 의상에 대해서 간략하게 설명한 내용입니다

네거티브

네거티브는 이건 뽑지 말아라 하는 부정적 프롬프트 입니다

(low quality, worst quality, extra fingers, deformed hands, polydactyl:1.5), (monochrome, grayscale:1.5), bad-picture-chill-75v, realisticvision-negative-embedding, negative_hand-neg, ng_deepnegative_v1_75t

해당 내용에서는 반대로 낮은 퀄리티의, 많은 손가락의, 흑백의 사진을 지양하기 때문에

관련 네거티브를 채용하였고

bad-picture-chill-75v, realisticvision-negative-embedding, negative_hand-neg, ng_deepnegative_v1_75t

이부분은 로라라는 부분인데 일종의 함축 프롬프트입니다

추후 기회가 된다면 설명드리도록 하겠습니다

정리하자면 다음과 같습니다

AI그림 AI실사 프롬프트 작성요령

퀄리티, 화풍, 구도, 배경, 인물, 부가적인 프롬프트

의 순서대로 크게 생각하시면 됩니다

이렇게 해부해서 본다면 사실 그리 복잡한 내용은 아니라는 부분이 설명이 됩니다.

모델에 따라서 큰부분에서의 틀이 결정되기 때문에

사실 프롬프트만으로 만능으로 구사하기는 어렵습니다

모델에 대해서 간략한 설명

모델이라는것은 AI에게 학습시킨 자료로서

해당 자료내 AI가 추론할수 있는 데이터를 넣어주는 방법입니다

해당 모델내에 동양인에 대한 자료가 부족하다면

상투적인 동양인에 대한 표현만 나오게 되고

해당 모델내에 배경이나 사물에 대한 데이터가 부족하다면

아무리 익스트림리 하이 퀄리티라고 적어도 배경에 대한 표현이 굉장히 부족해지게 됩니다

프롬프트를 잘 구성하는것은 전반적인 그림출력에 있어서 중요하지만

스테이블 디퓨전의 경우 모델설정도 7할이상의 중요한 내용이라고 볼 수 있습니다.

다른 그림 프롬프트 분석해보기

(24.03) AI그림 AI실사 프롬프트 실전활용 프롬프트 분석 : 훈련하는 여성 배구선수(Feat. StableDiffusion)
Civitai 모델 예시

스테이블 디퓨전의 모델들이 올라오는 CIVITAI 입니다 링크는 하단에 기재해두겠습니다

<CIVITAI>

(masterpiece, best quality, highres:1.2), (photorealistic:1.2), (detailed light:1.2), (dynamic angle) raw photo, (80yo Old Man), friendly face, sitting in a chair, public park, give food to the pigeons, sunset lighting, serene atmosphere, (sharp), exposure blend, bokeh, (hdr:1.4), high contrast, (cinematic), (muted colors, dim colors, soothing tones:1.3)

해당 그림의 프롬프트 입니다.

앞서 말씀드린 방식으로 프롬프트를 분석해보면 방식은 거의 비슷합니다

퀄리티 : (masterpiece, best quality, highres:1.2), (photorealistic:1.2), (detailed light:1.2), (hdr:1.4)

화풍 : raw photo, (sharp), exposure blend, bokeh, high contrast, (cinematic), (muted colors, dim colors, soothing tones:1.3)

인물 : (80yo Old Man), friendly face, sitting in a chair

부연설명 : public park, give food to the pigeons, sunset lighting, serene atmosphere

저와 다르게 피사체를 중간에 넣고 이후에 퀄리티나 화풍에 대한 내용을 보충했습니다.

대부분의 프롬프트를 구성하는 방식은 전체적인 부분에서

디테일한 부분으로 확장해 나가는 방식을 사용합니다.

앞서 말씀드린 AI그림 AI실사 프롬프트를 작성하는 요령에 대해서

다시 생각해본다면 그리 어렵진 않으나 익숙치 않은 영어가 장벽이 될수도 있습니다

어차피 개떡같이 말해도 찰떡같이 알아듣는 AI에게 어느정도 랜덤성을 부여할수도 있습니다

다른 AI 그림 이미지 생성 플랫폼에서는?

접근성이 좋고 사용하기 편한 빙 이미지 크리에이터도 잘 활용될 수 있습니다

<빙 이미지 크리에이터 사용>

해당 AI는 DallE-3 라는것이지만 사실 그런건 중요한건 아닙니다

프롬프트를 생성하는 방식이 꽤나 비슷하기 때문에

좀더 간편하게 생성이 가능합니다

예시를 살펴보도록 하겠습니다

(24.03) AI그림 AI실사 프롬프트 실전활용 프롬프트 분석 : 훈련하는 여성 배구선수(Feat. StableDiffusion)
빙 이미지 크리에이터

90’s japanese animation concept, super attractive body korean girl, 하늘색 톤, 청자켓과 하얀색 캐미솔 그리고 청바지와 선글라스를 쓰고, 창공의 이미지가 섞인 전체적인 의상, 가로등 불빛아래 어두운 저녁의 대한민국의 도심속 길거리에서

사용된 프롬프트 입니다 관련 이미지로 작성한 내용은 아래 달아두었습니다

<빙 이미지 크리에이터 활용>

이제 다시 설명하지 않아도 아실만큼 숙달이 되셨다면

인물 : super attractive body korean girl, 청자켓과 하얀색 캐미솔 그리고 청바지와 선글라스를 쓰고

화풍 : 하늘색 톤, 90’s japanese animation concept

배경 : 창공의 이미지가 섞인 전체적인 의상, 가로등 불빛아래 어두운 저녁의 대한민국의 도심속 길거리에서

이렇게 구성되었다는걸 알 수 있습니다.

빙 이미지 크리에이터에 경우 기본적으로 중간 이상의 퀄리티가 보장되어있기 때문에

퀄리티에 대한 프롬프트는 빠져있습니다.

핵심내용 정리

  1. 프롬프트는 큰것부터 작은것으로 쌓아간다
  2. 퀄리티, 화풍, 구도, 배경, 인물, 디테일 순서로 쌓아간다

정리해서 말씀드리자면 별것없지만

많이 출력하시고 사용하시다 보면 이 프롬프트라는 영역에서의 요령이 유사한 부분이 많다는 사실을

알수있습니다. AI그림 AI실사 프롬프트 뿐만 아니라 Chat GPT에도 어느정도 사용가능한 내용입니다.

다음에는 스테이블 디퓨전 기반의 모델 특성과 그것이 어떻게 반영되는지에 얘기해보고자 합니다

부족한 글 봐주셔서 감사합니다

여기까지 AI그림 AI실사 프롬프트 실전활용 프롬프트 분석편이였습니다.

<같이보면 좋은 글>