Recommended Posts

SORA 이미지 생성을 위한 프롬프트 제작 가이드

 

SORA 이미지 생성을 위한 프롬프트 제작 가이드




0. 이 문서의 목적과 범위

이 매뉴얼은 Sora로 “이미지”를 생성할 때(또는 같은 문법을 활용해 짧은 영상으로도 확장할 때) 프롬프트를 정확하고 재현 가능하게 작성하는 방법을 단계별로 설명합니다. 각 절은 “무엇을 써야 하는가(필드)” → “어떻게 써야 하는가(표현 규칙)” → “실전 예시(복사-붙여넣기)” 순으로 구성됩니다.
※ Sora는 텍스트·이미지·영상 입력을 받아 복잡한 장면, 정교한 동작, 현실 물리 규칙을 이해하는 방식으로 영상을 생성하며, 이미지 생성도 지원합니다. 기능과 한도(해상도/길이/프리셋 등)는 플랜과 시점에 따라 달라집니다. 최신 기능 개요와 정책은 OpenAI 공식 문서를 참조하세요. (OpenAI Help Center, OpenAI)


1. Sora 기본 사양 이해 (이미지 중심 + 영상 확장)

  • 입력 형식: 텍스트 프롬프트(필수) + 선택적 참조 이미지/영상. (OpenAI)

  • 출력 형식: 이미지 또는 영상. (플랜에 따라 영상 해상도·길이 제약 존재) (OpenAI, OpenAI Help Center)

  • 장점: 여러 인물·정밀 배경·특정 동작·카메라 연출을 이해해 표현. (OpenAI Help Center)

  • 이미지 생성 UI 힌트: 생성 전 종횡비(가로세로 비) 설정 가능(예: 3:2, 1:1, 2:3 등). (OpenAI Help Center)

  • 스타일 프리셋/스토리보드/리믹스(영상 작업 시): 프리셋으로 스타일 고정, 기존 영상을 Remix/Re-cut, Storyboard로 씬 설계. (이미지 작업에도 “스타일 프리셋” 개념·어휘는 유용) (OpenAI)

  • 정책 준수: 인물/브랜드/민감 주제 등 사용 정책 준수 필수. (OpenAI)

팁: 본 가이드는 “이미지” 기준으로 설명하지만, 동일한 프롬프트 구조를 사용해 짧은 영상으로 확장할 때도 효과적입니다(카메라/동작/시간 필드를 추가).


2. 프롬프트의 최소 구성(핵심 10요소)

아래 10개 블록을 짧은 문장/구로 채우면, 대부분의 이미지 생성이 안정적으로 재현됩니다. 필요 없는 블록은 생략 가능하되, 주제-구도-스타일은 가능한 항상 명시하세요.

  1. 주제(Subject): 무엇을, 누구를, 어떤 물체를

  2. 장면/무대(Scene): 어디서(환경·배경)

  3. 구도(Composition): 프레이밍/샷 크기/시점(하단 4. 참조)

  4. 카메라/광학(Camera & Lens): 초점거리, 조리개, 심도, 초점 대상

  5. 광원/조명(Lighting): 광원 종류·방향·강도·색온도

  6. 재질/질감(Materials/Surface): 표면, 결, 반사

  7. 색채/톤(Color & Tone): 팔레트, 대비, 콘트라스트, 감성 톤

  8. 스타일/장르(Style): 사진/일러스트/애니메/필름 룩/특정 미학(프리셋)

  9. 품질/세부(Detail & Quality): 해상감, 디테일 레벨, 노이즈 방향

  10. 제약/금지(Constraints): 제외할 것, 과장/왜곡 제한, 브랜드/텍스트 배제 등

영상 확장 시 11) 동작/움직임(Motion), 12) 시간/길이(Duration), 13) 카메라 무브(Camera Move), 14) 전환(Transition), 15) **리듬/속도(Pacing)**를 추가합니다. (플랜별 영상 길이·해상도 제한은 공식 페이지 확인) (OpenAI Help Center, OpenAI)


3. 권장 프롬프트 문법(문장 템플릿)

3-A. 단일 이미지 템플릿 (복사-붙여넣기)

[주제]를 [장면/배경]에서 촬영한 [스타일/장르] 이미지.
구도는 [샷 크기/시점/프레이밍], 카메라는 [초점거리/렌즈형태], 초점은 [포커스 대상], 심도는 [얕은/깊은] 심도.
조명은 [광원 종류/방향/강도/색온도], 컬러 톤은 [팔레트/대비], 재질·질감은 [핵심 표면 특징].
디테일은 [미세 디테일/자연스러운 텍스처], 품질은 [선명/클린], 아티팩트 최소화.
제약: [금지 요소/텍스트 배제/브랜드 노출 금지].
종횡비 [예: 3:2], 최종 결과는 [스틸 이미지].

3-B. 이미지+애니/일러스트 템플릿

[주제]를 [장면]에서 표현한 [애니/일러스트/카툰] 스타일의 스틸 이미지.
구도 [샷/시점], 라인 스타일 [굵기/클린], 채색 [평면/그라데이션/셀 셰이딩].
조명 [부드러운/하드], 팔레트 [키컬러 3~5개], 배경 디테일 [높음/중간/낮음].
제약: [텍스트/로고/워터마크 금지], [지시 불가한 요소 배제].
종횡비 [1:1/2:3/3:2 등].

3-C. 사진 룩(제품/인물) 템플릿

[제품/인물 주제]를 [스튜디오/실내/야외]에서 촬영한 사진 룩 스틸.
렌즈 [예: 50mm], 조리개 [f/1.8~f/8], 조명 [키/필/림], 백그라운드 [무광/페이퍼/배경지 색상].
피부/표면 보정 [자연스러움], 하이라이트/섀도우 [보존/리프트], 색온도 [따뜻/차가움].
제약: [텍스트 인쇄 금지, 특정 브랜드/로고 금지].
종횡비 [예: 4:5(인물), 3:2(제품)].

포맷은 짧은 명령형 구문을 권장합니다. Sora는 자연어를 잘 이해하지만, **역할(무엇), 위치(어디), 방법(어떻게)**를 구분해 주면 재현성이 올라갑니다. (프롬프트 엔지니어링 일반 원칙) (OpenAI Help Center)


4. 구도(Composition) 지시 항목 사전

4-A. 샷 크기(인물·물체)

  • Extreme close-up / Macro: 세부 질감 강조

  • Close-up: 얼굴/제품 디테일

  • Medium / Waist / Knee: 상반신/무릎 위

  • Full: 전신 또는 물체 전체

  • Wide / Establishing: 배경·환경의 정보 전달

4-B. 시점/각도

  • Eye-level / Low / High / Dutch tilt(기울임)

  • POV / Over-the-shoulder / Top-down

  • 정면/¾뷰/측면/후면 — 제품/캐릭터 일관성에 중요

4-C. 프레이밍/배치

  • Rule of thirds / Centered / Symmetry

  • Leading lines / Foreground-mid-background 분리

  • Negative space 활용: 텍스트 없이도 비어 보이는 영역 지시 가능

예시 구문: “Medium shot, eye-level, centered composition, negative space on the left


5. 카메라·광학·초점

5-A. 렌즈·초점거리

  • 35mm(광각 스토리텔링), 50mm(사람의 시야 느낌), 85~135mm(인물/제품 압축).

  • 매크로(초근접 질감).

“Lens 50mm equivalent, natural perspective”

5-B. 조리개·심도

  • 얕은 심도(f/1.4~f/2.8): 배경 흐림, 피사체 분리

  • 깊은 심도(f/8~f/16): 전반 선명

“Shallow depth of field, focus on [주요 대상]”

5-C. 초점/AF 지시

  • Critical focus on the eyes”, “Focus stacking look(전반 선명)


6. 조명과 색(Tone & Lighting)

6-A. 광원

  • Key / Fill / Rim(3점 조명), Softbox / Diffused(부드러움), Hard light(명확 그림자), Backlight(실루엣), Practical lights(실내 조명 소품).

지시 예: “Soft key from camera left, subtle fill, gentle rim light

6-B. 색온도·팔레트

  • Warm(≈3200K) / Neutral(≈4500K) / Cool(≈5600K↑)

  • 팔레트: 키 컬러 3~5개를 이름/톤으로 지정(“desaturated teal, warm beige, off-white, dark walnut”).

6-C. 대비·톤 곡선

  • High contrast / Soft contrast / Filmic roll-off

  • 하이라이트 보호, 섀도 리프트 등 톤 처리 지시


7. 재질·질감(Materials & Surface)

  • 금속(브러시드/거울광), 유리(반사/굴절), 플라스틱(무광/유광), 목재(결/오일 마감), 직물(트윌/벨벳/린넨), 피부(자연/무광 보정 최소), 음식(수분감/증기).

예: “Matte ceramic finish, micro-texture visible under soft sidelight


8. 스타일(Style) 지정

  • 사진 룩: 필름(포트라/트라이-X 느낌), 시네룩(아날로그 그레인), 상업 사진 룩(클린/하이키/로우키).

  • 일러스트/애니: 셀 셰이딩/수채/고전 동양화풍/만화 스크린톤.

  • 3D/CG: 서브서피스 스캐터링, PBR, 언리얼/오프셋 쉐이딩.

  • 프리셋: Sora의 Style presets 컨셉을 단어로 명시(“film noir”, “archival”, “cardboard & papercraft” 등). (OpenAI)

예: “Film-noir inspired, strong chiaroscuro, subtle film grain


9. 품질/세부(Detail & Quality)

  • High detail, clean edges, minimal artifacts

  • Natural skin texture, no plastic smoothing

  • Crisp micro-contrast on subject, smooth background bokeh

  • 종횡비 명시(예: 2:3, 3:2, 1:1). (UI에서 선택 가능) (OpenAI Help Center)


10. 제약/금지(Constraints)

  • 텍스트/워터마크/로고 금지

  • 과도한 왜곡/비율 붕괴 금지

  • 특정 상표/인물/민감 주제 정책 준수(필요 시 “no brand marks, no trademarks”). (OpenAI)


11. (영상 확장) 움직임·시간·카메라 무브

이미지 작업 시 생략 가능. 영상으로 확장 시 아래 지시를 추가 블록으로 덧붙입니다. (플랜별 길이/해상도 한도는 공식 페이지 확인) (OpenAI Help Center, OpenAI)

  • 동작(Motion): “very subtle breeze”, “hair sways slightly”, “steam rises gently”

  • 카메라 무브: “static tripod(정지)”, “slow push-in”, “arc from left to right”, “top-down slow drift

  • 리듬/속도(Pacing): “calm pacing”, “no fast cuts”

  • 전환(Transition): “no transitions” or “hard cut to black”


12. 일관성 유지(캐릭터/제품/세계관)

  • 반복적 키워드로 정체성 고정: 머리색/헤어스타일/의상/소품/피부 톤/표정 범위.

  • 제품은 치수/재질/로고 없음/색상 코드까지 명시.

  • 시리즈 제작 시 공통 프리셋 문장을 상단에 두고, 장면별로 하위 블록만 교체.


13. 트러블슈팅(문제 해결 표)

문제 원인 가설 해결용 프롬프트 수정
얼굴/제품이 흐림 초점/심도 불명확 Critical focus on [대상], shallow depth”, “edge clarity
배경이 시끄러움 배경 디테일 과다 Background simplicity, soft focus background, reduce clutter”
색이 탁함 팔레트/조명 불명확 Warm key 3200K, soft fill; palette: soft beige, muted teal, off-white
인체 비율 어색 스타일/제약 미흡 Natural anatomy, realistic proportions, avoid distortion
불필요한 텍스트/로고 등장 제약 미기재 No text, no logos, no watermark
과한 샤프/노이즈 품질 지시 과격 Natural sharpness, minimal artifacts, subtle grain

14. 실전 프롬프트 예제(복사-붙여넣기)

14-A. 제품 사진(머그컵) — 스틸 이미지

아이보리 세라믹 머그컵을 밝은 스튜디오에서 촬영한 사진 룩 스틸.
구도는 full product, eye-level, centered composition, negative space on the left.
렌즈 85mm, 얕은 심도(f/2.8), critical focus on the front logo area(실제 로고는 없음).
조명은 soft key from camera left + gentle fill, subtle rim, 색온도 중립(≈4500K).
팔레트: warm beige, off-white, light gray; 재질: matte ceramic with micro-texture.
품질: high detail, clean edges, minimal artifacts. 배경은 seamless paper, soft falloff.
제약: no text, no brand marks, no watermark.
종횡비 3:2, 결과는 스틸 이미지.

14-B. 인물 사진 — 자연광 포트레이트(스틸)

단발 흑발 여성 인물을 공원 그늘에서 촬영한 자연광 포트레이트 스틸.
구도는 medium shot, eye-level, 3/4 view, centered composition.
렌즈 50mm, shallow depth(f/2), critical focus on the eyes, 피부 텍스처 자연스럽게.
조명: diffused daylight(soft), 배경은 soft bokeh with circular highlights.
팔레트: muted green, warm skin tones; high micro-contrast on the subject.
제약: no text, no logos, no watermark. 과도한 보정 금지.
종횡비 4:5, 결과는 스틸 이미지.

14-C. 일러스트 — 셀 셰이딩 캐릭터(스틸)

고양이 요정을 숲의 공터에서 표현한 셀 셰이딩 일러스트 스틸.
구도: medium-full, slightly low angle, centered with subtle leading lines.
라인은 클린하고 일정한 굵기, 채색은 flat with soft gradient accents.
조명: soft rim from behind, warm key from right; 팔레트: forest green, cream, gold.
배경 디테일은 중간; 캐릭터 표정은 미소, 비율 자연.
제약: 텍스트/로고/워터마크 금지.
종횡비 2:3, 결과는 스틸 이미지.

14-D. 풍경 — 필름 룩(스틸)

해질녘 들판의 외길을 담은 풍경 사진 룩 스틸.
구도는 wide shot, rule of thirds, leading lines toward horizon.
렌즈 35mm equivalent, deep depth(f/8). 조명: golden hour warm backlight.
팔레트: golden orange, muted teal sky; filmic roll-off, subtle grain.
제약: no text, no humans, no logos.
종횡비 3:2, 결과는 스틸 이미지.

14-E. (영상 확장) 정지풍 배경 + 미세 동작

이미지 프롬프트 뒤에 다음을 추가

Motion: barely noticeable breeze in grass; Camera: static tripod; Pacing: calm; Duration: short clip.

(길이/해상도 한도는 플랜을 확인하세요.) (OpenAI Help Center, OpenAI)


15. 고급 주제별 체크리스트

15-A. 인물/패션

  • 헤어스타일/색, 피부 톤, 메이크업 강도, 의상 실루엣·소재·주름감

  • 포즈/표정 범위: “neutral to soft smile, no exaggerated expression”

  • 보정 방향: 자연스러운 피부결, 과도한 스킨 스무딩 금지

15-B. 제품/리테일

  • 치수 비율, 재질·마감(무광/유광), 사용 맥락(테이블/손에 든 샷)

  • 배경 난이도(무지 배경 vs 라이프스타일), 반사/그림자 유형(soft shadow)

  • 브랜드/텍스트 금지 명시(정책 준수) (OpenAI)

15-C. 음식

  • 신선도(물방울/증기/광택), 색채 대비, 접사·하이라이트 관리

  • 배경 소품 최소화(클린 프레임), 그릇 재질/색상 일관

15-D. 아트/스타일 프리셋

  • 프리셋 단어 + 추가 보정어(그레인/비네팅/톤 곡선)

  • Keep style consistent across a series” (시리즈 일관성)


16. 스타일 프리셋·리믹스·스토리보드 활용(영상 작업 시)

  • Style presets: 원하는 미학을 프리셋 명칭으로 고정 → 시리즈 일관성 확보. (OpenAI)

  • Remix: 기성 영상/이미지의 요소를 교체·추가·삭제하며 변주. (예: 문을 프랑스식으로 교체) (OpenAI)

  • Re-cut: 베스트 프레임/구간을 찾아 전후를 연장해 자연스러운 씬 구성. (OpenAI)

  • Storyboard: 장면별 키 프레임·지시어를 목록화 → 연속 시퀀스 제작. (OpenAI)

이미지 작업에서도 “프리셋 명칭+핵심 스타일어”를 상단에 고정하면 재현성이 크게 향상됩니다.


17. 재현성 높이는 문장 패턴(Do & Don’t)

Do

  • 역할·위치·방법을 분리된 짧은 구로: “subject — scene — composition — lens — light — palette — constraints”

  • 측정 가능한 표현: “85mm, f/2.8, centered, warm key”

  • 부정 지시를 끝부분에 묶기: “no text, no logo, no watermark”

Don’t

  • 장황한 수식어 나열(중복 의미)

  • “예쁘게, 멋지게” 같은 추상어만 사용

  • 금지/제약을 생략


18. 정책·한도 인지(중요)

  • 생성 정책을 준수하세요(저작권/상표/개인정보/민감 컨텐츠 등 금지). (OpenAI)

  • 영상 생성 시 해상도/길이/동시 생성 수플랜별 한도를 확인하세요. (예: Plus/Pro/Business 각기 제한 상이) (OpenAI Help Center)

  • 이미지 생성은 Sora/ChatGPT UI에서 종횡비 등 사전 설정이 가능. (OpenAI Help Center)


19. 빠른 작성용 “미니 템플릿” 6종

  1. 제품(무광 세라믹)

Matte ceramic [제품] on seamless background — full product, centered, lens 85mm, shallow depth.
Soft key left + gentle fill, neutral white balance, clean shadow.
Palette: warm beige, off-white; high detail, minimal artifacts.
No text/logos/watermark. Aspect 3:2. Output: still image.
  1. 인물(클린 룩)

Portrait of [인물], medium shot, eye-level, 3/4 view, lens 50mm, f/2.
Diffused daylight, soft bokeh; natural skin texture, subtle contrast.
No text/logos. Aspect 4:5. Output: still image.
  1. 일러스트(셀 셰이딩)

[캐릭터] in [배경], cel-shaded illustration, clean line art, flat colors with soft gradients.
Centered composition, soft rim light, palette: [3~5 colors]. No text/logos.
Aspect 2:3. Output: still image.
  1. 푸드(숙성 스테이크)

Close-up of medium-rare steak on dark plate, macro texture, steam gently visible.
Soft key from right, warm tone, crisp micro-contrast on surface.
No text/logos. Aspect 3:2. Output: still image.
  1. 풍경(골든 아워)

Wide shot of a countryside road at golden hour, rule of thirds, leading lines.
Lens 35mm, deep focus, warm backlight, subtle film grain.
No humans, no text/logos. Aspect 3:2. Output: still image.
  1. 제품(반사 억제)

Glossy black [제품] against matte gray background, controlled reflections.
Lens 85mm, f/8, polarizing look, soft box overhead + edge lights.
No text/logos. Aspect 3:2. Output: still image.

20. 최종 점검 체크리스트

  • 주제(Subject)가 1~2문장으로 명확한가?

  • 장면/배경이 간결하게 지정됐는가?

  • 구도(샷/시점/프레이밍)가 측정 가능하게 쓰였는가?

  • 렌즈/심도/초점 대상이 충돌 없이 정의됐는가?

  • 조명/팔레트/톤이 서로 일관되는가?

  • 품질·세부·아티팩트 최소화 문구가 있는가?

  • **제약(금지 요소)**가 말미에 정리돼 있는가?

  • (영상 확장 시) 동작/카메라 무브/길이가 명시됐는가? (플랜 한도 확인) (OpenAI Help Center)

  • 정책 준수(저작권/상표/민감 컨텐츠) 확인. (OpenAI)


21. 부록 — 프롬프트를 더 강하게 만드는 표현집

구도

  • Centered, balanced, negative space on [left/right]

  • Rule of thirds, horizon on lower third

렌즈/심도

  • 50mm equivalent, natural perspective

  • Shallow depth, bokeh background, focus on [대상]

  • Deep focus for environment clarity

조명/톤

  • Soft key left, gentle fill, subtle rim, neutral white balance

  • Golden hour backlight, warm highlights, cool shadows

  • High micro-contrast on subject, soft contrast overall

재질/질감

  • Matte finish, micro-texture, controlled reflections

  • Brushed metal with soft specular highlights

제약

  • No text, no logos, no watermark, avoid distortion


22. 결론

  • Sora에서 이미지 프롬프트는 “주제-장면-구도-광학-조명-재질-색-스타일-품질-제약”의 짧은 블록 문장으로 구성하면 가장 재현성이 높습니다.

  • 영상으로 확장할 때는 동작/무브/시간/리듬/전환만 덧붙이면 됩니다(플랜별 길이/해상도 한도 확인). (OpenAI Help Center)

  • 정책과 가이드를 준수하면(브랜드/민감 요소 회피) 생성 실패·제한 가능성을 줄일 수 있습니다. (OpenAI)

  • 스타일 프리셋 키워드를 상단에 고정하고 시리즈를 운영하면, 반복 작업에서 일관성과 속도가 크게 향상됩니다. (OpenAI)


Comments