on
ai 주식투자
- Get link
- X
- Other Apps
스테이블 디퓨젼에서 캐릭터 학습 및 LoRA, ControlNet을 활용한 단계별 튜토리얼
캐릭터 학습이란 특정 스타일, 얼굴, 복장 등을 AI가 인식하도록 훈련하여 프롬프트를 입력했을 때 원하는 결과를 얻는 과정입니다. 가장 많이 사용되는 방법은 **LoRA(Low-Rank Adaptation)**을 활용한 학습이며, 이는 기존 모델을 변형하지 않고 가볍게 학습시킬 수 있는 방법입니다.
먼저 학습을 진행할 환경을 설정합니다.
설치 방법은 [AUTOMATIC1111 GitHub]를 참고하세요.
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt
캐릭터 학습을 위해 고품질의 이미지 데이터셋을 준비해야 합니다.
AI가 특징을 학습하기 위해 **태그(Labeling)**가 필요합니다.
1girl, blonde hair, blue eyes, smile, anime style, school uniform
AUTOMATIC1111의 WebUI에서 kohya-ss/sd-scripts를 활용하여 학습할 수 있습니다.
git clone https://github.com/kohya-ss/sd-scripts.git
cd sd-scripts
pip install -r requirements.txt
accelerate launch train_network.py \
--pretrained_model_name_or_path="your_model_path" \
--train_data_dir="your_dataset_path" \
--output_dir="your_lora_output_path" \
--resolution=512,512 \
--batch_size=2 \
--max_train_steps=2000 \
--learning_rate=1e-4 \
--network_dim=8
<lora:your_lora_model:0.8>, 1girl, blonde hair, blue eyes, smile, anime style
잘못된 프롬프트 사용 → LoRA 태그를 넣지 않으면 적용되지 않음
과적합된 LoRA 사용 → 너무 강하게 적용하면 다른 스타일이 섞이지 않음
VRAM 부족 문제 → --network_dim 값을 조정하여 가볍게 학습
학습용 데이터셋은 폴더 구조를 올바르게 구성해야 합니다.
📂 your_dataset_path/
├── 00001.jpg
├── 00002.jpg
├── captions/
│ ├── 00001.txt (1girl, red hair, happy face)
│ ├── 00002.txt (blonde hair, blue eyes, school uniform)
✔ 이미지명과 캡션명이 동일해야 학습이 정상적으로 진행됩니다.
ControlNet은 기본 이미지의 포즈, 구조 등을 유지하면서 스타일을 변경하는 기능입니다.
5. LoRA 적용 후 프롬프트 입력
<lora:your_character:0.7>, 1girl, anime, red hair, cheerful
Comments
Post a Comment