ACE-Step 1.5 Windows 11 초보자 설치·테스트 매뉴얼 (RTX 4060 노트북용)
대상: AI를 처음 접하는 사용자
목표: Windows 11에서 ACE-Step 1.5를 설치하고, 첫 곡 생성 테스트까지 완료
방식: 1안(공식 Gradio/WebUI) 기준
0) 먼저 이해하고 시작하기 (초보자용 핵심 개념)
ACE-Step 1.5가 무엇인가요?
ACE-Step 1.5는 텍스트(장르, 분위기, 가사 등)를 입력하면 음악을 생성해주는 오픈소스 AI 모델입니다.
Gradio/WebUI가 무엇인가요?
- WebUI: 웹 브라우저에서 조작하는 화면(버튼, 입력칸)
- Gradio: 파이썬 프로그램을 웹 화면으로 쉽게 띄워주는 도구
즉, 설치 후에는 코드를 계속 만지는 것이 아니라, 브라우저 UI에서 생성 버튼을 눌러 사용하게 됩니다.
왜 가상환경(venv/conda)을 쓰나요?
AI 설치는 라이브러리(패키지) 버전 충돌이 자주 납니다.
- 가상환경 = 이 프로젝트 전용 독립 상자
- 장점: 다른 프로젝트를 망치지 않고, 문제 발생 시 재설치가 쉽습니다.
RTX 4060 노트북에 맞춘 핵심 전략
RTX 4060 노트북은 보통 VRAM 8GB이므로 다음이 중요합니다.
- 처음엔 짧은 길이/낮은 스텝으로 테스트
- 필요하면 CPU 오프로딩 옵션 사용
- 배치 크기(동시 생성량) 1 유지
1) 준비물 체크리스트
아래 5가지를 먼저 설치합니다.
- Windows 11 최신 업데이트
- NVIDIA 드라이버 최신 버전 (Game Ready 또는 Studio)
- Git for Windows
- Python 3.10.x (권장)
- **FFMpeg full-shared 버전 설치 :ffmpeg-release-full-shared.zip **
: https://www.gyan.dev/ffmpeg/builds/ - Visual C++ Redistributable (런타임 오류 예방)
팁: Python은 3.11/3.12에서도 동작할 수 있으나, 초보자는 호환성이 좋은 3.10을 권장합니다.
2) 설치 전 사전 점검 (아주 중요)
2-1. PowerShell 열기
- 시작 메뉴 →
PowerShell검색 → 실행
2-2. Git 확인
git --version
정상 예시: git version 2.xx.x
2-3. Python 확인
python --version
정상 예시: Python 3.10.x
2-4. NVIDIA GPU 확인
nvidia-smi
정상이라면 GPU 정보와 드라이버 버전이 표시됩니다.
만약
nvidia-smi가 안 되면 드라이버부터 다시 설치하세요.
3) 프로젝트 폴더 만들기
아래는 예시 경로입니다.
cd $HOME
mkdir ai-music -ErrorAction SilentlyContinue
cd ai-music
4) ACE-Step 소스 받기
git clone https://github.com/ace-step/ACE-Step.git
cd ACE-Step
5) 가상환경 만들기 (venv 방식)
5-1. 가상환경 생성
python -m venv .venv
5-2. 가상환경 활성화
.\.venv\Scripts\Activate.ps1
활성화되면 프롬프트 앞에 (.venv)가 보입니다.
실행 정책 오류가 나면 1회성으로 아래 실행:
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope Process
그 후 다시 활성화 명령 실행
6) PyTorch(CUDA) 설치
ACE-Step README 기준으로 Windows + NVIDIA GPU 권장 명령은 아래입니다.
pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
용어 설명
- PyTorch: AI 모델을 실행하는 핵심 엔진
- CUDA: NVIDIA GPU 가속 기술
- cu126: CUDA 12.6 계열 빌드
7) ACE-Step 설치
pip install -e .
-e 뜻
editable 설치로, 현재 폴더 코드와 연결되어 개발/수정에 유리합니다. 현재 폴더의 파이썬 프로젝트를 "개발 모드(editable mode)"로 설치하라는 뜻
현재 폴더의 파이썬 프로젝트를 개발 모드로 설치해서 수정 즉시 반영되게 해라
pip install 차이점에 대한 설명
❌ 일반 설치
pip install .
코드가 site-packages에 복사된다.
소스 코드 수정하면 → 다시 설치해야 반영됨
✅ Editable 설치
pip install -e .
소스를 복사하지 않는다.
현재 폴더를 링크해서 사용한다.
코드 수정하면 → 바로 반영된다.
👉 그래서 개발할 때 무조건 Editable 을 사용
8) (선택) Windows 최적화 패키지
공식 권장 고급 옵션(--torch_compile)을 쓸 때 Windows는 아래가 필요할 수 있습니다.
pip install triton-windows
처음에는 생략해도 됩니다. 문제가 없으면 나중에 성능 최적화 단계에서 적용하세요.
9) 첫 실행 (가장 안전한 시작 명령)
처음은 안정성 우선으로 아래처럼 실행합니다.
acestep --port 7865 --cpu_offload true --overlapped_decode true
옵션 설명 (초보자 버전)
--port 7865: 브라우저 접속 포트 번호--cpu_offload true: VRAM 부족 시 일부를 RAM으로 넘겨 실행 안정성 확보--overlapped_decode true: 디코딩 성능 개선 옵션
실행 후 터미널에 로컬 주소(예: http://127.0.0.1:7865)가 뜨면 브라우저로 열면 됩니다.
에러 발생시 가상환경 (.venv) 에서
# 설치된 gradio 및 gradio-client , gradio_client 를 삭제
pip uninstall -y gradio gradio-client gradio_client
# gradio 와 gradio-client 호환 버전을 설지 한다.
# gradio 5.50.0은 gradio-client == 1.14.0을 강제함
pip install "gradio==5.50.0" "gradio-client==1.14.0"
10) 첫 테스트 생성 (3~5분짜리 따라하기)
UI에서 Text2Music 탭 기준으로 진행합니다.
10-1. 입력값 예시
- Tags(태그):
k-pop, bright, energetic, female vocal, modern pop, clean mix - Lyrics(가사):
[verse]
새로운 하루가 시작돼
작은 아이디어가 빛나네
[chorus]
한 걸음 더, 오늘도 가보자
우리의 리듬으로 채워가
- Audio Duration(길이): 20~30초(처음엔 짧게)
10-2. 설정값(초보 안정 프리셋)
- Inference Steps: 20~28
- Guidance Scale: 기본값 또는 중간값
- Seed: 고정값(예: 12345)으로 재현성 확보
10-3. 생성
Generate클릭- 첫 실행은 모델 다운로드 때문에 시간이 더 걸릴 수 있음
(Wav) 파일 생성 오류 일 때
FFmpeg 버전을 확인하고 full shared 를 설치해야 함
5. **FFMpeg full-shared 버전 설치 :ffmpeg-release-full-shared.zip **
: https://www.gyan.dev/ffmpeg/builds/
11) 결과 확인과 품질 올리는 법
처음 결과가 별로일 때
- 태그를 구체화 (장르 + 분위기 + 악기 + 보컬 성별)
- 길이 짧게 유지한 채 seed만 바꿔 여러 번 시도
- 스텝을 20→28→35 순으로 점진 증가
품질과 속도의 트레이드오프
- 스텝↑: 품질/안정성↑, 속도↓
- 길이↑: 시간↑, VRAM 부담↑
RTX 4060 노트북은 짧게 탐색 후 최종 길이 확장이 효율적입니다.
12) 자주 발생하는 문제와 해결
문제 A: CUDA out of memory
원인: VRAM 부족
해결 순서
- 길이 20~30초로 축소
- 스텝 낮추기
--cpu_offload true유지- 백그라운드 앱(브라우저 게임 탭 등) 종료
문제 B: ModuleNotFoundError / 패키지 오류
원인: 가상환경 미활성화 또는 설치 누락
해결
(.venv)표시 확인pip install -e .재실행- 필요시
.venv삭제 후 다시 생성
문제 C: 실행은 되는데 브라우저 접속 불가
해결
- 주소를 정확히
http://127.0.0.1:7865입력 - 포트 충돌 시
--port 7866으로 변경
문제 D: 너무 느림
해결
- 길이·스텝 줄이기
- 탐색 단계에서 instrumental로 먼저 테스트
- 필요 시
--torch_compile true+triton-windows적용(고급)
13) 초보자를 위한 운영 루틴 (실전 권장)
- 짧은 20~30초 프리뷰 3개 생성
- 가장 좋은 결과의 seed 기록
- 같은 seed로 태그/가사만 미세 수정
- 만족하면 길이 확장
이 방식이 실패 비용을 크게 줄입니다.
14) 테스트 완료 기준 (체크리스트)
-
acestep명령으로 UI 실행됨 - 브라우저에서 UI 접속 성공
- 20~30초 곡 1개 이상 생성 성공
- 생성 파일 재생 확인
- 프롬프트/seed/설정값 기록 완료
15) 완전 초보용 한 줄 요약
- 설치 핵심은 Python 가상환경 + CUDA용 PyTorch +
pip install -e . - 사용 핵심은 짧게 먼저 생성해서 빠르게 반복
- RTX 4060 노트북은
--cpu_offload true기반 안정 운용이 가장 안전합니다.
부록 A) 복붙용 최소 명령 모음
cd $HOME
mkdir ai-music -ErrorAction SilentlyContinue
cd ai-music
git clone https://github.com/ace-step/ACE-Step.git
cd ACE-Step
python -m venv .venv
.\.venv\Scripts\Activate.ps1
pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
pip install -e .
acestep --port 7865 --cpu_offload true --overlapped_decode true
부록 B) 안전/저작권 기본 원칙
AI 생성 음악은 상업 사용 전 반드시 아래를 확인하세요.
- 저작권/이용약관 확인
- 특정 아티스트 스타일 과도 모방 지양
- 배포 전 원본성 검토
작성 목적: 스카이님의 요청에 따른 초보자 교육용 설치·테스트 매뉴얼
16) 오류 메시지별 즉시 대응표 (현장용)
아래 표는 실제 초보자가 자주 만나는 에러를 바로 조치할 수 있게 정리한 빠른 대응표입니다.
16-1. 설치/실행 오류
python: command not found또는python is not recognized
- 의미: Python 경로가 시스템에 등록되지 않았거나 설치가 누락됨
- 즉시 조치:
- Python 재설치 시 Add Python to PATH 체크
- 새 PowerShell 창에서
python --version재확인
No module named ...
- 의미: 필요한 패키지가 현재 가상환경에 없음
- 즉시 조치:
(.venv)활성 상태인지 확인pip install -e .재실행
acestep is not recognized
- 의미: 콘솔 명령이 가상환경 경로를 못 찾음
- 즉시 조치:
\.venv\Scripts\Activate.ps1다시 실행- 여전히 안 되면
pip install -e .재실행
16-2. GPU/메모리 오류
CUDA out of memory
- 의미: GPU VRAM이 부족함
- 즉시 조치 (순서대로):
- 길이 20~30초로 줄이기
- 스텝 20~24로 낮추기
--cpu_offload true유지- 브라우저/게임/영상 편집 툴 종료 후 재시도
Torch not compiled with CUDA enabled
- 의미: CPU 버전 PyTorch가 설치됨
- 즉시 조치:
- 기존 torch 제거 후 CUDA 버전 재설치
pip uninstall -y torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
nvidia-smi는 되는데 생성이 비정상적으로 느림
- 의미: GPU 대신 CPU로 돌고 있을 가능성
- 즉시 조치:
- 가상환경 재활성화 후 재실행
- 백그라운드 점유 앱 종료
- 짧은 프롬프트/짧은 길이로 GPU 사용 여부 체감 테스트
16-3. 접속/UI 오류
- 브라우저에서
127.0.0.1:7865접속 실패
- 의미: 서버 미기동 또는 포트 충돌
- 즉시 조치:
- 터미널에서 에러 유무 확인
- 포트 변경:
acestep --port 7866 --cpu_offload true --overlapped_decode true - 방화벽 팝업이 나오면 로컬 접근 허용
- 첫 실행에서 오래 멈춘 것처럼 보임
- 의미: 모델 다운로드/초기 캐시 생성 중일 수 있음
- 즉시 조치:
- 3~10분 여유를 두고 기다림
- 네트워크 상태 확인
- 중단했다면 재실행 후 동일 단계 재시도
16-4. 품질/결과 오류
- 보컬이 깨지거나 가사가 이상함
- 의미: 프롬프트/가사 구조·스텝·길이 조합이 불안정
- 즉시 조치:
- 가사 길이를 줄이고 섹션 태그(
[verse],[chorus])를 단순화 - 스텝을 약간 올려 재시도
- seed 고정 후 한 변수씩만 변경
- 가사 길이를 줄이고 섹션 태그(
- 결과 편차가 너무 큼
- 의미: 시드/설정 고정 없이 반복한 경우
- 즉시 조치:
- seed 고정 (예: 12345)
- 태그·가이드·스텝 중 하나만 바꿔 비교
17) 5분 복구 프로토콜 (완전 초보용)
문제가 복잡해졌을 때는 아래 5분 복구 절차로 초기화하면 대부분 해결됩니다.
- PowerShell 종료 후 새로 열기
- 프로젝트 폴더로 이동
- 가상환경 활성화
cd $HOME\ai-music\ACE-Step
.\.venv\Scripts\Activate.ps1
- 핵심 패키지 재정렬
pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
pip install -e .
- 안전 실행 옵션으로 재기동
acestep --port 7865 --cpu_offload true --overlapped_decode true
이 프로토콜 이후에도 실패하면, 오류 메시지 원문을 복사해 원인 분석을 진행합니다.