Source: ByteByteGo
What are Agents Skills?
1. User Query: A user submits a request like “Analyze data & draft report”.
2. Build Prompt + Skills Index: The agent runtime combines the query with Skills metadata, a lightweight list of available skills and their short descriptions.
3. Reason & Select Skill: The LLM processes the prompt, thinks, and decides: "I want Skill X."
4. Load Skill into Context: The agent runtime receives the specific skill request from the LLM. Then, it loads SKILL. md and adds it into the LLM's active context.
5. Final Output: The LLM follows SKILL. md, runs scripts, and generates the final report.
By dynamically loading skills only when needed, Agent Skills keep context small and the LLM’s behavior consistent.
1️⃣ 사용자 요청 (User Query)
사용자가 요청을 보낸다.
예: “데이터를 분석하고 보고서를 작성해줘”
2️⃣ 프롬프트 구성 + 스킬 목록 포함 (Build Prompt + Skills Index)
Agent 런타임은 다음을 합쳐서 LLM에 전달한다:
- 사용자 요청
- 사용 가능한 스킬 목록 (Skill Index)
- 각 스킬의 간단한 설명
여기서는 스킬 전체 내용을 넣지 않는다. : → 제목 + 요약 설명만 넣는다.
이 단계의 목적: LLM이 어떤 스킬을 쓸지 선택하게 만드는 것
3️⃣ 추론 후 스킬 선택 (Reason & Select Skill)
LLM은 내부적으로 생각한다:
“이 작업에는 DataAnalysis 스킬이 필요하다.”
그리고 이렇게 응답한다:
이게 ReAct의 Action 단계다.
4️⃣ 선택된 스킬을 컨텍스트에 로드 (Load Skill into Context)
Agent 런타임은 LLM의 요청을 받으면:
- 해당 스킬의 실제 파일 (예: DataAnalysis.md)
- 그 안에 있는 지침, 스크립트, 템플릿
LLM의 활성 컨텍스트에 추가한다.
여기서 처음으로 스킬의 “전체 내용”이 들어간다.
5️⃣ 최종 결과 생성 (Final Output)
이제 LLM은:
- 로드된 스킬 지침을 따르고
- 필요한 스크립트를 실행하고
- 최종 보고서를 생성한다.
🔁 이 구조의 핵심
스킬을 “필요할 때만” 불러온다.
왜 중요하냐?
- 컨텍스트 크기를 줄인다
- 토큰 낭비 방지
- LLM 동작 일관성 유지
- 스킬 간 충돌 방지