目錄
什麼是 Skills?
Skill(技能)是把「做某一類任務的整套 know-how」封裝起來的能力包——通常是一份說明文件,加上需要時才用到的腳本或參考資料。
Tools vs Skills
回顧 工具呼叫:Tool 是一個單一動作(讀檔、查天氣)。而 Skill 比較像一份完整的工作手冊:教模型「面對這類任務,該怎麼一步步做、該用哪些工具、有哪些注意事項」。
Tool = 一個動作 例:read_file()
Skill = 一套做事方法 例:「如何審查一個 PR」——包含步驟、要檢查什麼、用哪些工具
| 面向 | Tool(工具) | Skill(技能) |
|---|---|---|
| 粒度 | 單一功能 | 一整套流程/方法 |
| 內容 | 名稱+參數 | 說明文件 + (可選)腳本、範本、參考資料 |
| 解決 | 「能做這個動作」 | 「面對這類任務該怎麼做」 |
為什麼需要 Skills?
- 把專業知識、最佳實踐封裝起來,讓 Agent 面對特定任務時「照著手冊做」,品質更穩定。
- 可重複使用、可分享:寫一次「PR 審查 skill」,之後每次都用同一套標準。
💡 像 Claude Code 這類工具就支援 Skills:一個 skill 通常是一個資料夾,裡面有說明文件告訴模型「這個技能何時用、怎麼做」,以及需要時才載入的附屬檔案。
漸進式揭露
Skills 設計的核心技巧叫 漸進式揭露(Progressive Disclosure):不一次把所有細節塞給模型,而是需要時才載入。
為什麼要這樣?
回顧 上下文視窗:模型一次能看的 token 有限。如果把幾十個 skill 的完整內容全塞進去,視窗會爆、成本飆高、重點被稀釋。
怎麼運作
第 1 層:只先給「簡介」
每個 skill 只放一句話:名稱 + 「何時該用我」
→ 很省 token,模型先知道「手上有哪些技能」
第 2 層:用到時才展開細節
模型判斷「這個任務需要 PR 審查 skill」
→ 才把那個 skill 的完整說明載入上下文
第 3 層:真的需要才讀附屬檔案
skill 裡提到的腳本、長範例、參考文件
→ 模型需要時才去讀,不是一開始就全載
重點
- 像「先看目錄,需要哪章再翻哪章」,而不是把整本書背下來。
- 這讓系統能同時擁有大量技能,卻不會一次撐爆上下文視窗——用空間換能力的關鍵設計。
RAG 檢索增強生成
RAG(Retrieval-Augmented Generation,檢索增強生成)= 先「檢索」相關資料,再讓模型「根據這些資料」生成回答。
解決什麼問題
回顧 LLM 基礎:模型有知識截止日,也不知道你的私有資料(內部文件、公司知識庫)。RAG 就是把「它沒學過的資料」現查現給。
怎麼運作(用到第①篇的 Embedding)
準備階段:
把文件切塊 → 每塊算出 embedding 向量 → 存進向量資料庫
(embedding 見 LLM 基礎篇)
查詢階段:
① 使用者提問 → 把問題也算成 embedding
② 在向量資料庫找「語意最接近」的幾塊文件
③ 把這幾塊塞進上下文視窗
④ 模型根據這些真實資料回答(而非靠記憶硬掰)
好處
- 能回答私有的、即時的、超出知識截止日的內容。
- 大幅減少幻覺——因為模型是「照著撈到的資料答」,有所本。
💡 RAG 是「給模型臨時補充資料」,不是「重新訓練模型」。模型本身沒變,變的是你餵進上下文的內容。
Memory 記憶
回顧 Agent 篇:模型本身不記憶,上下文視窗是有限的短期工作區。Memory 機制就是用來突破這個限制。
短期記憶 vs 長期記憶
| 類型 | 是什麼 | 怎麼實現 |
|---|---|---|
| 短期記憶 | 這次對話/任務的進度 | 就是上下文視窗本身 |
| 長期記憶 | 跨對話、跨任務要記住的事 | 存到視窗之外(檔案、資料庫),需要時再撈回 |
常見做法
1. 摘要壓縮:對話太長 → 把舊內容濃縮成摘要,騰出視窗空間
2. 外部儲存:把「使用者偏好、專案設定」等寫進檔案,下次載入
3. 向量檢索:把過去資訊存成 embedding,需要時用 RAG 方式撈回
重點:所謂「AI 記得我」,本質是把資訊存在模型之外,下次再餵回它的上下文——不是模型自己長了記憶。
Multi-Agent 多代理協作
當任務太大太複雜,可以讓多個 Agent 分工合作,而不是一個 Agent 從頭做到尾。
常見模式
主從模式(Orchestrator–Worker):
┌─────────────────┐
│ 主 Agent(協調)│ 拆解任務、分派、整合結果
└────────┬────────┘
┌──────┼──────┐
▼ ▼ ▼
子Agent 子Agent 子Agent
(研究) (寫作) (檢查) 各自專注一塊,可平行進行
| 模式 | 怎麼運作 | 適合 |
|---|---|---|
| 主從(協調者) | 一個主 Agent 拆解、分派給多個子 Agent,再整合 | 大任務可拆成獨立子任務 |
| 流水線(Pipeline) | 一個 Agent 的產出交給下一個處理 | 有明確先後步驟的流程 |
| 辯論/審查 | 一個 Agent 產出、另一個挑錯驗證 | 需要高品質、要交叉檢查 |
為什麼有用
- 分工專精:每個子 Agent 只專注一件事,表現更好。
- 平行加速:彼此獨立的子任務可同時跑(呼應 工具平行呼叫)。
- 獨立上下文:每個子 Agent 有自己的視窗,避免一個視窗塞爆所有東西。
⚠️ 代價:多 Agent 會用更多 token、協調也更複雜。簡單任務用單一 Agent 就好,別過度設計。
全景圖:它們怎麼合作 ⭐
把整個系列五篇的概念串成一張圖——這就是現代 AI Agent(例如 Claude Code)運作的全貌:
圖例:①基礎 ②Agent ③工具 ④MCP ⑤Skills / RAG / 協作
用一個任務串起來
任務:「依我們的規範審查這個 PR,有問題就修。」
1. LLM(①大腦)理解任務
2. 進入 Agent Loop(②):思考 → 行動 → 觀察,迴圈推進
3. 載入「PR 審查」Skill(⑤)——漸進式揭露,這時才載入這套方法手冊
4. Skill 指示要檢查的項目,模型呼叫 Tools(③)讀檔、跑測試
└─ 這些工具透過 MCP(④)標準化接入
5. 需要對照團隊規範文件 → 用 RAG(⑤)從向量庫撈出相關規範塞進上下文
6. 跨對話要記得的偏好 → 從 Memory(⑤)載入
7. (若任務很大)拆給多個子 Agent 分工(⑤ Multi-Agent)
8. 迴圈直到完成 → 回報結果
每一層都不是孤立的:LLM 是核心,Agent Loop 是運作方式,Tools 是手腳,MCP 讓工具可插拔,Skills/RAG/Memory/Multi-Agent 則讓它能處理更大更專業的任務。
常見問題
問題 1:Skill 和 Tool 差在哪?
Tool 是單一動作(讀檔);Skill 是一整套做事方法(如何審查 PR,含步驟、注意事項、該用哪些工具)。Skill 常會「指揮」模型去用多個 Tool。
問題 2:為什麼 Skills 要「漸進式揭露」?
因為上下文視窗有限。先只放每個 skill 的簡介(省 token),用到哪個才載入它的完整內容——這樣才能同時擁有大量技能而不撐爆視窗。
問題 3:RAG 是在重新訓練模型嗎?
不是。RAG 只是「查到相關資料、塞進上下文讓模型參考」,模型本身沒被改動。它解決的是「模型沒學過/過時/私有」的知識問題。
問題 4:是不是任務都該用 Multi-Agent?
不是。多 Agent 更耗 token、協調更複雜。只有當任務大到可拆成獨立子任務、或需要交叉檢查時才划算;簡單任務單一 Agent 就好。
問題 5:這些東西一定要全部用上嗎?
不用。它們是「按需取用」的工具箱:簡單問答只要 LLM;要做事加 Tools;工具要跨應用共用用 MCP;要封裝專業流程用 Skills;要補私有/即時知識用 RAG。依任務複雜度選用即可。
總結
核心要點
進階能力都是為了突破「模型本身的限制」:
├─ Skills 把整套做事方法封裝成手冊,可重用
├─ 漸進式揭露 需要時才載入,突破上下文視窗限制
├─ RAG 現查現給相關資料,補知識截止/私有資料、減少幻覺
├─ Memory 把資訊存在模型外,下次再餵回 → 跨對話「記得」
└─ Multi-Agent 多 Agent 分工、平行、交叉檢查,處理大任務
全景:LLM(核心) + Agent Loop(運作) + Tools(手腳)
+ MCP(工具標準化) + Skills/RAG/Memory/Multi-Agent(進階能力)
快速記憶
| 概念 | 一句話 |
|---|---|
| Skill | 一整套做事方法的封裝手冊 |
| 漸進式揭露 | 先給簡介,用到才載入細節,省 token |
| RAG | 檢索相關資料再生成,補私有/即時知識 |
| Memory | 把資訊存模型外、再餵回,實現「記得」 |
| Multi-Agent | 多 Agent 分工協作處理大任務 |
學習路徑(系列完結)
① LLM 基礎 —— 理解 token 接龍與其限制 ✓
② AI Agent —— 從會聊天到會做事 ✓
③ 工具呼叫 —— Agent 的手腳 ✓
④ MCP —— 工具的標準化插槽 ✓
⑤ Skills 與協作 —— 封裝能力、突破限制、整合全貌 ✓
🎉 你已經建立起對現代 AI Agent 的完整心智模型!
回顧整個系列
- ① AI 與 LLM 基礎
- ② AI Agent 是什麼
- ③ 工具呼叫 Tools / Function Calling
- ④ MCP(Model Context Protocol)
- ⑤ Skills 與進階協作(本篇)
建立日期:2026-06-01 最後更新:2026-06-01