Skills 與進階協作

Skills 如何把能力封裝、漸進式揭露怎麼省 token,以及 RAG、Memory、Multi-Agent 如何運作,最後用一張全景圖把 LLM、Agent、Tools、MCP、Skills 全部串起來。

這是 AI 系列最後一篇。建議先讀完前四篇(基礎Agent工具MCP),本篇會把它們全部整合起來。


目錄


什麼是 Skills?

Skill(技能)是把「做某一類任務的整套 know-how」封裝起來的能力包——通常是一份說明文件,加上需要時才用到的腳本或參考資料。

Tools vs Skills

回顧 工具呼叫:Tool 是一個單一動作(讀檔、查天氣)。而 Skill 比較像一份完整的工作手冊:教模型「面對這類任務,該怎麼一步步做、該用哪些工具、有哪些注意事項」。

Tool   = 一個動作         例:read_file()
Skill  = 一套做事方法     例:「如何審查一個 PR」——包含步驟、要檢查什麼、用哪些工具
面向 Tool(工具) Skill(技能)
粒度 單一功能 一整套流程/方法
內容 名稱+參數 說明文件 + (可選)腳本、範本、參考資料
解決 「能做這個動作」 「面對這類任務該怎麼做」

為什麼需要 Skills?

  • 把專業知識、最佳實踐封裝起來,讓 Agent 面對特定任務時「照著手冊做」,品質更穩定。
  • 可重複使用、可分享:寫一次「PR 審查 skill」,之後每次都用同一套標準。

💡 像 Claude Code 這類工具就支援 Skills:一個 skill 通常是一個資料夾,裡面有說明文件告訴模型「這個技能何時用、怎麼做」,以及需要時才載入的附屬檔案。


漸進式揭露

Skills 設計的核心技巧叫 漸進式揭露(Progressive Disclosure)不一次把所有細節塞給模型,而是需要時才載入。

為什麼要這樣?

回顧 上下文視窗:模型一次能看的 token 有限。如果把幾十個 skill 的完整內容全塞進去,視窗會爆、成本飆高、重點被稀釋。

怎麼運作

第 1 層:只先給「簡介」
  每個 skill 只放一句話:名稱 + 「何時該用我」
  → 很省 token,模型先知道「手上有哪些技能」

第 2 層:用到時才展開細節
  模型判斷「這個任務需要 PR 審查 skill」
  → 才把那個 skill 的完整說明載入上下文

第 3 層:真的需要才讀附屬檔案
  skill 裡提到的腳本、長範例、參考文件
  → 模型需要時才去讀,不是一開始就全載

重點

  • 像「先看目錄,需要哪章再翻哪章」,而不是把整本書背下來。
  • 這讓系統能同時擁有大量技能,卻不會一次撐爆上下文視窗——用空間換能力的關鍵設計。

RAG 檢索增強生成

RAG(Retrieval-Augmented Generation,檢索增強生成)= 先「檢索」相關資料,再讓模型「根據這些資料」生成回答。

解決什麼問題

回顧 LLM 基礎:模型有知識截止日,也不知道你的私有資料(內部文件、公司知識庫)。RAG 就是把「它沒學過的資料」現查現給

怎麼運作(用到第①篇的 Embedding)

準備階段:
  把文件切塊 → 每塊算出 embedding 向量 → 存進向量資料庫
              (embedding 見 LLM 基礎篇)

查詢階段:
  ① 使用者提問 → 把問題也算成 embedding
  ② 在向量資料庫找「語意最接近」的幾塊文件
  ③ 把這幾塊塞進上下文視窗
  ④ 模型根據這些真實資料回答(而非靠記憶硬掰)

好處

  • 能回答私有的、即時的、超出知識截止日的內容。
  • 大幅減少幻覺——因為模型是「照著撈到的資料答」,有所本。

💡 RAG 是「給模型臨時補充資料」,不是「重新訓練模型」。模型本身沒變,變的是你餵進上下文的內容。


Memory 記憶

回顧 Agent 篇:模型本身不記憶,上下文視窗是有限的短期工作區。Memory 機制就是用來突破這個限制。

短期記憶 vs 長期記憶

類型 是什麼 怎麼實現
短期記憶 這次對話/任務的進度 就是上下文視窗本身
長期記憶 跨對話、跨任務要記住的事 存到視窗之外(檔案、資料庫),需要時再撈回

常見做法

1. 摘要壓縮:對話太長 → 把舊內容濃縮成摘要,騰出視窗空間
2. 外部儲存:把「使用者偏好、專案設定」等寫進檔案,下次載入
3. 向量檢索:把過去資訊存成 embedding,需要時用 RAG 方式撈回

重點:所謂「AI 記得我」,本質是把資訊存在模型之外,下次再餵回它的上下文——不是模型自己長了記憶。


Multi-Agent 多代理協作

當任務太大太複雜,可以讓多個 Agent 分工合作,而不是一個 Agent 從頭做到尾。

常見模式

主從模式(Orchestrator–Worker):
  ┌─────────────────┐
  │  主 Agent(協調)│  拆解任務、分派、整合結果
  └────────┬────────┘
     ┌──────┼──────┐
     ▼      ▼      ▼
  子Agent  子Agent  子Agent
  (研究) (寫作) (檢查)   各自專注一塊,可平行進行
模式 怎麼運作 適合
主從(協調者) 一個主 Agent 拆解、分派給多個子 Agent,再整合 大任務可拆成獨立子任務
流水線(Pipeline) 一個 Agent 的產出交給下一個處理 有明確先後步驟的流程
辯論/審查 一個 Agent 產出、另一個挑錯驗證 需要高品質、要交叉檢查

為什麼有用

  • 分工專精:每個子 Agent 只專注一件事,表現更好。
  • 平行加速:彼此獨立的子任務可同時跑(呼應 工具平行呼叫)。
  • 獨立上下文:每個子 Agent 有自己的視窗,避免一個視窗塞爆所有東西。

⚠️ 代價:多 Agent 會用更多 token、協調也更複雜。簡單任務用單一 Agent 就好,別過度設計。


全景圖:它們怎麼合作 ⭐

把整個系列五篇的概念串成一張圖——這就是現代 AI Agent(例如 Claude Code)運作的全貌:

圖例:①基礎 ②Agent ③工具 ④MCP ⑤Skills / RAG / 協作

用一個任務串起來

任務:「依我們的規範審查這個 PR,有問題就修。」

1. LLM(①大腦)理解任務
2. 進入 Agent Loop(②):思考 → 行動 → 觀察,迴圈推進
3. 載入「PR 審查」Skill(⑤)——漸進式揭露,這時才載入這套方法手冊
4. Skill 指示要檢查的項目,模型呼叫 Tools(③)讀檔、跑測試
   └─ 這些工具透過 MCP(④)標準化接入
5. 需要對照團隊規範文件 → 用 RAG(⑤)從向量庫撈出相關規範塞進上下文
6. 跨對話要記得的偏好 → 從 Memory(⑤)載入
7. (若任務很大)拆給多個子 Agent 分工(⑤ Multi-Agent)
8. 迴圈直到完成 → 回報結果

每一層都不是孤立的:LLM 是核心,Agent Loop 是運作方式,Tools 是手腳,MCP 讓工具可插拔,Skills/RAG/Memory/Multi-Agent 則讓它能處理更大更專業的任務。


常見問題

問題 1:Skill 和 Tool 差在哪?

Tool 是單一動作(讀檔);Skill 是一整套做事方法(如何審查 PR,含步驟、注意事項、該用哪些工具)。Skill 常會「指揮」模型去用多個 Tool。

問題 2:為什麼 Skills 要「漸進式揭露」?

因為上下文視窗有限。先只放每個 skill 的簡介(省 token),用到哪個才載入它的完整內容——這樣才能同時擁有大量技能而不撐爆視窗。

問題 3:RAG 是在重新訓練模型嗎?

不是。RAG 只是「查到相關資料、塞進上下文讓模型參考」,模型本身沒被改動。它解決的是「模型沒學過/過時/私有」的知識問題。

問題 4:是不是任務都該用 Multi-Agent?

不是。多 Agent 更耗 token、協調更複雜。只有當任務大到可拆成獨立子任務、或需要交叉檢查時才划算;簡單任務單一 Agent 就好。

問題 5:這些東西一定要全部用上嗎?

不用。它們是「按需取用」的工具箱:簡單問答只要 LLM;要做事加 Tools;工具要跨應用共用用 MCP;要封裝專業流程用 Skills;要補私有/即時知識用 RAG。依任務複雜度選用即可。


總結

核心要點

進階能力都是為了突破「模型本身的限制」:

  ├─ Skills      把整套做事方法封裝成手冊,可重用
  ├─ 漸進式揭露   需要時才載入,突破上下文視窗限制
  ├─ RAG         現查現給相關資料,補知識截止/私有資料、減少幻覺
  ├─ Memory      把資訊存在模型外,下次再餵回 → 跨對話「記得」
  └─ Multi-Agent 多 Agent 分工、平行、交叉檢查,處理大任務

全景:LLM(核心) + Agent Loop(運作) + Tools(手腳)
      + MCP(工具標準化) + Skills/RAG/Memory/Multi-Agent(進階能力)

快速記憶

概念 一句話
Skill 一整套做事方法的封裝手冊
漸進式揭露 先給簡介,用到才載入細節,省 token
RAG 檢索相關資料再生成,補私有/即時知識
Memory 把資訊存模型外、再餵回,實現「記得」
Multi-Agent 多 Agent 分工協作處理大任務

學習路徑(系列完結)

① LLM 基礎     —— 理解 token 接龍與其限制 ✓
② AI Agent     —— 從會聊天到會做事 ✓
③ 工具呼叫     —— Agent 的手腳 ✓
④ MCP          —— 工具的標準化插槽 ✓
⑤ Skills 與協作 —— 封裝能力、突破限制、整合全貌 ✓

🎉 你已經建立起對現代 AI Agent 的完整心智模型!

回顧整個系列


建立日期:2026-06-01 最後更新:2026-06-01

🔗相關文章