
playwright mcp
Playwright MCP 是 Microsoft 官方推出的模型上下文協定伺服器,它透過 Playwright 為 AI 智慧代理帶來完整的瀏覽器自動化功能。此伺服器讓 LLM 能夠透過結構化的無障礙存取快照來導航、互動和檢查網頁內容,無需視覺模型即可實現。
概述
Playwright MCP 是微軟官方開發的 Model Context Protocol (MCP) 伺服器。它透過標準化的 MCP 介面,將 Playwright — 這套可靠、快速且跨瀏覽器的自動化函式庫 — 的完整功能提供給 AI 代理和大型語言模型 (LLMs)。
Playwright MCP 不依賴螢幕截圖或視覺模型,而是提供網頁 DOM 和無障礙樹狀結構 (accessibility tree) 豐富、結構化的無障礙快照。這使得 AI 代理能夠以確定性且節省令牌 (token) 的方式,理解、瀏覽並與網頁應用程式互動。
它能與 Claude Desktop、Cursor、內嵌 GitHub Copilot 的 VS Code、Windsurf 以及任何相容於 MCP 的客戶端工具無縫整合。
核心功能
- 結構化無障礙快照:返回清晰、階層化的頁面結構(無需基於像素的視覺模型)。
- 完整的瀏覽器控制:瀏覽網址、點擊元素、輸入文字、等待條件、捲動頁面,以及處理框架/彈出視窗。
- JavaScript 執行:在瀏覽器上下文中執行自訂指令碼。
- 螢幕截圖與狀態檢查:擷取螢幕截圖或根據需求取得目前頁面狀態。
- 多瀏覽器支援:支援 Chromium、Firefox 和 WebKit,並提供可配置選項(無頭模式或視窗模式)。
- 持續性瀏覽器會話:在複雜的多步驟工作流程中,跨多個工具調用維持狀態。
- MCP 標準相容:基於 JSON-RPC,具備工具發現功能,支援 stdio 及其他傳輸方式。
- 代理友好設計:針對低上下文負擔和可靠的迭代推理進行優化。
使用案例
- AI 驅動的網頁自動化:讓代理填寫表單、抓取資料或在動態網站上執行操作。
- 測試生成與執行:AI 透過探索實際運行的應用程式來生成並執行端到端測試。
- 除錯與探索:在真實瀏覽器中重現錯誤、檢查 UI 狀態或驗證變更。
- 自主代理:建立可與 SaaS 工具、電子商務網站或內部網頁應用程式互動的代理。
- 自我修復工作流程:代理利用無障礙樹狀結構的內省功能來適應 UI 變更。
- 研究與資料收集:與其他 MCP 伺服器(例如資料庫或 API 工具)結合,實現端到端自動化。
安裝與快速開始
使用 npx (適用於大多數客戶端的推薦方式)
npx @playwright/mcp@latest
設定範例
適用於 Claude Desktop / Claude Code: 請將以下內容加入您的 MCP 設定檔中:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest"]
}
}
}
適用於 VS Code / Cursor:
透過 mcp.json 檔案或內建的 MCP 擴充功能支援進行類似設定。
無頭模式(適用於伺服器/CI):
npx @playwright/mcp@latest --headless
完整的安裝說明、可用工具清單以及進階設定(瀏覽器選擇、視窗大小等),請參閱 官方儲存庫 與 Playwright 文件 。
為何選擇 Playwright MCP?
傳統的 AI 瀏覽器自動化通常依賴脆弱的螢幕截圖或自訂的視覺處理流程。Playwright MCP 則運用 Playwright 經過實戰考驗的引擎,直接向模型提供 結構化、語意化的資料。這使得在複雜的網頁使用者介面上,能實現更高的可靠性、更低的 token 消耗以及更佳的效能。
它與程式碼代理工具搭配使用效果尤其出色:AI 可以探索網站、理解其結構、生成測試或程式碼,甚至能在實際的瀏覽器工作階段中自行驗證操作。
安全性與最佳實務
- 盡可能在隔離環境或容器中執行。
- 除錯時使用有頭模式;生產環境的代理工具則使用無頭模式。
- 結合其他 MCP 伺服器(例如 PostgreSQL MCP)以建立安全的多工具工作流程。
- 監控長時間執行的工作階段,以避免資源洩漏。
相關連結
- GitHub:microsoft/playwright-mcp
- 官方文件:playwright.dev/docs/getting-started-mcp
- Playwright 主網站:playwright.dev
Playwright MCP 代表了在 2026 年邁向真正具備能力、原生於瀏覽器的 AI 代理工具的重要一步。