MiniMax MCP 伺服器是一個由 MiniMax 官方維護的開源專案(採用 MIT 授權條款),旨在透過標準化的模型上下文協定(MCP),讓開發者能夠便捷地調用 MiniMax 領先的文字轉語音、語音克隆、圖像和影片生成 API,賦能各類 AI 應用。
MiniMax MCP 伺服器將尖端的 AI 模型封裝為一系列標準化的工具介面。根據官方文件,目前主要提供以下能力(使用這些工具可能產生 API 呼叫費用):
文字轉語音。將文字轉換為自然流暢的音訊,可指定聲音 ID (`voiceId`) 並精細調整語速、音量、音高等參數。
列出聲音。獲取當前所有可用的聲音 ID 列表,方便在調用 `text_to_audio` 時進行選擇。
語音克隆。基於提供的音訊檔案(本地路徑/URL)克隆出特定聲音,並為其指定新的 `voiceId`。
文字生成圖像。根據文字描述(`prompt`)生成圖像,可控制長寬比、數量,並能參考圖像保持人物一致性。
生成影片。從文字提示(`prompt`)生成影片片段,實現高品質的 T2V(文字到影片)效果。
該專案基於模型上下文協定(MCP)建構,提供標準化的介面和靈活的部署選項,方便開發者整合。
為了涵蓋更廣泛的開發者群體,MiniMax 官方提供了兩種主流程式語言的實現:
伺服器支援兩種通訊傳輸協定,以適應不同的部署場景:
使用前需從 MiniMax 官方平台獲取 API 金鑰。極其重要:API 金鑰必須與其對應的 API 接入點(API Host)所屬區域相匹配,否則將遇到 Invalid API key
錯誤。
金鑰來源: minimax.io
API Host: $https://api.minimaxi.chat$
(注意域名中的 "i")
金鑰來源: minimaxi.com
API Host: $https://api.minimax.chat$
伺服器支援透過環境變數(如 MINIMAX_API_KEY
)、命令列參數、設定檔等多種方式進行配置。
遵循 MCP 標準,可與多種主流 AI 代理客戶端和開發工具無縫整合,將 MiniMax 的能力嵌入現有工具鏈。
根據官方文件,支援包括但不限於以下客戶端:
整合過程通常涉及在客戶端配置中指定 MiniMax MCP 伺服器的啟動方式(如使用 uvx minimax-mcp
命令)和必要的環境變數(API Key, Host, 本地輸出路徑 MINIMAX_MCP_BASE_PATH
等)。
依賴提示:官方 Python 實現推薦使用 uv
(一個快速的 Python 套件管理器)進行安裝和運行。請確保 uv
或 uvx
在您的系統路徑中,或在配置中指定其絕對路徑。
MCP 伺服器的強大功能,根植於 MiniMax 自主研發的、行業領先的基礎 AI 模型矩陣。這些模型是實現高品質多模態生成的核心。
如 MiniMax-Text-01(大規模 MoE 語言模型)和 MiniMax-VL-01(視覺語言模型),為理解和推理提供堅實基礎。
如先進的 Speech 系列模型(Speech-02 等),驅動高品質、高保真的 TTS 和逼真的語音克隆能力。
如 Image-01 和 Video-01 系列模型(包括強調敘事控制的 Director 模型),支撐高品質圖像生成和電影級影片創作。
MCP 伺服器的作用是將這些強大的專有模型能力,透過 簡單、開放、標準化的 MCP 協定介面 呈現給開發者,實現技術能力的有效輸出。
訪問 MiniMax MCP 伺服器的 GitHub 倉庫,查看詳細文件和範例,將領先的多模態能力整合到您的 AI 應用程式中,探索無限創新可能。