MiniMax MCP 服务器是一个由 MiniMax 官方维护的开源项目 (采用 MIT 许可证),旨在通过标准化的模型上下文协议 (MCP),让开发者能够便捷地调用 MiniMax 领先的文本转语音、语音克隆、图像和视频生成 API,赋能各类 AI 应用。
MiniMax MCP 服务器将尖端的 AI 模型封装为一系列标准化的工具接口。根据官方文档,目前主要提供以下能力 (使用这些工具可能产生 API 调用费用):
文本转语音。将文本转换为自然流畅的音频,可指定声音 ID (`voiceId`) 并精细调整语速、音量、音高等参数。
列出声音。获取当前所有可用的声音 ID 列表,方便在调用 `text_to_audio` 时进行选择。
语音克隆。基于提供的音频文件 (本地路径/URL) 克隆出特定声音,并为其指定新的 `voiceId`。
文本生成图像。根据文本描述 (`prompt`) 生成图像,可控制宽高比、数量,并能参考图像保持人物一致性。
生成视频。从文本提示 (`prompt`) 生成视频片段,实现高质量的 T2V (文本到视频) 效果。
该项目基于模型上下文协议 (MCP) 构建,提供标准化的接口和灵活的部署选项,方便开发者集成。
为了覆盖更广泛的开发者群体,MiniMax 官方提供了两种主流编程语言的实现:
服务器支持两种通信传输协议,以适应不同的部署场景:
使用前需从 MiniMax 官方平台获取 API 密钥。 极其重要:API 密钥必须与其对应的 API 接入点 (API Host) 所属区域相匹配,否则将遇到 Invalid API key
错误。
密钥来源: minimax.io
API Host: $https://api.minimaxi.chat$
(注意域名中的 "i")
密钥来源: minimaxi.com
API Host: $https://api.minimax.chat$
服务器支持通过环境变量 (如 MINIMAX_API_KEY
)、命令行参数、配置文件等多种方式进行配置。
遵循 MCP 标准,可与多种主流 AI 代理客户端和开发工具无缝集成,将 MiniMax 的能力嵌入现有工具链。
根据官方文档,支持包括但不限于以下客户端:
集成过程通常涉及在客户端配置中指定 MiniMax MCP 服务器的启动方式 (如使用 uvx minimax-mcp
命令) 和必要的环境变量 (API Key, Host, 本地输出路径 MINIMAX_MCP_BASE_PATH
等)。
依赖提示: 官方 Python 实现推荐使用 uv
(一个快速的 Python 包管理器) 进行安装和运行。请确保 uv
或 uvx
在您的系统路径中,或在配置中指定其绝对路径。
MCP 服务器的强大功能,根植于 MiniMax 自主研发的、行业领先的基础 AI 模型矩阵。这些模型是实现高质量多模态生成的核心。
如 MiniMax-Text-01 (大规模 MoE 语言模型) 和 MiniMax-VL-01 (视觉语言模型),为理解和推理提供坚实基础。
如先进的 Speech 系列模型 (Speech-02 等),驱动高质量、高保真的 TTS 和逼真的语音克隆能力。
如 Image-01 和 Video-01 系列模型 (包括强调叙事控制的 Director 模型),支撑高质量图像生成和电影级视频创作。
MCP 服务器的作用是将这些强大的专有模型能力,通过 简单、开放、标准化的 MCP 协议接口 呈现给开发者,实现技术能力的有效输出。
访问 MiniMax MCP 服务器的 GitHub 仓库,查看详细文档和示例,将领先的多模态能力集成到您的 AI 应用中,探索无限创新可能。