MiniMax MCP 服务器

MiniMax MCP 服务器是一个由 MiniMax 官方维护的开源项目 (采用 MIT 许可证),旨在通过标准化的模型上下文协议 (MCP),让开发者能够便捷地调用 MiniMax 领先的文本转语音、语音克隆、图像和视频生成 API,赋能各类 AI 应用。

通过 MCP 提供的核心工具

MiniMax MCP 服务器将尖端的 AI 模型封装为一系列标准化的工具接口。根据官方文档,目前主要提供以下能力 (使用这些工具可能产生 API 调用费用):

text to audio

文本转语音。将文本转换为自然流畅的音频,可指定声音 ID (`voiceId`) 并精细调整语速、音量、音高等参数。

list voices

列出声音。获取当前所有可用的声音 ID 列表,方便在调用 `text_to_audio` 时进行选择。

voice clone

语音克隆。基于提供的音频文件 (本地路径/URL) 克隆出特定声音,并为其指定新的 `voiceId`。

text to image

文本生成图像。根据文本描述 (`prompt`) 生成图像,可控制宽高比、数量,并能参考图像保持人物一致性。

generate video

生成视频。从文本提示 (`prompt`) 生成视频片段,实现高质量的 T2V (文本到视频) 效果。

开放标准与技术实现

该项目基于模型上下文协议 (MCP) 构建,提供标准化的接口和灵活的部署选项,方便开发者集成。

官方实现版本

为了覆盖更广泛的开发者群体,MiniMax 官方提供了两种主流编程语言的实现:

传输机制与部署

服务器支持两种通信传输协议,以适应不同的部署场景:

  • stdio (标准输入/输出): 主要用于本地运行,客户端直接启动和管理服务器进程。适合处理本地文件路径输入。
  • SSE (Server-Sent Events): 基于 HTTP,允许服务器作为独立服务部署 (本地或云端),客户端通过网络 URL 访问。推荐使用 URL 指定云端输入资源。

API 密钥与区域配置

使用前需从 MiniMax 官方平台获取 API 密钥。 极其重要:API 密钥必须与其对应的 API 接入点 (API Host) 所属区域相匹配,否则将遇到 Invalid API key 错误。

全球区域 (Global)

密钥来源: minimax.io

API Host: $https://api.minimaxi.chat$ (注意域名中的 "i")

中国大陆区域 (Mainland)

密钥来源: minimaxi.com

API Host: $https://api.minimax.chat$

服务器支持通过环境变量 (如 MINIMAX_API_KEY)、命令行参数、配置文件等多种方式进行配置。

轻松集成至开发工作流

遵循 MCP 标准,可与多种主流 AI 代理客户端和开发工具无缝集成,将 MiniMax 的能力嵌入现有工具链。

广泛的客户端兼容性

根据官方文档,支持包括但不限于以下客户端:

Claude Desktop Logo Claude Desktop Anthropic 出品的 AI 助手桌面应用
Cursor Logo Cursor 集成了 AI 功能的代码编辑器
ModelScope Logo ModelScope (魔搭) 中国领先的 AI 开源社区
Windsurf Logo Windsurf 支持 MCP 的 AI 开发环境
OpenAI Agents Logo OpenAI Agents 可使用外部工具的 OpenAI 代理
... 及其他 MCP 客户端

快速开始集成

集成过程通常涉及在客户端配置中指定 MiniMax MCP 服务器的启动方式 (如使用 uvx minimax-mcp 命令) 和必要的环境变量 (API Key, Host, 本地输出路径 MINIMAX_MCP_BASE_PATH 等)。

依赖提示: 官方 Python 实现推荐使用 uv (一个快速的 Python 包管理器) 进行安装和运行。请确保 uvuvx 在您的系统路径中,或在配置中指定其绝对路径。

查看详细配置指南

协议背后的驱动力

MCP 服务器的强大功能,根植于 MiniMax 自主研发的、行业领先的基础 AI 模型矩阵。这些模型是实现高质量多模态生成的核心。

文本 & 视觉语言模型

如 MiniMax-Text-01 (大规模 MoE 语言模型) 和 MiniMax-VL-01 (视觉语言模型),为理解和推理提供坚实基础。

语音 & 音频模型

如先进的 Speech 系列模型 (Speech-02 等),驱动高质量、高保真的 TTS 和逼真的语音克隆能力。

图像 & 视频模型

如 Image-01 和 Video-01 系列模型 (包括强调叙事控制的 Director 模型),支撑高质量图像生成和电影级视频创作。

MCP 服务器的作用是将这些强大的专有模型能力,通过 简单、开放、标准化的 MCP 协议接口 呈现给开发者,实现技术能力的有效输出。

准备好开始构建了吗?

访问 MiniMax MCP 服务器的 GitHub 仓库,查看详细文档和示例,将领先的多模态能力集成到您的 AI 应用中,探索无限创新可能。

关于 A2A MCP

致力于追踪和解析 A2A、MCP 等关键 AI 协议,提供洞察与资源。

© 2025 A2A MCP. 保留所有权利。 | 隐私政策 | 服务条款