मिनीमैक्स एमसीपी सर्वर मिनीमैक्स द्वारा अनुरक्षित एक ओपन-सोर्स प्रोजेक्ट (एमआईटी लाइसेंस) है। इसका उद्देश्य मानकीकृत मॉडल कॉन्टेक्स्ट प्रोटोकॉल (एमसीपी) के माध्यम से डेवलपर्स को मिनीमैक्स की अग्रणी टेक्स्ट-टू-स्पीच, वॉयस क्लोनिंग, इमेज और वीडियो जनरेशन एपीआई को आसानी से कॉल करने में सक्षम बनाना है, जिससे विभिन्न एआई अनुप्रयोगों को सशक्त बनाया जा सके।
मिनीमैक्स एमसीपी सर्वर अत्याधुनिक एआई मॉडल को मानकीकृत टूल इंटरफेस की एक श्रृंखला में समाहित करता है। आधिकारिक दस्तावेज़ीकरण के अनुसार, वर्तमान में निम्नलिखित क्षमताएं प्रदान की जाती हैं (इन उपकरणों का उपयोग करने पर एपीआई कॉल शुल्क लग सकता है):
टेक्स्ट-टू-स्पीच। टेक्स्ट को प्राकृतिक और धाराप्रवाह ऑडियो में बदलें। `voiceId` निर्दिष्ट करें और गति, वॉल्यूम और पिच जैसे मापदंडों को ठीक करें।
आवाज़ें सूचीबद्ध करें। `text_to_audio` कॉल करते समय चयन के लिए वर्तमान में उपलब्ध सभी वॉयस आईडी की सूची प्राप्त करें।
वॉयस क्लोनिंग। प्रदान की गई ऑडियो फ़ाइल (स्थानीय पथ/यूआरएल) के आधार पर एक विशिष्ट आवाज का क्लोन बनाएं और उसे एक नया `voiceId` असाइन करें।
टेक्स्ट-टू-इमेज जनरेशन। टेक्स्ट विवरण (`prompt`) के आधार पर छवियां उत्पन्न करें। पहलू अनुपात, मात्रा को नियंत्रित करें, और किसी छवि का संदर्भ देकर चरित्र स्थिरता बनाए रखें।
वीडियो उत्पन्न करें। टेक्स्ट प्रॉम्प्ट (`prompt`) से वीडियो क्लिप बनाएं, उच्च-गुणवत्ता वाले T2V (टेक्स्ट-टू-वीडियो) प्रभाव प्राप्त करें।
यह परियोजना मॉडल कॉन्टेक्स्ट प्रोटोकॉल (एमसीपी) पर बनी है, जो आसान डेवलपर एकीकरण के लिए मानकीकृत इंटरफेस और लचीले परिनियोजन विकल्प प्रदान करती है।
एक व्यापक डेवलपर समुदाय को कवर करने के लिए, मिनीमैक्स आधिकारिक तौर पर दो मुख्यधारा प्रोग्रामिंग भाषाओं में कार्यान्वयन प्रदान करता है:
सर्वर विभिन्न परिनियोजन परिदृश्यों के अनुकूल होने के लिए दो संचार परिवहन प्रोटोकॉल का समर्थन करता है:
उपयोग करने से पहले आधिकारिक मिनीमैक्स प्लेटफॉर्म से एक एपीआई कुंजी प्राप्त की जानी चाहिए। अत्यंत महत्वपूर्ण: एपीआई कुंजी को उसके संबंधित एपीआई होस्ट के क्षेत्र से मेल खाना चाहिए, अन्यथा Invalid API key
त्रुटि होगी।
कुंजी स्रोत: minimax.io
एपीआई होस्ट: $https://api.minimaxi.chat$
(注意域名中的 "i")
कुंजी स्रोत: minimaxi.com
एपीआई होस्ट: $https://api.minimax.chat$
सर्वर पर्यावरण चर (जैसे, MINIMAX_API_KEY
), कमांड-लाइन तर्क, कॉन्फ़िगरेशन फ़ाइलें आदि के माध्यम से कॉन्फ़िगरेशन का समर्थन करता है।
एमसीपी मानक का पालन करते हुए, यह विभिन्न मुख्यधारा एआई एजेंट क्लाइंट और विकास उपकरणों के साथ सहजता से एकीकृत होता है, मिनीमैक्स क्षमताओं को मौजूदा टूलचेन में एम्बेड करता है।
आधिकारिक दस्तावेज़ीकरण के अनुसार, समर्थित क्लाइंट में शामिल हैं, लेकिन इन्हीं तक सीमित नहीं हैं:
एकीकरण में आमतौर पर क्लाइंट कॉन्फ़िगरेशन में मिनीमैक्स एमसीपी सर्वर स्टार्टअप विधि (जैसे, uvx minimax-mcp
कमांड का उपयोग करके) और आवश्यक पर्यावरण चर (एपीआई कुंजी, होस्ट, स्थानीय आउटपुट पथ MINIMAX_MCP_BASE_PATH
, आदि) निर्दिष्ट करना शामिल है।
निर्भरता युक्ति: आधिकारिक पायथन कार्यान्वयन स्थापना और निष्पादन के लिए uv
(एक तेज़ पायथन पैकेज मैनेजर) का उपयोग करने की अनुशंसा करता है। सुनिश्चित करें कि uv
या uvx
आपके सिस्टम पथ में है, या कॉन्फ़िगरेशन में इसका पूर्ण पथ निर्दिष्ट करें।
एमसीपी सर्वर की शक्तिशाली क्षमताएं मिनीमैक्स के स्व-विकसित, उद्योग-अग्रणी मूलभूत एआई मॉडल के मैट्रिक्स में निहित हैं। ये मॉडल उच्च-गुणवत्ता वाले मल्टीमॉडल पीढ़ी को प्राप्त करने के लिए मुख्य हैं।
जैसे कि मिनीमैक्स-टेक्स्ट-01 (बड़े पैमाने पर एमओई भाषा मॉडल) और मिनीमैक्स-वीएल-01 (विजन भाषा मॉडल), समझने और तर्क करने के लिए एक ठोस आधार प्रदान करते हैं।
जैसे कि उन्नत स्पीच श्रृंखला मॉडल (स्पीच-02, आदि), उच्च-गुणवत्ता, उच्च-निष्ठा टीटीएस और यथार्थवादी आवाज क्लोनिंग क्षमताओं को संचालित करते हैं।
जैसे कि इमेज-01 और वीडियो-01 श्रृंखला मॉडल (कथा नियंत्रण पर जोर देने वाले डायरेक्टर मॉडल सहित), उच्च-गुणवत्ता वाली छवि पीढ़ी और सिनेमाई वीडियो निर्माण का समर्थन करते हैं।
एमसीपी सर्वर की भूमिका इन शक्तिशाली मालिकाना मॉडल क्षमताओं को सरल, खुले, मानकीकृत एमसीपी प्रोटोकॉल इंटरफेस के माध्यम से डेवलपर्स के सामने प्रस्तुत करना है, जिससे प्रभावी प्रौद्योगिकी आउटपुट सक्षम हो सके।
मिनीमैक्स एमसीपी सर्वर के GitHub रिपॉजिटरी पर जाएं, विस्तृत दस्तावेज़ीकरण और उदाहरण देखें, अग्रणी मल्टीमॉडल क्षमताओं को अपने एआई अनुप्रयोगों में एकीकृत करें, और अनंत नवाचार संभावनाओं का पता लगाएं।