2023 में स्थापित और सैन कार्लोस में मुख्यालय वाली सिमुलर एआई एक एआई स्टार्टअप है जो जीयूआई के साथ मानव संपर्क का अनुकरण करने वाले 'कंप्यूटर-उपयोग एजेंट' विकसित करने पर केंद्रित है। संस्थापक आंग ली और जियाचेन यांग की पृष्ठभूमि डीपमाइंड, गूगल और बायडू जैसे शीर्ष संस्थानों से है। मुख्य मिशन ऐसे एआई एजेंट बनाना है जो मनुष्यों की तरह कंप्यूटर का उपयोग कर सकें, थकाऊ डिजिटल कार्यों को स्वचालित कर सकें और मानव क्षमता को मुक्त कर सकें।
मुख्य तकनीक एजेंट एस फ्रेमवर्क और इसका उन्नत संस्करण, एजेंट एस2 है - एक खुला, मॉड्यूलर और विस्तार योग्य एजेंट फ्रेमवर्क। यह उच्च-स्तरीय योजना के लिए सामान्य मॉडल को जोड़ता है और निम्न-स्तरीय निष्पादन और इंटरफ़ेस ग्राउंडिंग के लिए विशेष मॉडल का उपयोग करता है, जिससे कई बेंचमार्क पर अग्रणी प्रदर्शन प्राप्त होता है। एजेंट एस2 प्रोएक्टिव हायरार्किकल प्लानिंग (पीएचपी) और मिक्सचर-ऑफ-ग्राउंडिंग (एमओजी) जैसे नवाचारों का परिचय देता है, जो केवल स्क्रीनशॉट का उपयोग करके सटीक जीयूआई हेरफेर को सक्षम करता है। कंपनी ओपन सोर्स को अपनाती है, और एजेंट एस/एस2 फ्रेमवर्क गिटहब पर उपलब्ध हैं।
उत्पाद पोर्टफोलियो में व्यक्तियों के लिए सिमुलर फॉर मैकओएस/ब्राउज़र (स्थानीय मैक ब्राउज़र एजेंट) और सिमुलर डेस्कटॉप (क्रॉस-प्लेटफ़ॉर्म डेस्कटॉप सहायक), और उद्यमों के लिए सिमुलर फॉर बिजनेस (स्वायत्त डिजिटल कर्मचारी) शामिल हैं। उत्पाद स्थानीय निष्पादन की सुरक्षा और प्रदर्शन पर जोर देते हैं और मानव-कंप्यूटर सहयोग पर ध्यान केंद्रित करते हैं। एक फ्रीमियम मूल्य निर्धारण मॉडल (वर्तमान में बीटा में) अपनाया जाता है, जिसमें व्यवसायों के लिए कस्टम समाधान पेश किए जाते हैं।
2024 में, कंपनी ने बेसिस सेट वेंचर्स, फ्लाइंग फिश पार्टनर्स, सैमसंग नेक्स्ट वेंचर्स और साउथ पार्क कॉमन्स सहित निवेशकों के साथ $5 मिलियन का प्रारंभिक चरण का फंडिंग राउंड पूरा किया।
मुख्य क्षमता, एपीआई पर निर्भर किए बिना मानव संचालन का अनुकरण करके ग्राफिकल इंटरफेस के साथ इंटरैक्ट करता है।
उन्नत मॉड्यूलर एजेंट फ्रेमवर्क जो सामान्य मॉडल प्लानिंग को विशेष मॉडल निष्पादन/ग्राउंडिंग के साथ जोड़ता है।
वास्तविक समय के पर्यावरणीय परिवर्तनों के अनुकूल होने के लिए योजनाओं का सक्रिय रूप से पूर्वानुमान और गतिशील रूप से समायोजन करता है, जिससे कार्य सफलता दर में सुधार होता है।
केवल स्क्रीनशॉट इनपुट का उपयोग करके यूआई तत्वों का सटीक रूप से पता लगाने के लिए कई ग्राउंडिंग विशेषज्ञों का उपयोग करता है।
एजेंट एस/एस2 फ्रेमवर्क ओपन सोर्स हैं, जो सामुदायिक भागीदारी और तकनीकी पारदर्शिता को बढ़ावा देते हैं।
व्यक्तिगत उत्पाद उपयोगकर्ता के डिवाइस पर चलने पर जोर देते हैं, जिससे डेटा सुरक्षा और गोपनीयता सुरक्षा बढ़ती है।
उपयोगकर्ता के डिजिटल संचालन को रिकॉर्ड करता है और उन्हें स्वचालित रूप से रीप्ले कर सकता है, जिससे स्वचालित दोहराए जाने वाले कार्यों का निर्माण सरल हो जाता है।
एजेंट निष्पादन के दौरान त्रुटियां होने पर स्व-सुधार के लिए विभिन्न तरीकों का प्रयास कर सकते हैं, जिससे मजबूती में सुधार होता है।
पारंपरिक स्वचालन विधियों (आरपीए, एपीआई एकीकरण) की सीमाएँ हैं। सिमुलर एआई बुद्धिमान एजेंट बनाने के लिए समर्पित है जो विभिन्न प्लेटफार्मों पर जीयूआई को सीधे **समझ, तर्क और संचालित** कर सकते हैं। हमारे '**कंप्यूटर-उपयोग एजेंट**' स्क्रीन का अवलोकन करके स्थिति को समझते हैं, मानव कीबोर्ड और माउस संचालन का सटीक अनुकरण करते हैं, और **तेज सोच** (सहज प्रतिक्रिया) और **धीमी सोच** (गहन तर्क) के संज्ञानात्मक पैटर्न को एकीकृत करते हैं।
मुख्य तकनीक **खुले, मॉड्यूलर और विस्तार योग्य** एजेंट एस/एस2 फ्रेमवर्क में सन्निहित है। दोनों उच्च-स्तरीय योजना के लिए **सामान्य मॉडल** का उपयोग करने और निम्न-स्तरीय निष्पादन और इंटरफ़ेस '**ग्राउंडिंग**' के लिए **विशेष मॉडल** का उपयोग करने के डिजाइन सिद्धांत का पालन करते हैं।
तकनीकी आयाम | एजेंट एस | एजेंट एस2 (नवाचार) |
---|---|---|
योजना क्षमता | अनुभव-वर्धित पदानुक्रमित योजना | **प्रोएक्टिव हायरार्किकल प्लानिंग (पीएचपी)**: भविष्य की स्थितियों का पूर्वानुमान लगाता है और योजनाओं को गतिशील रूप से समायोजित करता है |
मानव-कंप्यूटर इंटरफ़ेस | बेसिक एजेंट-कंप्यूटर इंटरफ़ेस (एसीआई) | **उन्नत एसीआई**: विशेषज्ञ मॉड्यूल को बुद्धिमानी से कार्य सौंपता है |
जीयूआई तत्व स्थानीयकरण | मल्टीमॉडल इनपुट पर निर्भर करता है, एक्सेसिबिलिटी एपीआई द्वारा सीमित | **मिक्सचर-ऑफ-ग्राउंडिंग (एमओजी)**: केवल स्क्रीनशॉट का उपयोग करके इंटरफ़ेस तत्वों का सटीक रूप से पता लगाता है |
सीखना और अनुकूलन | बुनियादी अनुभव स्मृति तंत्र | **उन्नत मेमोरी सिस्टम और स्व-सुधार**: निरंतर सीखना और रणनीति समायोजन |
ओपन सोर्स सिमुलर एआई के लिए एक मुख्य विभेदक है। एजेंट एस/एस2 फ्रेमवर्क गिटहब पर पूरी तरह से ओपन-सोर्स हैं। कंपनी कई सक्रिय रिपॉजिटरी (एजेंट-एस, ओपनएसीआई, पायसिमुलर, आदि) बनाए रखती है और डेवलपर एक्सचेंज को बढ़ावा देने के लिए एक डिस्कॉर्ड समुदाय स्थापित किया है। फ्रेमवर्क का उपयोग करने के लिए पायथन वातावरण और डॉकर को कॉन्फ़िगर करने की आवश्यकता होती है, और यह बाहरी एलएलएम सेवाओं और विशेष ग्राउंडिंग मॉडल पर निर्भर करता है।
उत्पाद डिजाइन उपयोगकर्ताओं के साथ सहयोग करने वाले एआई एजेंटों के इर्द-गिर्द घूमता है, जो **मानव-कंप्यूटर सहयोग** और उपयोगकर्ता नियंत्रण पर जोर देता है। सुरक्षा, जवाबदेही और अनुभव को बढ़ाने के लिए **स्थानीय निष्पादन (ऑन-डिवाइस)** पर ध्यान केंद्रित करता है। डिजिटल क्रियाओं को रिकॉर्ड करने, साझा करने और रीप्ले करने के लिए सुविधाएँ प्रदान करता है।
विभिन्न उपयोगकर्ता आवश्यकताओं को कवर करने वाले उत्पादों की एक श्रृंखला प्रदान करता है:
योजना का नाम | कीमत | मुख्य विशेषताएं | लक्षित उपयोगकर्ता | उपलब्ध ऐड-ऑन |
---|---|---|---|---|
मुफ्त योजना | ₹0/माह | बुनियादी कार्यक्षेत्र उपकरण; सार्वजनिक सामुदायिक क्रियाएँ; कोई निजी क्रियाएँ नहीं | व्यक्तिगत शुरुआती उपयोगकर्ता | कोई नहीं |
प्रीमियम योजना | ₹1650/डिवाइस/माह (अनुमानित) | मुफ्त सुविधाएँ शामिल हैं; निजी/टीम चैनल क्रियाएँ; स्थानीय निष्पादन | गोपनीयता/सहयोग की आवश्यकता वाले व्यक्ति/टीमें | सर्वर, कंसीयज |
सिमुलर फॉर बिजनेस | बिक्री से संपर्क करें | स्वायत्त डिजिटल कर्मचारी; एंटरप्राइज़-ग्रेड सुविधाएँ और सेवाएँ | उद्यम उपयोगकर्ता | कस्टम सेवाएँ |
प्रीमियम ऐड-ऑन सेवाएँ | ||||
सर्वर | +₹3300/डिवाइस/माह (अनुमानित) | सिमुलर होस्टेड सर्वर; 200 एजेंट घंटे शामिल हैं; अतिरिक्त ₹8/घंटा (अनुमानित) | क्लाउड कंप्यूटिंग शक्ति की आवश्यकता वाले उपयोगकर्ता | - |
कंसीयज | बिक्री से संपर्क करें | स्वयं क्रियाएँ बनाए बिना कस्टम परिणामों के लिए सिमुलर विशेषज्ञों से अनुरोध करें | विशेषज्ञ सेवाओं की आवश्यकता वाले उपयोगकर्ता | - |
यह खंड तेजी से विकसित हो रहा है, महत्वपूर्ण ध्यान और निवेश आकर्षित कर रहा है। मुख्य उद्देश्यों में वर्कफ़्लो स्वचालन, कार्य निष्पादन, कोड जनरेशन, डेटा विश्लेषण और सॉफ़्टवेयर इंटरैक्शन (जीयूआई/एपीआई) शामिल हैं।
विविध तकनीकी पथ: प्रत्यक्ष जीयूआई इंटरैक्शन, एपीआई ऑर्केस्ट्रेशन, कोड जनरेशन, संवादी एआई, नो-कोड/लो-कोड प्लेटफ़ॉर्म।
सिमुलर एआई बहु-आयामी प्रतिस्पर्धा का सामना करता है:
**प्रत्यक्ष जीयूआई स्वचालन प्रतियोगी:** ओपनएआई ऑपरेटर/सीयूए, मानुस एआई, जेनस्पार्क सुपरएजेंट, ऐस, प्रॉक्सी एआई।
**व्यापक एआई एजेंट फ्रेमवर्क/प्लेटफ़ॉर्म:** लैंगचेन, ऑटोजेन, क्रूएआई, नो-कोड/लो-कोड प्लेटफ़ॉर्म (गमलूप, एन8एन, गूगल, माइक्रोसॉफ्ट, यूआईपाथ, आदि), अन्य ओपन-सोर्स एजेंट (रासा, हेस्टैक, आदि)।
**मौजूदा उत्पादकता सूट:** माइक्रोसॉफ्ट 365 कोपायलट, गूगल वर्कस्पेस एआई।
प्रतियोगी | फोकस | प्रौद्योगिकी/विधि | ओपन सोर्स | उपयोग का मामला | विभेदन |
---|---|---|---|---|---|
Simular AI | जीयूआई स्वचालन | मॉड्यूलर (एमओजी, पीएचपी), मानव-जैसा इंटरैक्शन, स्क्रीनशॉट विश्लेषण | हाँ (कोर) | व्यक्तिगत/उद्यम स्वचालन | ओपन सोर्स, स्थानीय निष्पादन, मानव-सहयोग, एसओटीए |
OpenAI Operator | जीयूआई स्वचालन | जीपीटी-4ओ, कार्य अपघटन | नहीं (मॉडल) | फॉर्म/ई-कॉमर्स | ओपनएआई इकोसिस्टम, मजबूत बेस मॉडल |
Manus AI | सामान्य एआई एजेंट (जीयूआई) | मल्टी-एजेंट सहयोग, या क्लाउड 3.x का उपयोग करता है | नहीं | जटिल कार्य स्वचालन | उच्च ध्यान/फंडिंग, विश्वसनीयता संबंधी चिंताएँ |
Genspark Superagent | एपीआई ऑर्केस्ट्रेशन/टूल कॉलिंग | हाइब्रिड एजेंट (9+ मॉडल), 80+ उपकरण, एपीआई एकीकरण | नहीं | व्यापक कंप्यूटर कार्य | हाइब्रिड एजेंट, रिच टूलसेट, एपीआई फोकस |
Ace | जीयूआई स्वचालन | प्रत्यक्ष स्थानीय के/एम नियंत्रण, अवलोकन संबंधी शिक्षा | नहीं | त्वरित डेस्कटॉप कार्य | स्थानीय प्रत्यक्ष नियंत्रण, गति का दावा |
Proxy AI | वेब ब्राउज़िंग स्वचालन | समानांतर प्रसंस्करण (मल्टी-एजेंट), प्राकृतिक भाषा आदेश | नहीं | वेब अनुसंधान/डेटा संग्रह/फॉर्म भरना | वेब फोकस, समानांतर प्रसंस्करण स्पीडअप |
LangChain | एलएलएम एप्लीकेशन फ्रेमवर्क | प्रॉम्प्ट चेनिंग, डेटा एकीकरण, एजेंट मॉड्यूल | हाँ | विभिन्न एलएलएम ऐप बनाना | व्यापक इकोसिस्टम, लचीला, जीयूआई-केंद्रित नहीं |
AutoGen | मल्टी-एजेंट वार्तालाप फ्रेमवर्क | मल्टी-एजेंट समन्वय, कोड जनरेशन, स्व-सुधार | हाँ | जटिल वर्कफ़्लो, प्रोग्रामिंग कार्य | माइक्रोसॉफ्ट समर्थन, कोड/मल्टी-एजेंट इंटरैक्शन में मजबूत |
CrewAI | मल्टी-एजेंट ऑर्केस्ट्रेशन फ्रेमवर्क | भूमिका-खेल एजेंट सहयोग, कार्य प्रतिनिधिमंडल | हाँ | सहयोगी कार्य स्वचालन | उच्च प्रयोज्यता, एजेंट टीम समन्वय पर ध्यान केंद्रित करें |
UiPath Agent Builder | लो-कोड प्लेटफ़ॉर्म | विज़ुअल डिज़ाइन, यूआईपाथ इकोसिस्टम को एकीकृत करता है | नहीं | एंटरप्राइज़ आरपीए/स्वचालन | उद्यम-केंद्रित, गहरा यूआईपाथ एकीकरण |