تأسست Simular AI في عام 2023 ومقرها في سان كارلوس، وهي شركة ناشئة في مجال الذكاء الاصطناعي تركز على تطوير 'وكلاء استخدام الكمبيوتر' التي تحاكي تفاعل الإنسان مع واجهات المستخدم الرسومية (GUI). يتمتع المؤسسان Ang Li و Jiachen Yang بخبرة من مؤسسات مرموقة مثل DeepMind و Google و Baidu. تتمثل المهمة الأساسية في إنشاء وكلاء ذكاء اصطناعي يمكنهم استخدام أجهزة الكمبيوتر مثل البشر، وأتمتة المهام الرقمية المملة، وإطلاق العنان للإمكانات البشرية.
التكنولوجيا الأساسية هي إطار عمل Agent S وإصداره المحدث Agent S2 - وهو إطار عمل وكيل مفتوح المصدر ومعياري وقابل للتوسيع. يجمع بين النماذج العامة للتخطيط عالي المستوى ويستخدم نماذج متخصصة للتنفيذ منخفض المستوى وتأريض الواجهة، مما يجعله رائدًا في العديد من الاختبارات المعيارية. يقدم Agent S2 ابتكارات مثل التخطيط الهرمي الاستباقي (PHP) والتأريض الهجين (MoG)، مما يمكنه من تشغيل واجهات المستخدم الرسومية بدقة باستخدام لقطات الشاشة فقط. تتبنى الشركة المصادر المفتوحة، حيث تتوفر أطر عمل Agent S/S2 على GitHub.
تتضمن مجموعة المنتجات Simular لنظام macOS/المتصفح (وكيل متصفح Mac محلي) و Simular Desktop (مساعد سطح المكتب متعدد المنصات) للأفراد، و Simular for Business (قوة عاملة رقمية مستقلة) للشركات. تؤكد المنتجات على أمان وأداء التنفيذ المحلي وتركز على التعاون بين الإنسان والآلة. تعتمد نموذج تسعير مجاني (freemium) (حاليًا في مرحلة تجريبية) وتقدم حلولًا مخصصة للشركات.
في عام 2024، أكملت الشركة جولة تمويل أولية بقيمة 5 ملايين دولار بمشاركة مستثمرين مثل Basis Set Ventures و Flying Fish Partners و Samsung NEXT Ventures و South Park Commons.
القدرة الأساسية على التفاعل مع الواجهات الرسومية من خلال محاكاة العمليات البشرية، دون الاعتماد على واجهات برمجة التطبيقات (APIs).
إطار عمل وكيل معياري متقدم يجمع بين تخطيط النموذج العام وتنفيذ/تأريض النموذج المتخصص.
يتنبأ ويضبط الخطط ديناميكيًا للتكيف مع التغيرات البيئية في الوقت الفعلي، مما يحسن معدلات نجاح المهام.
يستخدم العديد من خبراء التأريض لتحديد عناصر واجهة المستخدم بدقة، ويتطلب فقط إدخال لقطات الشاشة.
أطر عمل Agent S/S2 مفتوحة المصدر، مما يعزز مشاركة المجتمع والشفافية التكنولوجية.
تؤكد المنتجات الشخصية على التشغيل على جهاز المستخدم، مما يعزز أمن البيانات والخصوصية.
يسجل الإجراءات الرقمية للمستخدم ويمكنه إعادة تشغيلها تلقائيًا، مما يبسط إنشاء الأتمتة للمهام المتكررة.
يمكن للوكيل تجربة طرق مختلفة لتصحيح نفسه عند حدوث أخطاء في التنفيذ، مما يحسن المتانة.
طرق الأتمتة التقليدية (RPA، تكامل API) لها قيود. تكرس Simular AI جهودها لبناء وكلاء أذكياء يمكنهم **الإدراك والاستدلال والتشغيل** مباشرة لواجهات المستخدم الرسومية على منصات مختلفة. يفهم '**وكلاء استخدام الكمبيوتر**' لدينا الحالة من خلال مراقبة الشاشة، ويحاكون بدقة عمليات لوحة المفاتيح والماوس البشرية، ويدمجون الأنماط المعرفية **للتفكير السريع** (رد الفعل البديهي) و**التفكير البطيء** (الاستدلال العميق).
تتجسد التكنولوجيا الأساسية في أطر عمل Agent S/S2 **المفتوحة والمعيارية والقابلة للتوسيع**. كلاهما يتبنى مبدأ التصميم المتمثل في استخدام **النماذج العامة** للتخطيط عالي المستوى و**النماذج المتخصصة** للتنفيذ منخفض المستوى و '**تأريض**' الواجهة.
البعد التقني | Agent S | Agent S2 (ابتكارات) |
---|---|---|
قدرة التخطيط | التخطيط الهرمي المعزز بالخبرة | **التخطيط الهرمي الاستباقي (PHP)**: يتنبأ بالحالات المستقبلية ويضبط الخطط ديناميكيًا |
واجهة الإنسان والآلة | واجهة الوكيل والحاسوب الأساسية (ACI) | **ACI المحسّنة**: تعيين المهام بذكاء للوحدات المتخصصة |
تحديد موقع عناصر واجهة المستخدم الرسومية | يعتمد على المدخلات متعددة الوسائط، محدود بواجهات برمجة تطبيقات إمكانية الوصول | **التأريض الهجين (MoG)**: يحدد عناصر الواجهة بدقة باستخدام لقطات الشاشة فقط |
التعلم والتكيف | آلية ذاكرة الخبرة الأساسية | **نظام ذاكرة متقدم وتصحيح ذاتي**: التعلم المستمر وتعديل الاستراتيجية |
المصدر المفتوح هو ميزة تنافسية أساسية لـ Simular AI. أطر عمل Agent S/S2 مفتوحة المصدر بالكامل على GitHub. تحتفظ الشركة بالعديد من مستودعات الأكواد النشطة (Agent-S، OpenACI، pysimular، إلخ) وأنشأت مجتمعًا على Discord لتعزيز التفاعل بين المطورين. يتطلب استخدام إطار العمل تكوين بيئة Python و Docker، ويعتمد على خدمات LLM خارجية ونماذج تأريض متخصصة.
يدور تصميم المنتج حول وكلاء الذكاء الاصطناعي الذين يتعاونون مع المستخدمين، مع التركيز على **التعاون بين الإنسان والآلة** وتحكم المستخدم. يركز على **التنفيذ المحلي (على الجهاز)** لتعزيز الأمان وسرعة الاستجابة والتجربة. يوفر ميزات لتسجيل الإجراءات الرقمية ومشاركتها وإعادة تشغيلها.
تقدم مجموعة من المنتجات لتلبية احتياجات المستخدمين المختلفة:
اسم الخطة | السعر | الميزات الرئيسية | المستخدم المستهدف | الخدمات الإضافية المتاحة |
---|---|---|---|---|
الخطة المجانية | 0 دولار شهريًا | أدوات مساحة العمل الأساسية؛ إجراءات المجتمع العامة؛ لا توجد إجراءات خاصة | المستخدمون الأفراد المبتدئون | لا يوجد |
الخطة المميزة | 75 ريال سعودي/جهاز/شهر (تقديري) | تتضمن الميزات المجانية؛ إجراءات القناة الخاصة/الفريق؛ التشغيل المحلي | الأفراد/الفرق الذين يحتاجون إلى الخصوصية/التعاون | الخادم، الكونسيرج |
Simular for Business | اتصل بالمبيعات | قوة عاملة رقمية مستقلة؛ ميزات وخدمات على مستوى المؤسسة | مستخدمو الشركات | خدمات مخصصة |
الخدمات الإضافية المميزة | ||||
الخادم | +150 ريال سعودي/جهاز/شهر (تقديري) | خادم مستضاف بواسطة Simular؛ يتضمن 200 ساعة وكيل؛ 0.38 ريال سعودي/ساعة إضافية (تقديري) | المستخدمون الذين يحتاجون إلى قدرة حوسبة سحابية | - |
الكونسيرج | اتصل بالمبيعات | اطلب نتائج مخصصة من خبراء Simular دون إنشاء إجراءات بنفسك | المستخدمون الذين يحتاجون إلى خدمات الخبراء | - |
يتطور هذا القطاع من السوق بسرعة، ويجذب اهتمامًا واستثمارًا كبيرين. تشمل الأهداف الأساسية أتمتة سير العمل، وتنفيذ المهام، وإنشاء الأكواد، وتحليل البيانات، وتفاعل البرامج (GUI/API).
تتنوع الأساليب التكنولوجية: التفاعل المباشر مع واجهة المستخدم الرسومية، وتنسيق واجهة برمجة التطبيقات، وإنشاء الأكواد، والذكاء الاصطناعي للمحادثة، ومنصات عدم استخدام الأكواد/منخفضة الأكواد.
تواجه Simular AI منافسة متعددة الأبعاد:
**منافسو أتمتة واجهة المستخدم الرسومية المباشرون:** OpenAI Operator/CUA, Manus AI, Genspark Superagent, Ace, Proxy AI.
**أطر عمل/منصات وكلاء الذكاء الاصطناعي الأوسع:** LangChain, AutoGen, CrewAI, منصات عدم استخدام الأكواد/منخفضة الأكواد (Gumloop, n8n, Google, Microsoft, UiPath, إلخ), وكلاء مفتوحو المصدر آخرون (Rasa, Haystack, إلخ).
**مجموعات الإنتاجية الحالية:** Microsoft 365 Copilot, Google Workspace AI.
المنافس | التركيز | التكنولوجيا/الطريقة | مفتوح المصدر | حالة الاستخدام | التمايز |
---|---|---|---|---|---|
Simular AI | أتمتة GUI | معياري(MoG,PHP),تفاعل بشري,تحليل لقطة شاشة | نعم(النواة) | أتمتة شخصية/شركات | مفتوح المصدر,تنفيذ محلي,تعاون بشري-آلي,SOTA |
OpenAI Operator | أتمتة GUI | GPT-4o,تجزئة المهام | لا(النموذج) | نماذج/تجارة إلكترونية | نظام OpenAI البيئي,نموذج أساسي قوي |
Manus AI | وكيل ذكاء اصطناعي عام(GUI) | تعاون متعدد الوكلاء,أو Claude 3.x | لا | أتمتة المهام المعقدة | اهتمام/تمويل عالي,موثوقية مشكوك فيها |
Genspark Superagent | تنسيق API/استدعاء أداة | وكيل هجين(9+ نماذج),80+ أداة,تكامل API | لا | مهام كمبيوتر واسعة | وكيل هجين,مجموعة أدوات غنية,تركيز API |
Ace | أتمتة GUI | تحكم مباشر بلوحة المفاتيح/الماوس المحلية,تعلم بالملاحظة | لا | مهام سطح مكتب سريعة | تحكم محلي مباشر,يدعي السرعة |
Proxy AI | أتمتة تصفح الويب | معالجة متوازية(متعدد الوكلاء),تعليمات لغة طبيعية | لا | بحث ويب/جمع بيانات/ملء نماذج | تركيز ويب,تسريع معالجة متوازية |
LangChain | إطار عمل تطبيق LLM | سلاسل المطالبات,تكامل بيانات,وحدات وكيل | نعم | بناء تطبيقات LLM متنوعة | نظام بيئي واسع,مرن,غير متخصص GUI |
AutoGen | إطار عمل محادثة متعدد الوكلاء | تنسيق متعدد الوكلاء,إنشاء كود,تصحيح ذاتي | نعم | سير عمل معقد,مهام برمجة | دعم Microsoft,جيد بالكود/تفاعل متعدد الوكلاء |
CrewAI | إطار عمل تنسيق متعدد الوكلاء | تعاون وكيل لعب الأدوار,تفويض المهام | نعم | أتمتة المهام التعاونية | سهولة استخدام عالية,تركيز على تنسيق فريق الوكيل |
UiPath Agent Builder | منصة منخفضة الكود | تصميم مرئي,تكامل نظام UiPath البيئي | لا | RPA/أتمتة على مستوى المؤسسة | موجه للمؤسسات,تكامل عميق مع UiPath |