Simular AI Agent

تأسست Simular AI في عام 2023 ومقرها في سان كارلوس، وهي شركة ناشئة في مجال الذكاء الاصطناعي تركز على تطوير 'وكلاء استخدام الكمبيوتر' التي تحاكي تفاعل الإنسان مع واجهات المستخدم الرسومية (GUI). يتمتع المؤسسان Ang Li و Jiachen Yang بخبرة من مؤسسات مرموقة مثل DeepMind و Google و Baidu. تتمثل المهمة الأساسية في إنشاء وكلاء ذكاء اصطناعي يمكنهم استخدام أجهزة الكمبيوتر مثل البشر، وأتمتة المهام الرقمية المملة، وإطلاق العنان للإمكانات البشرية.

التكنولوجيا الأساسية هي إطار عمل Agent S وإصداره المحدث Agent S2 - وهو إطار عمل وكيل مفتوح المصدر ومعياري وقابل للتوسيع. يجمع بين النماذج العامة للتخطيط عالي المستوى ويستخدم نماذج متخصصة للتنفيذ منخفض المستوى وتأريض الواجهة، مما يجعله رائدًا في العديد من الاختبارات المعيارية. يقدم Agent S2 ابتكارات مثل التخطيط الهرمي الاستباقي (PHP) والتأريض الهجين (MoG)، مما يمكنه من تشغيل واجهات المستخدم الرسومية بدقة باستخدام لقطات الشاشة فقط. تتبنى الشركة المصادر المفتوحة، حيث تتوفر أطر عمل Agent S/S2 على GitHub.

تتضمن مجموعة المنتجات Simular لنظام macOS/المتصفح (وكيل متصفح Mac محلي) و Simular Desktop (مساعد سطح المكتب متعدد المنصات) للأفراد، و Simular for Business (قوة عاملة رقمية مستقلة) للشركات. تؤكد المنتجات على أمان وأداء التنفيذ المحلي وتركز على التعاون بين الإنسان والآلة. تعتمد نموذج تسعير مجاني (freemium) (حاليًا في مرحلة تجريبية) وتقدم حلولًا مخصصة للشركات.

في عام 2024، أكملت الشركة جولة تمويل أولية بقيمة 5 ملايين دولار بمشاركة مستثمرين مثل Basis Set Ventures و Flying Fish Partners و Samsung NEXT Ventures و South Park Commons.

الميزات الأساسية

تفاعل واجهة المستخدم الرسومية شبيه بالبشر

القدرة الأساسية على التفاعل مع الواجهات الرسومية من خلال محاكاة العمليات البشرية، دون الاعتماد على واجهات برمجة التطبيقات (APIs).

إطار عمل Agent S2

إطار عمل وكيل معياري متقدم يجمع بين تخطيط النموذج العام وتنفيذ/تأريض النموذج المتخصص.

التخطيط الهرمي الاستباقي (PHP)

يتنبأ ويضبط الخطط ديناميكيًا للتكيف مع التغيرات البيئية في الوقت الفعلي، مما يحسن معدلات نجاح المهام.

التأريض الهجين (MoG)

يستخدم العديد من خبراء التأريض لتحديد عناصر واجهة المستخدم بدقة، ويتطلب فقط إدخال لقطات الشاشة.

نواة مفتوحة المصدر

أطر عمل Agent S/S2 مفتوحة المصدر، مما يعزز مشاركة المجتمع والشفافية التكنولوجية.

أولوية التنفيذ المحلي

تؤكد المنتجات الشخصية على التشغيل على جهاز المستخدم، مما يعزز أمن البيانات والخصوصية.

تسجيل الإجراءات وإعادة تشغيلها

يسجل الإجراءات الرقمية للمستخدم ويمكنه إعادة تشغيلها تلقائيًا، مما يبسط إنشاء الأتمتة للمهام المتكررة.

قدرة التصحيح الذاتي

يمكن للوكيل تجربة طرق مختلفة لتصحيح نفسه عند حدوث أخطاء في التنفيذ، مما يحسن المتانة.

تحليل تقني معمق: إطار عمل Agent S ووكلاء استخدام الكمبيوتر

المفهوم الأساسي: وكلاء استخدام الكمبيوتر بالذكاء الاصطناعي

طرق الأتمتة التقليدية (RPA، تكامل API) لها قيود. تكرس Simular AI جهودها لبناء وكلاء أذكياء يمكنهم **الإدراك والاستدلال والتشغيل** مباشرة لواجهات المستخدم الرسومية على منصات مختلفة. يفهم '**وكلاء استخدام الكمبيوتر**' لدينا الحالة من خلال مراقبة الشاشة، ويحاكون بدقة عمليات لوحة المفاتيح والماوس البشرية، ويدمجون الأنماط المعرفية **للتفكير السريع** (رد الفعل البديهي) و**التفكير البطيء** (الاستدلال العميق).

مقارنة بين إطاري عمل Agent S و S2

تتجسد التكنولوجيا الأساسية في أطر عمل Agent S/S2 **المفتوحة والمعيارية والقابلة للتوسيع**. كلاهما يتبنى مبدأ التصميم المتمثل في استخدام **النماذج العامة** للتخطيط عالي المستوى و**النماذج المتخصصة** للتنفيذ منخفض المستوى و '**تأريض**' الواجهة.

البعد التقنيAgent SAgent S2 (ابتكارات)
قدرة التخطيطالتخطيط الهرمي المعزز بالخبرة**التخطيط الهرمي الاستباقي (PHP)**: يتنبأ بالحالات المستقبلية ويضبط الخطط ديناميكيًا
واجهة الإنسان والآلةواجهة الوكيل والحاسوب الأساسية (ACI)**ACI المحسّنة**: تعيين المهام بذكاء للوحدات المتخصصة
تحديد موقع عناصر واجهة المستخدم الرسوميةيعتمد على المدخلات متعددة الوسائط، محدود بواجهات برمجة تطبيقات إمكانية الوصول**التأريض الهجين (MoG)**: يحدد عناصر الواجهة بدقة باستخدام لقطات الشاشة فقط
التعلم والتكيفآلية ذاكرة الخبرة الأساسية**نظام ذاكرة متقدم وتصحيح ذاتي**: التعلم المستمر وتعديل الاستراتيجية

الأداء والاختبارات المعيارية

Agent S

  • OSWorld: معدل نجاح أعلى بنسبة 83.6% من خط الأساس
  • WindowsAgentArena: يظهر قدرة تعميم ممتازة عبر الأنظمة الأساسية

Agent S2 (أداء SOTA)

  • OSWorld: دقة 50 خطوة بنسبة 34.5%، متجاوزًا OpenAI CUA
  • WindowsAgentArena: تحسين الأداء بنسبة 52.8%
  • AndroidWorld: دقة 50%، متجاوزًا UI-TARS

النظام البيئي مفتوح المصدر والمجتمع

المصدر المفتوح هو ميزة تنافسية أساسية لـ Simular AI. أطر عمل Agent S/S2 مفتوحة المصدر بالكامل على GitHub. تحتفظ الشركة بالعديد من مستودعات الأكواد النشطة (Agent-S، OpenACI، pysimular، إلخ) وأنشأت مجتمعًا على Discord لتعزيز التفاعل بين المطورين. يتطلب استخدام إطار العمل تكوين بيئة Python و Docker، ويعتمد على خدمات LLM خارجية ونماذج تأريض متخصصة.

مجموعة المنتجات والخدمات

فلسفة المنتج الأساسية

يدور تصميم المنتج حول وكلاء الذكاء الاصطناعي الذين يتعاونون مع المستخدمين، مع التركيز على **التعاون بين الإنسان والآلة** وتحكم المستخدم. يركز على **التنفيذ المحلي (على الجهاز)** لتعزيز الأمان وسرعة الاستجابة والتجربة. يوفر ميزات لتسجيل الإجراءات الرقمية ومشاركتها وإعادة تشغيلها.

خطوط الإنتاج المحددة

تقدم مجموعة من المنتجات لتلبية احتياجات المستخدمين المختلفة:

  • Simular لنظام macOS / متصفح Simular: وكيل أصلي لنظام macOS، يعمل محليًا، مع محرك WebKit مدمج. يؤكد على الاستقلالية والتحكم المشترك والأمان والتجربة المألوفة. يبسط الحياة الرقمية اليومية. تنزيل مجاني.
  • Simular Desktop: مساعد ذكاء اصطناعي لسطح المكتب ينفذ الإجراءات الرقمية ومهام الأتمتة. الوظيفة الأساسية هي تسجيل العمليات كتعليمات وإعادة تشغيلها. الهدف هو توفير الوقت وزيادة الإنتاجية. يحتمل أن يكون متعدد المنصات. يقدم خططًا مجانية ومميزة.
  • Simular for Business: يتم وضعه كـ **قوة عاملة رقمية مستقلة** لزيادة الكفاءة التنظيمية. يستهدف سيناريوهات الشركات (المالية، خدمة العملاء، الموارد البشرية، إلخ). يركز على الأتمتة والإنتاجية وقابلية التوسع وتبسيط سير العمل و RPA وتحليل البيانات وما إلى ذلك. يتطلب الاتصال للحصول على عرض توضيحي.
  • إطار عمل Agent S / S2: إطار عمل أساسي مفتوح المصدر للمطورين والباحثين.

هيكل التسعير

خطط تسعير Simular AI
اسم الخطةالسعرالميزات الرئيسيةالمستخدم المستهدفالخدمات الإضافية المتاحة
الخطة المجانية0 دولار شهريًاأدوات مساحة العمل الأساسية؛ إجراءات المجتمع العامة؛ لا توجد إجراءات خاصةالمستخدمون الأفراد المبتدئونلا يوجد
الخطة المميزة75 ريال سعودي/جهاز/شهر (تقديري)تتضمن الميزات المجانية؛ إجراءات القناة الخاصة/الفريق؛ التشغيل المحليالأفراد/الفرق الذين يحتاجون إلى الخصوصية/التعاونالخادم، الكونسيرج
Simular for Businessاتصل بالمبيعاتقوة عاملة رقمية مستقلة؛ ميزات وخدمات على مستوى المؤسسةمستخدمو الشركاتخدمات مخصصة
الخدمات الإضافية المميزة
الخادم+150 ريال سعودي/جهاز/شهر (تقديري)خادم مستضاف بواسطة Simular؛ يتضمن 200 ساعة وكيل؛ 0.38 ريال سعودي/ساعة إضافية (تقديري)المستخدمون الذين يحتاجون إلى قدرة حوسبة سحابية-
الكونسيرجاتصل بالمبيعاتاطلب نتائج مخصصة من خبراء Simular دون إنشاء إجراءات بنفسكالمستخدمون الذين يحتاجون إلى خدمات الخبراء-

تحليل المشهد التنافسي

نظرة عامة على سوق وكلاء الذكاء الاصطناعي (التركيز على استخدام الكمبيوتر)

يتطور هذا القطاع من السوق بسرعة، ويجذب اهتمامًا واستثمارًا كبيرين. تشمل الأهداف الأساسية أتمتة سير العمل، وتنفيذ المهام، وإنشاء الأكواد، وتحليل البيانات، وتفاعل البرامج (GUI/API).

تتنوع الأساليب التكنولوجية: التفاعل المباشر مع واجهة المستخدم الرسومية، وتنسيق واجهة برمجة التطبيقات، وإنشاء الأكواد، والذكاء الاصطناعي للمحادثة، ومنصات عدم استخدام الأكواد/منخفضة الأكواد.

المنافسون الرئيسيون

تواجه Simular AI منافسة متعددة الأبعاد:

**منافسو أتمتة واجهة المستخدم الرسومية المباشرون:** OpenAI Operator/CUA, Manus AI, Genspark Superagent, Ace, Proxy AI.

**أطر عمل/منصات وكلاء الذكاء الاصطناعي الأوسع:** LangChain, AutoGen, CrewAI, منصات عدم استخدام الأكواد/منخفضة الأكواد (Gumloop, n8n, Google, Microsoft, UiPath, إلخ), وكلاء مفتوحو المصدر آخرون (Rasa, Haystack, إلخ).

**مجموعات الإنتاجية الحالية:** Microsoft 365 Copilot, Google Workspace AI.

مقارنة ميزات المنافسين

المنافسالتركيزالتكنولوجيا/الطريقةمفتوح المصدرحالة الاستخدامالتمايز
Simular AIأتمتة GUIمعياري(MoG,PHP),تفاعل بشري,تحليل لقطة شاشةنعم(النواة)أتمتة شخصية/شركاتمفتوح المصدر,تنفيذ محلي,تعاون بشري-آلي,SOTA
OpenAI Operatorأتمتة GUIGPT-4o,تجزئة المهاملا(النموذج)نماذج/تجارة إلكترونيةنظام OpenAI البيئي,نموذج أساسي قوي
Manus AIوكيل ذكاء اصطناعي عام(GUI)تعاون متعدد الوكلاء,أو Claude 3.xلاأتمتة المهام المعقدةاهتمام/تمويل عالي,موثوقية مشكوك فيها
Genspark Superagentتنسيق API/استدعاء أداةوكيل هجين(9+ نماذج),80+ أداة,تكامل APIلامهام كمبيوتر واسعةوكيل هجين,مجموعة أدوات غنية,تركيز API
Aceأتمتة GUIتحكم مباشر بلوحة المفاتيح/الماوس المحلية,تعلم بالملاحظةلامهام سطح مكتب سريعةتحكم محلي مباشر,يدعي السرعة
Proxy AIأتمتة تصفح الويبمعالجة متوازية(متعدد الوكلاء),تعليمات لغة طبيعيةلابحث ويب/جمع بيانات/ملء نماذجتركيز ويب,تسريع معالجة متوازية
LangChainإطار عمل تطبيق LLMسلاسل المطالبات,تكامل بيانات,وحدات وكيلنعمبناء تطبيقات LLM متنوعةنظام بيئي واسع,مرن,غير متخصص GUI
AutoGenإطار عمل محادثة متعدد الوكلاءتنسيق متعدد الوكلاء,إنشاء كود,تصحيح ذاتينعمسير عمل معقد,مهام برمجةدعم Microsoft,جيد بالكود/تفاعل متعدد الوكلاء
CrewAIإطار عمل تنسيق متعدد الوكلاءتعاون وكيل لعب الأدوار,تفويض المهامنعمأتمتة المهام التعاونيةسهولة استخدام عالية,تركيز على تنسيق فريق الوكيل
UiPath Agent Builderمنصة منخفضة الكودتصميم مرئي,تكامل نظام UiPath البيئيلاRPA/أتمتة على مستوى المؤسسةموجه للمؤسسات,تكامل عميق مع UiPath

التحليل الاستراتيجي (SWOT)

نقاط القوة (Strengths)

  • خبرة فنية وبحثية رفيعة المستوى.
  • تقنيات أساسية مبتكرة (Agent S/S2, MoG, PHP).
  • استراتيجية المصدر المفتوح.
  • التحقق من خلال التمويل الأولي.
  • تحديد موقع رؤية عملية (التعاون بين الإنسان والآلة).

نقاط الضعف (Weaknesses)

  • الشركة في مرحلة مبكرة.
  • نقص حالات الاستخدام الناضجة في العالم الحقيقي.
  • تحديات التسويق المحتملة.
  • الاعتماد على المكونات الخارجية.
  • نقص الوضوح في خط الإنتاج.

الفرص (Opportunities)

  • طلب كبير في السوق (أتمتة الذكاء الاصطناعي).
  • إمكانات سوق الشركات.
  • توسيع المنصة (عبر أنظمة التشغيل، المحمول).
  • بناء نظام بيئي مجتمعي.
  • شراكات استراتيجية.

التهديدات (Threats)

  • منافسة شديدة في السوق.
  • تغير تكنولوجي سريع.
  • تحديات الموثوقية وقابلية التوسع.
  • استدامة نموذج العمل.
  • مخاطر خصوصية وأمن البيانات.

الأسئلة الشائعة (FAQ)