Simular AI Agent

Simular AI wurde 2023 gegründet und hat seinen Hauptsitz in San Carlos. Es ist ein KI-Startup, das sich auf die Entwicklung von 'Computer-Nutzungs-Agenten' konzentriert, die die menschliche Interaktion mit GUIs simulieren. Die Gründer Ang Li und Jiachen Yang verfügen über Erfahrungen von Top-Institutionen wie DeepMind, Google und Baidu. Die Kernmission besteht darin, KI-Agenten zu schaffen, die Computer wie Menschen nutzen können, um mühsame digitale Aufgaben zu automatisieren und menschliches Potenzial freizusetzen.

Die Kerntechnologie ist das Agent S Framework und seine aktualisierte Version Agent S2 – ein offenes, modulares und erweiterbares Agenten-Framework. Es kombiniert allgemeine Modelle für die übergeordnete Planung und nutzt spezialisierte Modelle für die untergeordnete Ausführung und das Interface-Grounding und ist in mehreren Benchmarks führend. Agent S2 führt Innovationen wie Proactive Hierarchical Planning (PHP) und Mixture-of-Grounding (MoG) ein und bedient GUIs präzise nur anhand von Screenshots. Das Unternehmen setzt auf Open Source, die Agent S/S2 Frameworks sind auf GitHub verfügbar.

Das Produktportfolio umfasst Simular für macOS/Browser (lokaler Mac-Browser-Agent) und Simular Desktop (plattformübergreifender Desktop-Assistent) für Einzelpersonen sowie Simular for Business (autonome digitale Arbeitskraft) für Unternehmen. Die Produkte legen Wert auf Sicherheit und Leistung bei der lokalen Ausführung und konzentrieren sich auf die Mensch-Maschine-Kollaboration. Es wird ein Freemium-Preismodell (derzeit in der Beta-Phase) verwendet und maßgeschneiderte Lösungen für Unternehmen angeboten.

Im Jahr 2024 schloss das Unternehmen eine Frühphasenfinanzierung in Höhe von 5 Millionen US-Dollar mit Investoren wie Basis Set Ventures, Flying Fish Partners, Samsung NEXT Ventures und South Park Commons ab.

Kernfunktionen

Menschenähnliche GUI-Interaktion

Kernfähigkeit zur Interaktion mit grafischen Oberflächen durch Simulation menschlicher Operationen, ohne auf APIs angewiesen zu sein.

Agent S2 Framework

Fortschrittliches modulares Agenten-Framework, das allgemeine Modellplanung mit spezialisierter Modellausführung/Grounding kombiniert.

Proactive Hierarchical Planning (PHP)

Prognostiziert und passt Pläne dynamisch an, um sich an Echtzeit-Umgebungsänderungen anzupassen und die Erfolgsraten von Aufgaben zu verbessern.

Mixture-of-Grounding (MoG)

Nutzt mehrere Grounding-Experten, um UI-Elemente präzise zu lokalisieren, wobei nur Screenshot-Eingaben erforderlich sind.

Open-Source-Kern

Die Agent S/S2 Frameworks sind Open Source und fördern die Beteiligung der Community und die technologische Transparenz.

Priorität der lokalen Ausführung

Persönliche Produkte legen Wert auf die Ausführung auf dem Gerät des Benutzers, um die Datensicherheit und den Datenschutz zu verbessern.

Aktionsaufzeichnung & -wiedergabe

Zeichnet digitale Benutzeraktionen auf und kann sie automatisch wiedergeben, was die Automatisierungserstellung für wiederkehrende Aufgaben vereinfacht.

Selbstkorrekturfähigkeit

Der Agent kann verschiedene Ansätze ausprobieren, um sich bei Ausführungsfehlern selbst zu korrigieren, was die Robustheit verbessert.

Technische Tiefenanalyse: Agent S Framework & Computer-Nutzungs-Agenten

Kernkonzept: KI-Computer-Nutzungs-Agenten

Traditionelle Automatisierungsmethoden (RPA, API-Integration) haben Grenzen. Simular AI widmet sich dem Aufbau intelligenter Agenten, die GUIs auf verschiedenen Plattformen direkt **wahrnehmen, schlussfolgern und bedienen** können. Unsere '**Computer-Nutzungs-Agenten**' verstehen den Zustand durch Beobachtung des Bildschirms, simulieren präzise menschliche Tastatur- und Mausoperationen und integrieren kognitive Modi des **schnellen Denkens** (intuitive Reaktion) und des **langsamen Denkens** (tiefes Schlussfolgern).

Vergleich der Agent S & S2 Frameworks

Die Kerntechnologie ist in den **offenen, modularen und erweiterbaren** Agent S/S2 Frameworks verkörpert. Beide verfolgen das Designprinzip, **allgemeine Modelle** für die übergeordnete Planung und **spezialisierte Modelle** für die untergeordnete Ausführung und das Interface-'**Grounding**' zu verwenden.

Technische DimensionAgent SAgent S2 (Innovationen)
PlanungsfähigkeitErfahrungsgestützte hierarchische Planung**Proactive Hierarchical Planning (PHP)**: Prognostiziert zukünftige Zustände und passt Pläne dynamisch an
Mensch-Maschine-SchnittstelleGrundlegende Agent-Computer-Schnittstelle (ACI)**Erweiterte ACI**: Intelligente Zuweisung von Aufgaben an Expertenmodule
GUI-ElementlokalisierungAbhängig von multimodaler Eingabe, eingeschränkt durch Barrierefreiheits-APIs**Mixture-of-Grounding (MoG)**: Lokalisiert Oberflächenelemente präzise nur anhand von Screenshots
Lernen & AnpassungGrundlegender Erfahrungsgedächtnismechanismus**Fortgeschrittenes Speichersystem & Selbstkorrektur**: Kontinuierliches Lernen & Strategieanpassung

Leistung & Benchmarks

Agent S

  • OSWorld: Erfolgsrate um 83,6% höher als Baseline
  • WindowsAgentArena: Zeigt ausgezeichnete plattformübergreifende Generalisierungsfähigkeit

Agent S2 (SOTA-Leistung)

  • OSWorld: 50-Schritt-Genauigkeit von 34,5%, übertrifft OpenAI CUA
  • WindowsAgentArena: Leistungssteigerung von 52,8%
  • AndroidWorld: Genauigkeit von 50%, übertrifft UI-TARS

Open-Source-Ökosystem & Community

Open Source ist ein zentraler Wettbewerbsvorteil für Simular AI. Die Agent S/S2 Frameworks sind vollständig Open Source auf GitHub. Das Unternehmen pflegt mehrere aktive Code-Repositories (Agent-S, OpenACI, pysimular, etc.) und hat eine Discord-Community aufgebaut, um die Entwicklerinteraktion zu fördern. Die Nutzung des Frameworks erfordert die Konfiguration einer Python-Umgebung und Docker und hängt von externen LLM-Diensten und spezialisierten Grounding-Modellen ab.

Produktportfolio & Dienstleistungen

Zentrale Produktphilosophie

Das Produktdesign dreht sich um KI-Agenten, die mit Benutzern zusammenarbeiten, wobei die **Mensch-Maschine-Kollaboration** und die Benutzerkontrolle im Vordergrund stehen. Der Schwerpunkt liegt auf der **lokalen Ausführung (on-device)**, um Sicherheit, Reaktionsgeschwindigkeit und Erfahrung zu verbessern. Es bietet Funktionen zum Aufzeichnen, Teilen und Wiedergeben digitaler Aktionen.

Spezifische Produktlinien

Bietet eine Reihe von Produkten, um unterschiedliche Benutzeranforderungen zu erfüllen:

  • Simular für macOS / Simular Browser: Nativer macOS-Agent, lokal ausgeführt, mit eingebetteter WebKit-Engine. Betont Autonomie, geteilte Kontrolle, Sicherheit und vertraute Erfahrung. Vereinfacht das tägliche digitale Leben. Kostenloser Download.
  • Simular Desktop: Desktop-KI-Assistent, der digitale Aktionen und Automatisierungsaufgaben ausführt. Die Kernfunktionalität besteht darin, Operationen als Anweisungen aufzuzeichnen und wiederzugeben. Ziel ist es, Zeit zu sparen und die Produktivität zu steigern. Potenziell plattformübergreifend. Bietet kostenlose und Premium-Pläne.
  • Simular for Business: Positioniert als **autonome digitale Arbeitskraft** zur Steigerung der organisatorischen Effizienz. Ausgerichtet auf Unternehmensszenarien (Finanzen, Kundenservice, HR usw.). Konzentriert sich auf Automatisierung, Produktivität, Skalierbarkeit, Workflow-Optimierung, RPA, Datenanalyse usw. Demo auf Anfrage.
  • Agent S / S2 Framework: Zugrundeliegendes Open-Source-Framework für Entwickler und Forscher.

Preisstruktur

Simular AI Preispläne
Plan NamePreisHauptmerkmaleZielbenutzerVerfügbare Zusatzdienste
Kostenloser Plan0 €/MonatGrundlegende Workspace-Tools; Öffentliche Community-Aktionen; Keine privaten AktionenEinsteigerKeine
Premium Plan18,50 €/Gerät/Monat (geschätzt)Enthält kostenlose Funktionen; Private/Team-Kanal-Aktionen; Lokale AusführungEinzelpersonen/Teams, die Datenschutz/Zusammenarbeit benötigenServer, Concierge
Simular for BusinessVertrieb kontaktierenAutonome digitale Arbeitskraft; Funktionen und Dienste auf UnternehmensebeneUnternehmenskundenMaßgeschneiderte Dienstleistungen
Premium Zusatzdienste
Server+37 €/Gerät/Monat (geschätzt)Von Simular gehosteter Server; Enthält 200 Agentenstunden; Zusätzliche 0,09 €/Stunde (geschätzt)Benutzer, die Cloud-Rechenleistung benötigen-
ConciergeVertrieb kontaktierenFordern Sie maßgeschneiderte Ergebnisse von Simular-Experten an, ohne selbst Aktionen erstellen zu müssenBenutzer, die Expertendienste benötigen-

Wettbewerbslandschaftsanalyse

Überblick über den Markt für KI-Agenten (Fokus auf Computernutzung)

Dieses Marktsegment entwickelt sich rasant und zieht erhebliche Aufmerksamkeit und Investitionen an. Die Kernziele umfassen Workflow-Automatisierung, Aufgabenausführung, Codegenerierung, Datenanalyse und Software-Interaktion (GUI/API).

Die technologischen Ansätze sind vielfältig: direkte GUI-Interaktion, API-Orchestrierung, Codegenerierung, konversationelle KI, No-Code/Low-Code-Plattformen.

Hauptkonkurrenten

Simular AI steht vor einer mehrdimensionalen Konkurrenz:

**Direkte GUI-Automatisierungskonkurrenten:** OpenAI Operator/CUA, Manus AI, Genspark Superagent, Ace, Proxy AI.

**Breitere KI-Agenten-Frameworks/Plattformen:** LangChain, AutoGen, CrewAI, No-Code/Low-Code-Plattformen (Gumloop, n8n, Google, Microsoft, UiPath usw.), andere Open-Source-Agenten (Rasa, Haystack usw.).

**Bestehende Produktivitätssuiten:** Microsoft 365 Copilot, Google Workspace AI.

Vergleich der Konkurrenzmerkmale

WettbewerberFokusTechnologie/MethodeOpen SourceAnwendungsfallDifferenzierung
Simular AIGUI-AutomatisierungModular(MoG,PHP),Menschenähnl. Interaktion,Screenshot-AnalyseJa(Kern)Persönl./UnternehmensautomatisierungOpen Source,Lokale Ausf.,Mensch-Masch.-Kollab.,SOTA
OpenAI OperatorGUI-AutomatisierungGPT-4o,AufgabenzerlegungNein(Modell)Formulare/E-CommerceOpenAI-Ökosystem,Starkes Basismodell
Manus AIAllg. KI-Agent(GUI)Multi-Agenten-Kollab.,oder Claude 3.xNeinKomplexe AufgabenautomatisierungHohe Aufmerksamkeit/Finanzierung,Zuverlässigkeit fraglich
Genspark SuperagentAPI-Orchestr./Tool-AufrufHybrid-Agent(9+ Modelle),80+ Tools,API-Integr.NeinBreite ComputeraufgabenHybrid-Agent,Reiches Toolset,API-Fokus
AceGUI-AutomatisierungDirekte lokale Tastatur-/Maussteuerung,BeobachtungslernenNeinSchnelle Desktop-AufgabenDirekte lokale Steuerung,Behauptet schnell zu sein
Proxy AIWeb-Browsing-AutomatisierungParallele Verarbeitung(Multi-Agent),Natürl. SprachbefehleNeinWeb-Recherche/Datenerfassung/FormularausfüllungWeb-Fokus,Beschleunigung durch parallele Verarbeitung
LangChainLLM-AnwendungsframeworkPrompt-Ketten,Datenintegration,AgentenmoduleJaErstellung versch. LLM-AnwendungenBreites Ökosystem,Flexibel,Nicht auf GUI spezialisiert
AutoGenMulti-Agenten-KonversationsframeworkMulti-Agenten-Koord.,Codegenerierung,SelbstkorrekturJaKomplexe Workflows,ProgrammieraufgabenMicrosoft-Unterstützung,Gut bei Code/Multi-Agenten-Interaktion
CrewAIMulti-Agenten-OrchestrierungsframeworkRollenspiel-Agenten-Kollab.,AufgabendelegationJaKollaborative AufgabenautomatisierungHohe Benutzerfreundlichkeit,Fokus auf Agententeam-Koordination
UiPath Agent BuilderLow-Code-PlattformVisuelles Design,Integration UiPath-ÖkosystemNeinUnternehmens-RPA/AutomatisierungUnternehmensorientiert,Tiefe UiPath-Integration

Strategische Analyse (SWOT)

Stärken (Strengths)

  • Spitzentechnisches Know-how und Forschungskapazität.
  • Innovative Kerntechnologien (Agent S/S2, MoG, PHP).
  • Open-Source-Strategie.
  • Validierung durch Frühphasenfinanzierung.
  • Pragmatische Visionspositionierung (Mensch-Maschine-Kollaboration).

Schwächen (Weaknesses)

  • Unternehmen in früher Phase.
  • Fehlen ausgereifter realer Anwendungsfälle.
  • Potenzielle Kommerzialisierungsherausforderungen.
  • Abhängigkeit von externen Komponenten.
  • Mangelnde Klarheit der Produktlinie.

Chancen (Opportunities)

  • Riesige Marktnachfrage (KI-Automatisierung).
  • Potenzial des Unternehmensmarktes.
  • Plattformerweiterung (plattformübergreifend, mobil).
  • Aufbau eines Community-Ökosystems.
  • Strategische Partnerschaften.

Bedrohungen (Threats)

  • Intensiver Marktwettbewerb.
  • Schneller technologischer Wandel.
  • Herausforderungen bei Zuverlässigkeit und Skalierbarkeit.
  • Nachhaltigkeit des Geschäftsmodells.
  • Datenschutz- und Sicherheitsrisiken.

Häufig gestellte Fragen (FAQ)