Fondée en 2023 et basée à San Carlos, Simular AI est une startup IA axée sur le développement d'« agents utilisateurs d'ordinateur » simulant l'interaction humaine avec les interfaces graphiques (GUI). Les fondateurs Ang Li et Jiachen Yang ont une expérience issue d'institutions de premier plan telles que DeepMind, Google et Baidu. La mission principale est de créer des agents IA capables d'utiliser les ordinateurs comme des humains, automatisant les tâches numériques fastidieuses et libérant le potentiel humain.
La technologie de base est le framework Agent S et sa version améliorée Agent S2 – un framework d'agent ouvert, modulaire et extensible. Il combine des modèles généraux pour la planification de haut niveau et utilise des modèles spécialisés pour l'exécution de bas niveau et l'ancrage d'interface, se positionnant en tête dans plusieurs benchmarks. Agent S2 introduit des innovations telles que la Planification Hiérarchique Proactive (PHP) et l'Ancrage Hybride (MoG), opérant les GUI avec précision en utilisant uniquement des captures d'écran. L'entreprise adopte l'open source, les frameworks Agent S/S2 étant disponibles sur GitHub.
Le portefeuille de produits comprend Simular pour macOS/Navigateur (agent local de navigateur Mac) et Simular Desktop (assistant de bureau multiplateforme) pour les particuliers, et Simular for Business (main-d'œuvre numérique autonome) pour les entreprises. Les produits mettent l'accent sur la sécurité et les performances de l'exécution locale et se concentrent sur la collaboration homme-machine. Il adopte un modèle de tarification freemium (actuellement en version bêta) et propose des solutions personnalisées pour les entreprises.
En 2024, l'entreprise a finalisé un tour de financement de démarrage de 5 millions de dollars avec des investisseurs tels que Basis Set Ventures, Flying Fish Partners, Samsung NEXT Ventures et South Park Commons.
Capacité fondamentale à interagir avec les interfaces graphiques en simulant les opérations humaines, sans dépendre des API.
Framework d'agent modulaire avancé combinant la planification par modèle général et l'exécution/ancrage par modèle spécialisé.
Prédit et ajuste dynamiquement les plans pour s'adapter aux changements environnementaux en temps réel, améliorant les taux de réussite des tâches.
Utilise plusieurs experts en ancrage pour localiser précisément les éléments de l'interface utilisateur, ne nécessitant que des captures d'écran.
Les frameworks Agent S/S2 sont open source, favorisant l'engagement communautaire et la transparence technologique.
Les produits personnels mettent l'accent sur l'exécution sur l'appareil de l'utilisateur, améliorant la sécurité et la confidentialité des données.
Enregistre les actions numériques de l'utilisateur et peut les rejouer automatiquement, simplifiant la création d'automatisation pour les tâches répétitives.
L'agent peut essayer différentes approches pour s'autocorriger en cas d'erreurs d'exécution, améliorant ainsi la robustesse.
Les méthodes d'automatisation traditionnelles (RPA, intégration API) ont des limites. Simular AI se consacre à la construction d'agents intelligents capables de **percevoir, raisonner et opérer** directement les GUI sur diverses plateformes. Nos '**agents utilisateurs d'ordinateur**' comprennent l'état en observant l'écran, simulent avec précision les opérations humaines du clavier et de la souris, et intègrent les modes cognitifs de la **pensée rapide** (réaction intuitive) et de la **pensée lente** (raisonnement profond).
La technologie de base est incarnée dans les frameworks Agent S/S2 **ouverts, modulaires et extensibles**. Tous deux adoptent le principe de conception consistant à utiliser des **modèles généraux** pour la planification de haut niveau et des **modèles spécialisés** pour l'exécution de bas niveau et l'**ancrage**' d'interface.
Dimension Technique | Agent S | Agent S2 (Innovations) |
---|---|---|
Capacité de Planification | Planification hiérarchique améliorée par l'expérience | **Planification Hiérarchique Proactive (PHP)** : Prédit les états futurs et ajuste les plans dynamiquement |
Interface Homme-Machine | Interface Agent-Ordinateur (ACI) de base | **ACI Améliorée** : Attribue intelligemment les tâches aux modules experts |
Localisation des Éléments GUI | Dépend de l'entrée multimodale, limité par les API d'accessibilité | **Ancrage Hybride (MoG)** : Localise précisément les éléments d'interface en utilisant uniquement des captures d'écran |
Apprentissage & Adaptation | Mécanisme de mémoire d'expérience de base | **Système de mémoire avancé & Autocorrection** : Apprentissage continu & ajustement de stratégie |
L'open source est un avantage concurrentiel clé pour Simular AI. Les frameworks Agent S/S2 sont entièrement open source sur GitHub. L'entreprise maintient plusieurs dépôts de code actifs (Agent-S, OpenACI, pysimular, etc.) et a établi une communauté Discord pour favoriser l'interaction entre développeurs. L'utilisation du framework nécessite la configuration d'un environnement Python et Docker, et dépend de services LLM externes et de modèles d'ancrage spécialisés.
La conception du produit s'articule autour d'agents IA collaborant avec les utilisateurs, en mettant l'accent sur la **collaboration homme-machine** et le contrôle de l'utilisateur. L'accent est mis sur l'**exécution locale (sur l'appareil)** pour améliorer la sécurité, la réactivité et l'expérience. Il offre des fonctionnalités pour enregistrer, partager et rejouer des actions numériques.
Propose une gamme de produits pour répondre aux différents besoins des utilisateurs :
Nom du Plan | Prix | Fonctionnalités Principales | Utilisateur Cible | Services Supplémentaires Disponibles |
---|---|---|---|---|
Plan Gratuit | 0 €/mois | Outils d'espace de travail de base ; Actions communautaires publiques ; Aucune action privée | Utilisateurs individuels débutants | Aucun |
Plan Premium | 18,50 €/appareil/mois (Estimé) | Inclut les fonctionnalités gratuites ; Actions de canal privé/équipe ; Exécution locale | Individus/équipes nécessitant confidentialité/collaboration | Serveur, Conciergerie |
Simular for Business | Contacter le Service Commercial | Main-d'œuvre numérique autonome ; Fonctionnalités et services de niveau entreprise | Utilisateurs professionnels | Services personnalisés |
Services Supplémentaires Premium | ||||
Serveur | +37 €/appareil/mois (Estimé) | Serveur hébergé par Simular ; Inclut 200 heures d'agent ; 0,09 €/heure supplémentaire (Estimé) | Utilisateurs nécessitant une capacité de calcul cloud | - |
Conciergerie | Contacter le Service Commercial | Demandez des résultats personnalisés aux experts Simular sans créer vous-même d'actions | Utilisateurs nécessitant des services d'experts | - |
Ce segment de marché se développe rapidement, attirant une attention et des investissements considérables. Les objectifs principaux couvrent l'automatisation des flux de travail, l'exécution de tâches, la génération de code, l'analyse de données et l'interaction logicielle (GUI/API).
Les approches technologiques sont diverses : interaction directe avec l'interface graphique, orchestration d'API, génération de code, IA conversationnelle, plateformes no-code/low-code.
Simular AI fait face à une concurrence multidimensionnelle :
**Concurrents directs de l'automatisation GUI :** OpenAI Operator/CUA, Manus AI, Genspark Superagent, Ace, Proxy AI.
**Frameworks/plateformes d'agents IA plus larges :** LangChain, AutoGen, CrewAI, plateformes no-code/low-code (Gumloop, n8n, Google, Microsoft, UiPath, etc.), autres agents open source (Rasa, Haystack, etc.).
**Suites de productivité existantes :** Microsoft 365 Copilot, Google Workspace AI.
Concurrent | Focus | Technologie/Méthode | Open Source | Cas d'Utilisation | Différenciation |
---|---|---|---|---|---|
Simular AI | Automatisation GUI | Modulaire(MoG,PHP),Interact° Humaine,Analyse Capture Écran | Oui(Noyau) | Automatisation Perso/Entrep. | Open Source,Exéc Locale,Collab Homme-Mach,SOTA |
OpenAI Operator | Automatisation GUI | GPT-4o,Décomposition Tâche | Non(Modèle) | Formulaires/E-commerce | Écosystème OpenAI,Modèle Base Solide |
Manus AI | Agent IA Général(GUI) | Collab Multi-Agents,ou Claude 3.x | Non | Automatisation Tâche Complexe | Forte Attention/Financement,Fiabilité Douteuse |
Genspark Superagent | Orchestration API/Appel Outil | Agent Hybride(9+ modèles),80+ outils,Intégration API | Non | Tâches Informatiques Larges | Agent Hybride,Ensemble Outils Riche,Focus API |
Ace | Automatisation GUI | Contrôle Direct Clavier/Souris Local,Apprentissage par Observation | Non | Tâches Bureau Rapides | Contrôle Local Direct,Prétend être Rapide |
Proxy AI | Automatisation Navigation Web | Traitement Parallèle(Multi-Agents),Instructions Langage Naturel | Non | Recherche Web/Collecte Données/Remplissage Formulaire | Focus Web,Accélération Traitement Parallèle |
LangChain | Framework Application LLM | Chaînes Prompt,Intégration Données,Modules Agent | Oui | Construction Diverses Applications LLM | Écosystème Large,Flexible,Non Spécialisé GUI |
AutoGen | Framework Conversation Multi-Agents | Coordination Multi-Agents,Génération Code,Autocorrection | Oui | Flux Travail Complexes,Tâches Programmation | Support Microsoft,Bon en Code/Interaction Multi-Agents |
CrewAI | Framework Orchestration Multi-Agents | Collab Agent Jeu de Rôle,Délégation Tâche | Oui | Automatisation Tâche Collaborative | Grande Facilité d'Utilisation,Focus Coordination Équipe Agent |
UiPath Agent Builder | Plateforme Low-Code | Conception Visuelle,Intégration Écosystème UiPath | Non | RPA/Automatisation Niveau Entreprise | Orienté Entreprise,Intégration Profonde UiPath |