Fundada en 2023 y con sede en San Carlos, Simular AI es una startup de IA centrada en desarrollar 'agentes de uso de computadoras' que simulan la interacción humana con interfaces gráficas de usuario (GUI). Los fundadores Ang Li y Jiachen Yang tienen experiencia en instituciones de primer nivel como DeepMind, Google y Baidu. La misión principal es crear agentes de IA que puedan usar computadoras como humanos, automatizando tareas digitales tediosas y liberando el potencial humano.
La tecnología central es el marco Agent S y su versión mejorada Agent S2, un marco de agente abierto, modular y extensible. Combina modelos generales para la planificación de alto nivel y utiliza modelos especializados para la ejecución de bajo nivel y el anclaje de interfaz, liderando en varias pruebas de referencia. Agent S2 introduce innovaciones como la Planificación Jerárquica Proactiva (PHP) y el Anclaje Híbrido (MoG), operando GUIs con precisión utilizando solo capturas de pantalla. La compañía adopta el código abierto, con los marcos Agent S/S2 disponibles en GitHub.
La cartera de productos incluye Simular para macOS/Browser (agente local de navegador Mac) y Simular Desktop (asistente de escritorio multiplataforma) para particulares, y Simular for Business (fuerza laboral digital autónoma) para empresas. Los productos enfatizan la seguridad y el rendimiento de la ejecución local y se centran en la colaboración humano-máquina. Adopta un modelo de precios freemium (actualmente en beta) y ofrece soluciones personalizadas para empresas.
En 2024, la compañía completó una ronda de financiación inicial de 5 millones de dólares con inversores como Basis Set Ventures, Flying Fish Partners, Samsung NEXT Ventures y South Park Commons.
Capacidad central para interactuar con interfaces gráficas simulando operaciones humanas, sin depender de APIs.
Marco de agente modular avanzado que combina la planificación de modelos generales con la ejecución/anclaje de modelos especializados.
Predice y ajusta dinámicamente los planes para adaptarse a los cambios ambientales en tiempo real, mejorando las tasas de éxito de las tareas.
Utiliza múltiples expertos en anclaje para localizar con precisión elementos de la interfaz de usuario, requiriendo solo la entrada de capturas de pantalla.
Los marcos Agent S/S2 son de código abierto, fomentando la participación de la comunidad y la transparencia tecnológica.
Los productos personales enfatizan la ejecución en el dispositivo del usuario, mejorando la seguridad y privacidad de los datos.
Graba las acciones digitales del usuario y puede reproducirlas automáticamente, simplificando la creación de automatización para tareas repetitivas.
El agente puede probar diferentes enfoques para autocorregirse cuando ocurren errores de ejecución, mejorando la robustez.
Los métodos de automatización tradicionales (RPA, integración de API) tienen limitaciones. Simular AI se dedica a construir agentes inteligentes que pueden **percibir, razonar y operar** directamente GUIs en diversas plataformas. Nuestros '**agentes de uso de computadoras**' comprenden el estado observando la pantalla, simulan con precisión las operaciones humanas de teclado y ratón, e integran modos cognitivos de **pensamiento rápido** (reacción intuitiva) y **pensamiento lento** (razonamiento profundo).
La tecnología central se materializa en los marcos Agent S/S2 **abiertos, modulares y extensibles**. Ambos adoptan el principio de diseño de usar **modelos generales** para la planificación de alto nivel y **modelos especializados** para la ejecución de bajo nivel y el '**anclaje**' de interfaz.
Dimensión Técnica | Agent S | Agent S2 (Innovaciones) |
---|---|---|
Capacidad de Planificación | Planificación jerárquica mejorada por experiencia | **Planificación Jerárquica Proactiva (PHP)**: Predice estados futuros y ajusta planes dinámicamente |
Interfaz Humano-Máquina | Interfaz Agente-Computadora (ACI) básica | **ACI Mejorada**: Asigna tareas inteligentemente a módulos expertos |
Localización de Elementos GUI | Depende de entrada multimodal, limitado por APIs de accesibilidad | **Anclaje Híbrido (MoG)**: Localiza elementos de interfaz con precisión usando solo capturas de pantalla |
Aprendizaje y Adaptación | Mecanismo básico de memoria de experiencia | **Sistema de memoria avanzado y autocorrección**: Aprendizaje continuo y ajuste de estrategia |
El código abierto es una ventaja competitiva central para Simular AI. Los marcos Agent S/S2 son completamente de código abierto en GitHub. La compañía mantiene varios repositorios de código activos (Agent-S, OpenACI, pysimular, etc.) y ha establecido una comunidad en Discord para fomentar la interacción entre desarrolladores. Usar el marco requiere configurar un entorno Python y Docker, y depende de servicios LLM externos y modelos de anclaje especializados.
El diseño del producto gira en torno a agentes de IA que colaboran con los usuarios, enfatizando la **colaboración humano-máquina** y el control del usuario. Se centra en la **ejecución local (en el dispositivo)** para mejorar la seguridad, la velocidad de respuesta y la experiencia. Ofrece funciones para grabar, compartir y reproducir acciones digitales.
Ofrece una gama de productos para satisfacer diferentes necesidades de los usuarios:
Nombre del Plan | Precio | Características Principales | Usuario Objetivo | Servicios Adicionales Disponibles |
---|---|---|---|---|
Plan Gratuito | 0 €/mes | Herramientas básicas de espacio de trabajo; Acciones de la comunidad pública; Sin acciones privadas | Usuarios individuales principiantes | Ninguno |
Plan Premium | 18,50 €/dispositivo/mes (Estimado) | Incluye funciones gratuitas; Acciones de canal privado/equipo; Ejecución local | Individuos/equipos que necesitan privacidad/colaboración | Servidor, Conserje |
Simular for Business | Contactar Ventas | Fuerza laboral digital autónoma; Funciones y servicios de nivel empresarial | Usuarios empresariales | Servicios personalizados |
Servicios Adicionales Premium | ||||
Servidor | +37 €/dispositivo/mes (Estimado) | Servidor alojado por Simular; Incluye 200 horas de agente; 0,09 €/hora adicional (Estimado) | Usuarios que necesitan capacidad de computación en la nube | - |
Conserje | Contactar Ventas | Solicita resultados personalizados a expertos de Simular sin crear acciones tú mismo | Usuarios que necesitan servicios de expertos | - |
Este segmento de mercado se está desarrollando rápidamente, atrayendo una atención e inversión significativas. Los objetivos principales abarcan la automatización de flujos de trabajo, la ejecución de tareas, la generación de código, el análisis de datos y la interacción de software (GUI/API).
Los enfoques tecnológicos son diversos: interacción directa con GUI, orquestación de API, generación de código, IA conversacional, plataformas sin código/bajo código.
Simular AI enfrenta una competencia multidimensional:
**Competidores directos de automatización GUI:** OpenAI Operator/CUA, Manus AI, Genspark Superagent, Ace, Proxy AI.
**Marcos/plataformas de agentes de IA más amplios:** LangChain, AutoGen, CrewAI, plataformas sin código/bajo código (Gumloop, n8n, Google, Microsoft, UiPath, etc.), otros agentes de código abierto (Rasa, Haystack, etc.).
**Suites de productividad existentes:** Microsoft 365 Copilot, Google Workspace AI.
Competidor | Enfoque | Tecnología/Método | Código Abierto | Caso de Uso | Diferenciación |
---|---|---|---|---|---|
Simular AI | Automatización GUI | Modular(MoG,PHP),Interacción Humana,Análisis Captura Pantalla | Sí(Núcleo) | Automatización Personal/Empresarial | Código Abierto,Ejec Local,Colab Humano-Máquina,SOTA |
OpenAI Operator | Automatización GUI | GPT-4o,Descomposición Tarea | No(Modelo) | Formularios/E-commerce | Ecosistema OpenAI,Modelo Base Fuerte |
Manus AI | Agente IA General(GUI) | Colab Multi-Agente,o Claude 3.x | No | Automatización Tarea Compleja | Alta Atención/Financiación,Fiabilidad Cuestionable |
Genspark Superagent | Orquestación API/Llamada Herramienta | Agente Híbrido(9+ modelos),80+ herramientas,Integración API | No | Tareas Computadora Amplias | Agente Híbrido,Conjunto Herramientas Rico,Enfoque API |
Ace | Automatización GUI | Control Directo Teclado/Ratón Local,Aprendizaje Observacional | No | Tareas Escritorio Rápidas | Control Local Directo,Afirma Rapidez |
Proxy AI | Automatización Navegación Web | Procesamiento Paralelo(Multi-Agente),Instrucciones Lenguaje Natural | No | Investigación Web/Recolección Datos/Relleno Formularios | Enfoque Web,Aceleración Procesamiento Paralelo |
LangChain | Marco Aplicación LLM | Cadenas Prompt,Integración Datos,Módulos Agente | Sí | Construir Varias Aplicaciones LLM | Ecosistema Amplio,Flexible,No Especializado GUI |
AutoGen | Marco Conversación Multi-Agente | Coordinación Multi-Agente,Generación Código,Autocorrección | Sí | Flujos Trabajo Complejos,Tareas Programación | Soporte Microsoft,Bueno Código/Interacción Multi-Agente |
CrewAI | Marco Orquestación Multi-Agente | Colab Agente Role-Playing,Delegación Tarea | Sí | Automatización Tarea Colaborativa | Alta Usabilidad,Enfoque Coordinación Equipo Agente |
UiPath Agent Builder | Plataforma Bajo Código | Diseño Visual,Integración Ecosistema UiPath | No | RPA/Automatización Nivel Empresarial | Orientado Empresa,Integración Profunda UiPath |