Simular AI Agent

Fundada en 2023 y con sede en San Carlos, Simular AI es una startup de IA centrada en desarrollar 'agentes de uso de computadoras' que simulan la interacción humana con interfaces gráficas de usuario (GUI). Los fundadores Ang Li y Jiachen Yang tienen experiencia en instituciones de primer nivel como DeepMind, Google y Baidu. La misión principal es crear agentes de IA que puedan usar computadoras como humanos, automatizando tareas digitales tediosas y liberando el potencial humano.

La tecnología central es el marco Agent S y su versión mejorada Agent S2, un marco de agente abierto, modular y extensible. Combina modelos generales para la planificación de alto nivel y utiliza modelos especializados para la ejecución de bajo nivel y el anclaje de interfaz, liderando en varias pruebas de referencia. Agent S2 introduce innovaciones como la Planificación Jerárquica Proactiva (PHP) y el Anclaje Híbrido (MoG), operando GUIs con precisión utilizando solo capturas de pantalla. La compañía adopta el código abierto, con los marcos Agent S/S2 disponibles en GitHub.

La cartera de productos incluye Simular para macOS/Browser (agente local de navegador Mac) y Simular Desktop (asistente de escritorio multiplataforma) para particulares, y Simular for Business (fuerza laboral digital autónoma) para empresas. Los productos enfatizan la seguridad y el rendimiento de la ejecución local y se centran en la colaboración humano-máquina. Adopta un modelo de precios freemium (actualmente en beta) y ofrece soluciones personalizadas para empresas.

En 2024, la compañía completó una ronda de financiación inicial de 5 millones de dólares con inversores como Basis Set Ventures, Flying Fish Partners, Samsung NEXT Ventures y South Park Commons.

Funciones Principales

Interacción GUI similar a la humana

Capacidad central para interactuar con interfaces gráficas simulando operaciones humanas, sin depender de APIs.

Marco Agent S2

Marco de agente modular avanzado que combina la planificación de modelos generales con la ejecución/anclaje de modelos especializados.

Planificación Jerárquica Proactiva (PHP)

Predice y ajusta dinámicamente los planes para adaptarse a los cambios ambientales en tiempo real, mejorando las tasas de éxito de las tareas.

Anclaje Híbrido (MoG)

Utiliza múltiples expertos en anclaje para localizar con precisión elementos de la interfaz de usuario, requiriendo solo la entrada de capturas de pantalla.

Núcleo de Código Abierto

Los marcos Agent S/S2 son de código abierto, fomentando la participación de la comunidad y la transparencia tecnológica.

Prioridad de Ejecución Local

Los productos personales enfatizan la ejecución en el dispositivo del usuario, mejorando la seguridad y privacidad de los datos.

Grabación y Reproducción de Acciones

Graba las acciones digitales del usuario y puede reproducirlas automáticamente, simplificando la creación de automatización para tareas repetitivas.

Capacidad de Autocorrección

El agente puede probar diferentes enfoques para autocorregirse cuando ocurren errores de ejecución, mejorando la robustez.

Análisis Técnico Profundo: Marco Agent S y Agentes de Uso de Computadoras

Concepto Central: Agentes de Uso de Computadoras de IA

Los métodos de automatización tradicionales (RPA, integración de API) tienen limitaciones. Simular AI se dedica a construir agentes inteligentes que pueden **percibir, razonar y operar** directamente GUIs en diversas plataformas. Nuestros '**agentes de uso de computadoras**' comprenden el estado observando la pantalla, simulan con precisión las operaciones humanas de teclado y ratón, e integran modos cognitivos de **pensamiento rápido** (reacción intuitiva) y **pensamiento lento** (razonamiento profundo).

Comparación de los Marcos Agent S y S2

La tecnología central se materializa en los marcos Agent S/S2 **abiertos, modulares y extensibles**. Ambos adoptan el principio de diseño de usar **modelos generales** para la planificación de alto nivel y **modelos especializados** para la ejecución de bajo nivel y el '**anclaje**' de interfaz.

Dimensión TécnicaAgent SAgent S2 (Innovaciones)
Capacidad de PlanificaciónPlanificación jerárquica mejorada por experiencia**Planificación Jerárquica Proactiva (PHP)**: Predice estados futuros y ajusta planes dinámicamente
Interfaz Humano-MáquinaInterfaz Agente-Computadora (ACI) básica**ACI Mejorada**: Asigna tareas inteligentemente a módulos expertos
Localización de Elementos GUIDepende de entrada multimodal, limitado por APIs de accesibilidad**Anclaje Híbrido (MoG)**: Localiza elementos de interfaz con precisión usando solo capturas de pantalla
Aprendizaje y AdaptaciónMecanismo básico de memoria de experiencia**Sistema de memoria avanzado y autocorrección**: Aprendizaje continuo y ajuste de estrategia

Rendimiento y Pruebas de Referencia

Agent S

  • OSWorld: Tasa de éxito un 83.6% mayor que la línea base
  • WindowsAgentArena: Demuestra una excelente capacidad de generalización multiplataforma

Agent S2 (Rendimiento SOTA)

  • OSWorld: Precisión de 50 pasos del 34.5%, superando a OpenAI CUA
  • WindowsAgentArena: Mejora del rendimiento del 52.8%
  • AndroidWorld: Precisión del 50%, superando a UI-TARS

Ecosistema de Código Abierto y Comunidad

El código abierto es una ventaja competitiva central para Simular AI. Los marcos Agent S/S2 son completamente de código abierto en GitHub. La compañía mantiene varios repositorios de código activos (Agent-S, OpenACI, pysimular, etc.) y ha establecido una comunidad en Discord para fomentar la interacción entre desarrolladores. Usar el marco requiere configurar un entorno Python y Docker, y depende de servicios LLM externos y modelos de anclaje especializados.

Cartera de Productos y Servicios

Filosofía Central del Producto

El diseño del producto gira en torno a agentes de IA que colaboran con los usuarios, enfatizando la **colaboración humano-máquina** y el control del usuario. Se centra en la **ejecución local (en el dispositivo)** para mejorar la seguridad, la velocidad de respuesta y la experiencia. Ofrece funciones para grabar, compartir y reproducir acciones digitales.

Líneas de Productos Específicas

Ofrece una gama de productos para satisfacer diferentes necesidades de los usuarios:

  • Simular para macOS / Simular Browser: Agente nativo de macOS, ejecutado localmente, con motor WebKit integrado. Enfatiza la autonomía, el control compartido, la seguridad y la experiencia familiar. Simplifica la vida digital diaria. Descarga gratuita.
  • Simular Desktop: Asistente de IA de escritorio que ejecuta acciones digitales y tareas de automatización. La funcionalidad principal es grabar operaciones como instrucciones y reproducirlas. El objetivo es ahorrar tiempo y aumentar la productividad. Potencialmente multiplataforma. Ofrece planes Gratuito y Premium.
  • Simular for Business: Posicionado como una **fuerza laboral digital autónoma** para aumentar la eficiencia organizacional. Dirigido a escenarios empresariales (finanzas, atención al cliente, RRHH, etc.). Se centra en la automatización, productividad, escalabilidad, optimización de flujos de trabajo, RPA, análisis de datos, etc. Requiere contacto para demostración.
  • Marco Agent S / S2: Marco subyacente de código abierto para desarrolladores e investigadores.

Estructura de Precios

Planes de Precios de Simular AI
Nombre del PlanPrecioCaracterísticas PrincipalesUsuario ObjetivoServicios Adicionales Disponibles
Plan Gratuito0 €/mesHerramientas básicas de espacio de trabajo; Acciones de la comunidad pública; Sin acciones privadasUsuarios individuales principiantesNinguno
Plan Premium18,50 €/dispositivo/mes (Estimado)Incluye funciones gratuitas; Acciones de canal privado/equipo; Ejecución localIndividuos/equipos que necesitan privacidad/colaboraciónServidor, Conserje
Simular for BusinessContactar VentasFuerza laboral digital autónoma; Funciones y servicios de nivel empresarialUsuarios empresarialesServicios personalizados
Servicios Adicionales Premium
Servidor+37 €/dispositivo/mes (Estimado)Servidor alojado por Simular; Incluye 200 horas de agente; 0,09 €/hora adicional (Estimado)Usuarios que necesitan capacidad de computación en la nube-
ConserjeContactar VentasSolicita resultados personalizados a expertos de Simular sin crear acciones tú mismoUsuarios que necesitan servicios de expertos-

Análisis del Panorama Competitivo

Visión General del Mercado de Agentes de IA (Enfoque en Uso de Computadoras)

Este segmento de mercado se está desarrollando rápidamente, atrayendo una atención e inversión significativas. Los objetivos principales abarcan la automatización de flujos de trabajo, la ejecución de tareas, la generación de código, el análisis de datos y la interacción de software (GUI/API).

Los enfoques tecnológicos son diversos: interacción directa con GUI, orquestación de API, generación de código, IA conversacional, plataformas sin código/bajo código.

Principales Competidores

Simular AI enfrenta una competencia multidimensional:

**Competidores directos de automatización GUI:** OpenAI Operator/CUA, Manus AI, Genspark Superagent, Ace, Proxy AI.

**Marcos/plataformas de agentes de IA más amplios:** LangChain, AutoGen, CrewAI, plataformas sin código/bajo código (Gumloop, n8n, Google, Microsoft, UiPath, etc.), otros agentes de código abierto (Rasa, Haystack, etc.).

**Suites de productividad existentes:** Microsoft 365 Copilot, Google Workspace AI.

Comparación de Características de los Competidores

CompetidorEnfoqueTecnología/MétodoCódigo AbiertoCaso de UsoDiferenciación
Simular AIAutomatización GUIModular(MoG,PHP),Interacción Humana,Análisis Captura PantallaSí(Núcleo)Automatización Personal/EmpresarialCódigo Abierto,Ejec Local,Colab Humano-Máquina,SOTA
OpenAI OperatorAutomatización GUIGPT-4o,Descomposición TareaNo(Modelo)Formularios/E-commerceEcosistema OpenAI,Modelo Base Fuerte
Manus AIAgente IA General(GUI)Colab Multi-Agente,o Claude 3.xNoAutomatización Tarea ComplejaAlta Atención/Financiación,Fiabilidad Cuestionable
Genspark SuperagentOrquestación API/Llamada HerramientaAgente Híbrido(9+ modelos),80+ herramientas,Integración APINoTareas Computadora AmpliasAgente Híbrido,Conjunto Herramientas Rico,Enfoque API
AceAutomatización GUIControl Directo Teclado/Ratón Local,Aprendizaje ObservacionalNoTareas Escritorio RápidasControl Local Directo,Afirma Rapidez
Proxy AIAutomatización Navegación WebProcesamiento Paralelo(Multi-Agente),Instrucciones Lenguaje NaturalNoInvestigación Web/Recolección Datos/Relleno FormulariosEnfoque Web,Aceleración Procesamiento Paralelo
LangChainMarco Aplicación LLMCadenas Prompt,Integración Datos,Módulos AgenteConstruir Varias Aplicaciones LLMEcosistema Amplio,Flexible,No Especializado GUI
AutoGenMarco Conversación Multi-AgenteCoordinación Multi-Agente,Generación Código,AutocorrecciónFlujos Trabajo Complejos,Tareas ProgramaciónSoporte Microsoft,Bueno Código/Interacción Multi-Agente
CrewAIMarco Orquestación Multi-AgenteColab Agente Role-Playing,Delegación TareaAutomatización Tarea ColaborativaAlta Usabilidad,Enfoque Coordinación Equipo Agente
UiPath Agent BuilderPlataforma Bajo CódigoDiseño Visual,Integración Ecosistema UiPathNoRPA/Automatización Nivel EmpresarialOrientado Empresa,Integración Profunda UiPath

Análisis Estratégico (DAFO)

Fortalezas (Strengths)

  • Experiencia técnica de primer nivel y capacidad de investigación.
  • Tecnologías centrales innovadoras (Agent S/S2, MoG, PHP).
  • Estrategia de código abierto.
  • Validación mediante financiación inicial.
  • Posicionamiento de visión pragmática (colaboración humano-máquina).

Debilidades (Weaknesses)

  • Empresa en etapa temprana.
  • Falta de casos de uso maduros en el mundo real.
  • Posibles desafíos de comercialización.
  • Dependencia de componentes externos.
  • Falta de claridad en la línea de productos.

Oportunidades (Opportunities)

  • Enorme demanda del mercado (automatización de IA).
  • Potencial del mercado empresarial.
  • Expansión de plataforma (multi-SO, móvil).
  • Construcción de ecosistema comunitario.
  • Asociaciones estratégicas.

Amenazas (Threats)

  • Intensa competencia en el mercado.
  • Rápido cambio tecnológico.
  • Desafíos de fiabilidad y escalabilidad.
  • Sostenibilidad del modelo de negocio.
  • Riesgos de privacidad y seguridad de datos.

Preguntas Frecuentes (FAQ)