Fundada em 2023 e sediada em San Carlos, a Simular AI é uma startup de IA focada no desenvolvimento de 'agentes de uso de computador' que simulam a interação humana com GUIs. Os fundadores Ang Li e Jiachen Yang têm experiência em instituições de ponta como DeepMind, Google e Baidu. A missão principal é criar agentes de IA que possam usar computadores como humanos, automatizando tarefas digitais tediosas e liberando o potencial humano.
A tecnologia principal é o framework Agent S e sua versão atualizada Agent S2 – um framework de agente aberto, modular e extensível. Ele combina modelos gerais para planejamento de alto nível e utiliza modelos especializados para execução de baixo nível e ancoragem de interface, liderando em vários benchmarks. O Agent S2 introduz inovações como Planejamento Hierárquico Proativo (PHP) e Ancoragem Híbrida (MoG), operando GUIs com precisão usando apenas capturas de tela. A empresa adota o código aberto, com os frameworks Agent S/S2 disponíveis no GitHub.
O portfólio de produtos inclui Simular para macOS/Browser (agente local de navegador Mac) e Simular Desktop (assistente de desktop multiplataforma) para indivíduos, e Simular for Business (força de trabalho digital autônoma) para empresas. Os produtos enfatizam a segurança e o desempenho da execução local e focam na colaboração humano-máquina. Adota um modelo de precificação freemium (atualmente em beta) e oferece soluções personalizadas para empresas.
Em 2024, a empresa concluiu uma rodada de financiamento inicial de US$ 5 milhões com investidores como Basis Set Ventures, Flying Fish Partners, Samsung NEXT Ventures e South Park Commons.
Capacidade central de interagir com interfaces gráficas simulando operações humanas, sem depender de APIs.
Framework de agente modular avançado que combina planejamento de modelo geral com execução/ancoragem de modelo especializado.
Prevê e ajusta dinamicamente os planos para se adaptar às mudanças ambientais em tempo real, melhorando as taxas de sucesso das tarefas.
Utiliza vários especialistas em ancoragem para localizar com precisão elementos da UI, exigindo apenas entrada de captura de tela.
Os frameworks Agent S/S2 são de código aberto, promovendo o envolvimento da comunidade e a transparência tecnológica.
Os produtos pessoais enfatizam a execução no dispositivo do usuário, aprimorando a segurança e a privacidade dos dados.
Grava as ações digitais do usuário e pode reproduzi-las automaticamente, simplificando a criação de automação para tarefas repetitivas.
O agente pode tentar abordagens diferentes para se autocorrigir quando ocorrem erros de execução, melhorando a robustez.
Métodos de automação tradicionais (RPA, integração de API) têm limitações. A Simular AI se dedica a construir agentes inteligentes que podem **perceber, raciocinar e operar** diretamente GUIs em várias plataformas. Nossos '**agentes de uso de computador**' entendem o estado observando a tela, simulam com precisão as operações humanas de teclado e mouse e integram modos cognitivos de **pensamento rápido** (reação intuitiva) e **pensamento lento** (raciocínio profundo).
A tecnologia principal é incorporada nos frameworks Agent S/S2 **abertos, modulares e extensíveis**. Ambos adotam o princípio de design de usar **modelos gerais** para planejamento de alto nível e **modelos especializados** para execução de baixo nível e '**ancoragem**' de interface.
Dimensão Técnica | Agent S | Agent S2 (Inovações) |
---|---|---|
Capacidade de Planejamento | Planejamento hierárquico aprimorado por experiência | **Planejamento Hierárquico Proativo (PHP)**: Prevê estados futuros e ajusta planos dinamicamente |
Interface Humano-Máquina | Interface Agente-Computador (ACI) básica | **ACI Aprimorada**: Atribui tarefas de forma inteligente a módulos especialistas |
Localização de Elementos GUI | Depende de entrada multimodal, limitado por APIs de acessibilidade | **Ancoragem Híbrida (MoG)**: Localiza elementos de interface com precisão usando apenas capturas de tela |
Aprendizagem e Adaptação | Mecanismo básico de memória de experiência | **Sistema de memória avançado e autocorreção**: Aprendizagem contínua e ajuste de estratégia |
O código aberto é uma vantagem competitiva central para a Simular AI. Os frameworks Agent S/S2 são totalmente de código aberto no GitHub. A empresa mantém vários repositórios de código ativos (Agent-S, OpenACI, pysimular, etc.) e estabeleceu uma comunidade no Discord para promover a interação entre desenvolvedores. O uso do framework requer a configuração de um ambiente Python e Docker, e depende de serviços LLM externos e modelos de ancoragem especializados.
O design do produto gira em torno de agentes de IA que colaboram com os usuários, enfatizando a **colaboração humano-máquina** e o controle do usuário. Foca na **execução local (no dispositivo)** para aprimorar a segurança, a velocidade de resposta e a experiência. Oferece recursos para gravar, compartilhar e reproduzir ações digitais.
Oferece uma gama de produtos para atender a diferentes necessidades dos usuários:
Nome do Plano | Preço | Recursos Principais | Usuário Alvo | Serviços Adicionais Disponíveis |
---|---|---|---|---|
Plano Gratuito | R$0/mês | Ferramentas básicas de espaço de trabalho; Ações da comunidade pública; Sem ações privadas | Usuários individuais iniciantes | Nenhum |
Plano Premium | R$105/dispositivo/mês (Estimado) | Inclui recursos gratuitos; Ações de canal privado/equipe; Execução local | Indivíduos/equipes que precisam de privacidade/colaboração | Servidor, Concierge |
Simular for Business | Contatar Vendas | Força de trabalho digital autônoma; Recursos e serviços de nível empresarial | Usuários empresariais | Serviços personalizados |
Serviços Adicionais Premium | ||||
Servidor | +R$210/dispositivo/mês (Estimado) | Servidor hospedado pela Simular; Inclui 200 horas de agente; R$0,53/hora adicional (Estimado) | Usuários que precisam de capacidade de computação em nuvem | - |
Concierge | Contatar Vendas | Solicite resultados personalizados de especialistas da Simular sem criar ações você mesmo | Usuários que precisam de serviços de especialistas | - |
Este segmento de mercado está se desenvolvendo rapidamente, atraindo atenção e investimento significativos. Os objetivos principais abrangem automação de fluxo de trabalho, execução de tarefas, geração de código, análise de dados e interação de software (GUI/API).
As abordagens tecnológicas são diversas: interação direta com GUI, orquestração de API, geração de código, IA conversacional, plataformas sem código/baixo código.
A Simular AI enfrenta concorrência multidimensional:
**Concorrentes diretos de automação de GUI:** OpenAI Operator/CUA, Manus AI, Genspark Superagent, Ace, Proxy AI.
**Frameworks/plataformas de agentes de IA mais amplos:** LangChain, AutoGen, CrewAI, plataformas sem código/baixo código (Gumloop, n8n, Google, Microsoft, UiPath, etc.), outros agentes de código aberto (Rasa, Haystack, etc.).
**Suítes de produtividade existentes:** Microsoft 365 Copilot, Google Workspace AI.
Concorrente | Foco | Tecnologia/Método | Código Aberto | Caso de Uso | Diferenciação |
---|---|---|---|---|---|
Simular AI | Automação GUI | Modular(MoG,PHP),Interação Humana,Análise Captura Tela | Sim(Núcleo) | Automação Pessoal/Empresarial | Código Aberto,Exec Local,Colab Humano-Máquina,SOTA |
OpenAI Operator | Automação GUI | GPT-4o,Decomposição Tarefa | Não(Modelo) | Formulários/E-commerce | Ecossistema OpenAI,Modelo Base Forte |
Manus AI | Agente IA Geral(GUI) | Colab Multi-Agente,ou Claude 3.x | Não | Automação Tarefa Complexa | Alta Atenção/Financiamento,Confiabilidade Questionável |
Genspark Superagent | Orquestração API/Chamada Ferramenta | Agente Híbrido(9+ modelos),80+ ferramentas,Integração API | Não | Tarefas Computador Amplas | Agente Híbrido,Conjunto Ferramentas Rico,Foco API |
Ace | Automação GUI | Controle Direto Teclado/Mouse Local,Aprendizagem Observacional | Não | Tarefas Desktop Rápidas | Controle Local Direto,Alega Rapidez |
Proxy AI | Automação Navegação Web | Processamento Paralelo(Multi-Agente),Instruções Linguagem Natural | Não | Pesquisa Web/Coleta Dados/Preenchimento Formulário | Foco Web,Aceleração Processamento Paralelo |
LangChain | Framework Aplicação LLM | Cadeias Prompt,Integração Dados,Módulos Agente | Sim | Construir Várias Aplicações LLM | Ecossistema Amplo,Flexível,Não Especializado GUI |
AutoGen | Framework Conversa Multi-Agente | Coordenação Multi-Agente,Geração Código,Autocorreção | Sim | Fluxos Trabalho Complexos,Tarefas Programação | Suporte Microsoft,Bom Código/Interação Multi-Agente |
CrewAI | Framework Orquestração Multi-Agente | Colab Agente Role-Playing,Delegação Tarefa | Sim | Automação Tarefa Colaborativa | Alta Usabilidade,Foco Coordenação Equipe Agente |
UiPath Agent Builder | Plataforma Baixo Código | Design Visual,Integração Ecossistema UiPath | Não | RPA/Automação Nível Empresarial | Orientado Empresa,Integração Profunda UiPath |