Simular AI 成立於 2023 年,總部位於聖卡洛斯,是一家專注於開發模擬人類與 GUI 互動的「電腦使用代理」的 AI 新創公司。創辦人 Ang Li 和 Jiachen Yang 擁有 DeepMind、Google、百度等頂尖機構的背景。核心使命是創造能像人一樣使用電腦的 AI 代理,自動化繁瑣的數位任務,解放人類潛能。
核心技術是 Agent S 框架及其升級版 Agent S2——一個開放、模組化、可擴展的代理框架。它結合通用模型進行高階規劃,利用專用模型進行低階執行和介面接地,在多個基準測試中表現領先。Agent S2 引入了主動分層規劃 (PHP) 和混合接地 (MoG) 等創新,僅依賴螢幕截圖即可精確操作 GUI。公司擁抱開源,Agent S/S2 框架已在 GitHub 上開源。
產品組合包括面向個人的 Simular for macOS/Browser(本地 Mac 瀏覽器代理)和 Simular Desktop(跨平台桌面助理),以及面向企業的 Simular for Business(自主數位員工)。產品強調本地執行的安全與效能,並專注於人機協作。採用免費增值定價模式(目前處於測試階段),並為企業提供客製化解決方案。
2024 年,公司完成了 500 萬美元的早期融資,投資方包括 Basis Set Ventures、Flying Fish Partners、Samsung NEXT Ventures 和 South Park Commons。
核心能力,透過模擬人類操作與圖形介面互動,無需依賴 API。
先進的模組化代理框架,結合通用模型規劃與專用模型執行/接地。
主動預測並動態調整計畫以適應即時環境變化,提高任務成功率。
利用多種接地專家精確定位 UI 元素,僅需螢幕截圖輸入。
Agent S/S2 框架開源,促進社群參與和技術透明度。
個人產品強調在使用者裝置上執行,增強資料安全和隱私保護。
記錄使用者數位操作並能自動回放,簡化重複任務自動化建立。
代理在執行出錯時能嘗試不同的方法進行自我修正,提高強健性。
傳統自動化方法(RPA、API 整合)存在侷限性。Simular AI 致力於建構能直接**感知、推理和操作**各種平台 GUI 的智慧代理。我們的「**電腦使用代理**」透過觀察螢幕理解狀態,精確模擬人類鍵鼠操作,並融合**快速思考**(直覺反應)和**慢速思考**(深度推理)的認知模式。
核心技術體現在**開放、模組化、可擴展**的 Agent S/S2 框架上。兩者均採用**通用模型**負責高階規劃,**專用模型**負責低階執行和介面「**接地**」的設計原則。
技術維度 | Agent S | Agent S2 (創新點) |
---|---|---|
規劃能力 | 經驗增強的分層規劃 | **主動分層規劃 (PHP)**: 預測未來狀態並動態調整計畫 |
人機介面 | 基礎代理-電腦介面 (ACI) | **增強型 ACI**: 智慧分配任務給專家模組 |
GUI 元素定位 | 依賴多模態輸入,受可訪問性 API 限制 | **混合接地 (MoG)**: 僅需螢幕截圖即可精確定位介面元素 |
學習與適應 | 基礎經驗記憶機制 | **進階記憶系統與自糾錯**: 持續學習與策略調整 |
開源是 Simular AI 的核心差異化優勢。Agent S/S2 框架已在 GitHub 完全開源。公司維護多個活躍程式碼倉庫(Agent-S、OpenACI、pysimular 等),並建立了 Discord 社群促進開發者交流。使用該框架需要配置 Python 環境和 Docker,並依賴外部 LLM 服務和專用接地模型。
產品設計圍繞與使用者協同工作的 AI 代理,強調**人機協作**和使用者控制權。側重**本地執行(on-device)**以增強安全、響應速度和體驗。提供記錄、共享和回放數位動作功能。
提供一系列產品,涵蓋不同使用者需求:
計畫名稱 | 價格 | 主要特性 | 目標使用者 | 可用附加服務 |
---|---|---|---|---|
免費計畫 | NT$0/月 | 基本工作區工具;公共社群動作;無私有動作 | 個人入門使用者 | 無 |
Premium 計畫 | NT$600/裝置/月 (估算) | 含免費特性;私有/團隊頻道動作;本地執行 | 需隱私/協作的個人/團隊 | 伺服器, 禮賓服務 |
Simular for Business | 聯繫銷售 | 自主數位員工;企業級功能與服務 | 企業使用者 | 客製化服務 |
Premium 附加服務 | ||||
伺服器 | +NT$1200/裝置/月 (估算) | Simular 託管伺服器;含 200 代理小時;額外 NT$3/小時 (估算) | 需雲端計算能力使用者 | - |
禮賓服務 | 聯繫銷售 | 請求 Simular 專家獲取客製化結果,無需自創動作 | 需專家服務使用者 | - |
該細分市場快速發展,吸引大量關注和投資。核心目標涵蓋工作流自動化、任務執行、程式碼生成、資料分析及軟體互動 (GUI/API)。
技術路徑多樣:直接 GUI 互動、API 編排、程式碼生成、對話式 AI、無程式碼/低程式碼平台。
Simular AI 面臨多維度競爭:
**直接 GUI 自動化競爭對手:** OpenAI Operator/CUA, Manus AI, Genspark Superagent, Ace, Proxy AI。
**更廣泛 AI 代理框架/平台:** LangChain, AutoGen, CrewAI, 無程式碼/低程式碼平台 (Gumloop, n8n, Google, Microsoft, UiPath 等), 其他開源代理 (Rasa, Haystack 等)。
**現有生產力套件:** Microsoft 365 Copilot, Google Workspace AI。
競爭者 | 焦點 | 技術/方法 | 開源 | 用例 | 差異化 |
---|---|---|---|---|---|
Simular AI | GUI 自動化 | 模組化(MoG,PHP),類人互動,截圖分析 | 是(核心) | 個人/企業自動化 | 開源,本地執行,人機協作,SOTA |
OpenAI Operator | GUI 自動化 | GPT-4o,任務分解 | 否(模型) | 表單/電商 | OpenAI生態,強基礎模型 |
Manus AI | 通用AI代理(GUI) | 多代理協作,或用Claude 3.x | 否 | 複雜任務自動化 | 高關注度/融資額,可靠性存疑 |
Genspark Superagent | API編排/工具調用 | 混合代理(9+模型),80+工具,API整合 | 否 | 廣泛電腦任務 | 混合代理,豐富工具集,API重點 |
Ace | GUI 自動化 | 直接控制本地鍵鼠,觀察學習 | 否 | 快速桌面任務 | 本地直接控制,聲稱速度快 |
Proxy AI | Web瀏覽自動化 | 並行處理(多代理),自然語言指令 | 否 | 網頁研究/資料收集/填表 | 專注Web,並行處理加速 |
LangChain | LLM應用框架 | 提示鏈,資料整合,代理模組 | 是 | 建構各種LLM應用 | 廣泛生態,靈活,非專攻GUI |
AutoGen | 多代理對話框架 | 多代理協調,程式碼生成,自我修正 | 是 | 複雜工作流,程式設計任務 | 微軟支援,擅長程式碼/多代理互動 |
CrewAI | 多代理編排框架 | 角色扮演代理協作,任務委派 | 是 | 需協作的任務自動化 | 易用性高,專注代理團隊協調 |
UiPath Agent Builder | 低程式碼平台 | 視覺化設計,整合UiPath生態 | 否 | 企業級RPA/自動化 | 面向企業,與UiPath深度整合 |