Simular AI Agent

Simular AI 成立於 2023 年,總部位於聖卡洛斯,是一家專注於開發模擬人類與 GUI 互動的「電腦使用代理」的 AI 新創公司。創辦人 Ang Li 和 Jiachen Yang 擁有 DeepMind、Google、百度等頂尖機構的背景。核心使命是創造能像人一樣使用電腦的 AI 代理,自動化繁瑣的數位任務,解放人類潛能。

核心技術是 Agent S 框架及其升級版 Agent S2——一個開放、模組化、可擴展的代理框架。它結合通用模型進行高階規劃,利用專用模型進行低階執行和介面接地,在多個基準測試中表現領先。Agent S2 引入了主動分層規劃 (PHP) 和混合接地 (MoG) 等創新,僅依賴螢幕截圖即可精確操作 GUI。公司擁抱開源,Agent S/S2 框架已在 GitHub 上開源。

產品組合包括面向個人的 Simular for macOS/Browser(本地 Mac 瀏覽器代理)和 Simular Desktop(跨平台桌面助理),以及面向企業的 Simular for Business(自主數位員工)。產品強調本地執行的安全與效能,並專注於人機協作。採用免費增值定價模式(目前處於測試階段),並為企業提供客製化解決方案。

2024 年,公司完成了 500 萬美元的早期融資,投資方包括 Basis Set Ventures、Flying Fish Partners、Samsung NEXT Ventures 和 South Park Commons。

核心功能

類人 GUI 互動

核心能力,透過模擬人類操作與圖形介面互動,無需依賴 API。

Agent S2 框架

先進的模組化代理框架,結合通用模型規劃與專用模型執行/接地。

主動分層規劃 (PHP)

主動預測並動態調整計畫以適應即時環境變化,提高任務成功率。

混合接地 (MoG)

利用多種接地專家精確定位 UI 元素,僅需螢幕截圖輸入。

開源核心

Agent S/S2 框架開源,促進社群參與和技術透明度。

本地執行優先

個人產品強調在使用者裝置上執行,增強資料安全和隱私保護。

操作錄製與回放

記錄使用者數位操作並能自動回放,簡化重複任務自動化建立。

自糾正能力

代理在執行出錯時能嘗試不同的方法進行自我修正,提高強健性。

技術深度解析:Agent S 框架與電腦使用代理

核心概念:AI 電腦使用代理

傳統自動化方法(RPA、API 整合)存在侷限性。Simular AI 致力於建構能直接**感知、推理和操作**各種平台 GUI 的智慧代理。我們的「**電腦使用代理**」透過觀察螢幕理解狀態,精確模擬人類鍵鼠操作,並融合**快速思考**(直覺反應)和**慢速思考**(深度推理)的認知模式。

Agent S 與 S2 框架比較

核心技術體現在**開放、模組化、可擴展**的 Agent S/S2 框架上。兩者均採用**通用模型**負責高階規劃,**專用模型**負責低階執行和介面「**接地**」的設計原則。

技術維度Agent SAgent S2 (創新點)
規劃能力經驗增強的分層規劃**主動分層規劃 (PHP)**: 預測未來狀態並動態調整計畫
人機介面基礎代理-電腦介面 (ACI)**增強型 ACI**: 智慧分配任務給專家模組
GUI 元素定位依賴多模態輸入,受可訪問性 API 限制**混合接地 (MoG)**: 僅需螢幕截圖即可精確定位介面元素
學習與適應基礎經驗記憶機制**進階記憶系統與自糾錯**: 持續學習與策略調整

效能與基準測試

Agent S

  • OSWorld: 成功率較基線提升 83.6%
  • WindowsAgentArena: 展示優秀跨平台泛化能力

Agent S2 (SOTA 效能)

  • OSWorld: 50 步準確率 34.5%,超越 OpenAI CUA
  • WindowsAgentArena: 效能提升 52.8%
  • AndroidWorld: 準確率 50%,超越 UI-TARS

開源生態與社群

開源是 Simular AI 的核心差異化優勢。Agent S/S2 框架已在 GitHub 完全開源。公司維護多個活躍程式碼倉庫(Agent-S、OpenACI、pysimular 等),並建立了 Discord 社群促進開發者交流。使用該框架需要配置 Python 環境和 Docker,並依賴外部 LLM 服務和專用接地模型。

產品組合與服務

核心產品理念

產品設計圍繞與使用者協同工作的 AI 代理,強調**人機協作**和使用者控制權。側重**本地執行(on-device)**以增強安全、響應速度和體驗。提供記錄、共享和回放數位動作功能。

具體產品線

提供一系列產品,涵蓋不同使用者需求:

  • Simular for macOS / Simular Browser: macOS 原生代理,本地執行,內嵌 WebKit 引擎。強調自主性、共享控制、安全性和熟悉體驗。簡化日常數位生活。免費下載。
  • Simular Desktop: 桌面 AI 助理,執行數位動作和自動化任務。核心功能是錄製操作為指令並回放。目標是節省時間、提高生產力。可能跨平台。提供免費和 Premium 計畫。
  • Simular for Business: 定位為提升組織效率的**自主數位員工**。面向企業場景(金融、客服、HR 等)。專注自動化、生產力、可擴展性、工作流精簡、RPA、資料分析等。需聯繫演示。
  • Agent S / S2 框架: 底層開源框架,面向開發者和研究人員。

定價結構

Simular AI 定價方案
計畫名稱價格主要特性目標使用者可用附加服務
免費計畫NT$0/月基本工作區工具;公共社群動作;無私有動作個人入門使用者
Premium 計畫NT$600/裝置/月 (估算)含免費特性;私有/團隊頻道動作;本地執行需隱私/協作的個人/團隊伺服器, 禮賓服務
Simular for Business聯繫銷售自主數位員工;企業級功能與服務企業使用者客製化服務
Premium 附加服務
伺服器+NT$1200/裝置/月 (估算)Simular 託管伺服器;含 200 代理小時;額外 NT$3/小時 (估算)需雲端計算能力使用者-
禮賓服務聯繫銷售請求 Simular 專家獲取客製化結果,無需自創動作需專家服務使用者-

競爭格局分析

AI 代理市場概覽(聚焦電腦使用)

該細分市場快速發展,吸引大量關注和投資。核心目標涵蓋工作流自動化、任務執行、程式碼生成、資料分析及軟體互動 (GUI/API)。

技術路徑多樣:直接 GUI 互動、API 編排、程式碼生成、對話式 AI、無程式碼/低程式碼平台。

主要競爭對手

Simular AI 面臨多維度競爭:

**直接 GUI 自動化競爭對手:** OpenAI Operator/CUA, Manus AI, Genspark Superagent, Ace, Proxy AI。

**更廣泛 AI 代理框架/平台:** LangChain, AutoGen, CrewAI, 無程式碼/低程式碼平台 (Gumloop, n8n, Google, Microsoft, UiPath 等), 其他開源代理 (Rasa, Haystack 等)。

**現有生產力套件:** Microsoft 365 Copilot, Google Workspace AI。

競爭對手特性比較

競爭者焦點技術/方法開源用例差異化
Simular AIGUI 自動化模組化(MoG,PHP),類人互動,截圖分析是(核心)個人/企業自動化開源,本地執行,人機協作,SOTA
OpenAI OperatorGUI 自動化GPT-4o,任務分解否(模型)表單/電商OpenAI生態,強基礎模型
Manus AI通用AI代理(GUI)多代理協作,或用Claude 3.x複雜任務自動化高關注度/融資額,可靠性存疑
Genspark SuperagentAPI編排/工具調用混合代理(9+模型),80+工具,API整合廣泛電腦任務混合代理,豐富工具集,API重點
AceGUI 自動化直接控制本地鍵鼠,觀察學習快速桌面任務本地直接控制,聲稱速度快
Proxy AIWeb瀏覽自動化並行處理(多代理),自然語言指令網頁研究/資料收集/填表專注Web,並行處理加速
LangChainLLM應用框架提示鏈,資料整合,代理模組建構各種LLM應用廣泛生態,靈活,非專攻GUI
AutoGen多代理對話框架多代理協調,程式碼生成,自我修正複雜工作流,程式設計任務微軟支援,擅長程式碼/多代理互動
CrewAI多代理編排框架角色扮演代理協作,任務委派需協作的任務自動化易用性高,專注代理團隊協調
UiPath Agent Builder低程式碼平台視覺化設計,整合UiPath生態企業級RPA/自動化面向企業,與UiPath深度整合

戰略分析 (SWOT)

優勢 (Strengths)

  • 頂尖技術專長與研究實力。
  • 創新核心技術 (Agent S/S2, MoG, PHP)。
  • 開放原始碼戰略。
  • 早期融資驗證。
  • 務實願景定位 (人機協作)。

劣勢 (Weaknesses)

  • 公司早期階段。
  • 缺成熟真實世界案例。
  • 潛在商業化挑戰。
  • 依賴外部元件。
  • 產品線清晰度不足。

機會 (Opportunities)

  • 巨大市場需求 (AI 自動化)。
  • 企業級市場潛力。
  • 平台擴展 (跨 OS, 行動端)。
  • 社群生態建設。
  • 戰略合作。

威脅 (Threats)

  • 激烈市場競爭。
  • 快速技術變革。
  • 可靠性與可擴展性挑戰。
  • 商業模式可持續性。
  • 資料隱私與安全風險。

常見問題解答 (FAQ)