
CamoFox Browser
CamoFox Browser ist ein Headless-Anti-Detection-Browser-Automatisierungsserver, der von Camoufox angetrieben wird (ein Firefox-Fork mit Fingerabdruck-Verschleierung auf C++.-Ebene). Es ermöglicht KI-Agenten, zuverlässig Websites zu durchsuchen, die von Cloudflare, Google und anderen Bot-Erkennungssystemen blockiert werden.
Was ist CamoFox Browser?
CamoFox Browser ist ein Headless-Browser-Automatisierungsserver, der speziell für KI-Agenten entwickelt wurde. Er wird von Camoufox angetrieben – einem Firefox-Fork, der Fingerprint-Spoofing auf der C++-Engine-Ebene durchführt und nicht auf fehleranfälligen JavaScript-Patches basiert.
Dies ermöglicht es KI-Agenten, echte Websites zu besuchen, die typischerweise Automatisierungswerkzeuge wie Playwright oder Puppeteer blockieren, einschließlich solcher, die durch Cloudflare, Google und andere fortschrittliche Bot-Erkennungssysteme geschützt sind.
Es ist dieselbe Browsing-Engine, die hinter dem Jo KI-Assistenten verwendet wird, und integriert sich nahtlos mit OpenClaw und anderen Agenten-Frameworks.
Hauptfunktionen
- Anti-Detection auf C++-Ebene: Fälscht Navigator-Eigenschaften, WebGL, AudioContext, Bildschirmgeometrie, WebRTC und mehr auf der Browser-Engine-Ebene für maximale Unerkennbarkeit.
- Token-effiziente Snapshots: Gibt Accessibility-Tree-Snapshots zurück (~90 % kleiner als rohes HTML) + optionale Base64-Screenshots.
- Stabile Elementreferenzen: Verwendet zuverlässige
e1,e2, ... Referenzen für Klicks, Eingaben und Interaktionen. - Sessionsisolierung: Pro-userId und sessionKey-Isolierung mit automatischem Ablauf und Tab-Recycling.
- Proxy & GeoIP-Abgleich: Leitet Datenverkehr über Residential Proxies mit übereinstimmendem Gebietsschema, Zeitzone und Geolokation.
- Cookie-Import: Unterstützt Netscape-Format-Cookie-Injection für authentifizierte Sessions (LinkedIn, Amazon, etc.).
- Integrierte Suchmakros:
@google_search,@youtube_search,@amazon_search,@reddit_subredditund mehr. - YouTube-Transkript-Extraktion: Schneller Pfad über yt-dlp oder Browser-Fallback.
- Geringer Ressourcenverbrauch: ~40MB Leerlauf-Speicher; Lazy-Launch und Leerlauf-Shutdown. Läuft auf Raspberry Pi oder günstigen VPS.
- Strukturierte API: REST-Endpunkte mit JSON-Logging und Request-ID-Tracing.
Architektur
- Browser angetrieben von Camoufox
- Isolierter BrowserContext pro Benutzer
- Tab-Gruppen organisiert nach sessionKey
- Automatischer Leerlauf-Shutdown und On-Demand-Relaunch
Installation & Schnellstart
Standalone
git clone https://github.com/jo-inc/camofox-browser
cd camofox-browser
npm install
npm start
Der Server läuft auf http://localhost:9377. Camoufox (~300MB) wird beim ersten Start automatisch heruntergeladen.
Docker
make up
Unterstützt Fly.io, Railway und Multi-Arch-Builds.
OpenClaw-Integration
openclaw plugins install @askjo/camofox-browser
Verwendungsbeispiele
Neuen Tab erstellen
curl -X POST http://localhost:9377/tabs \
-H "Content-Type: application/json" \
-d '{"userId": "agent1", "sessionKey": "task1", "url": "https://example.com"}'
Barrierefreiheit-Snapshot + Screenshot abrufen
curl "http://localhost:9377/tabs/{TAB_ID}/snapshot?userId=agent1&includeScreenshot=true"
Element per Referenz klicken
curl -X POST http://localhost:9377/tabs/{TAB_ID}/click \
-d '{"userId": "agent1", "ref": "e1"}'
Mit Makro suchen
curl -X POST http://localhost:9377/tabs/{TAB_ID}/navigate \
-d '{"userId": "agent1", "macro": "@google_search", "query": "best wireless headphones"}'
Anwendungsfälle
- KI-Agenten, die zuverlässiges Web-Browsing benötigen (Recherche, Shopping, Soziale Medien, etc.)
- Umgehung von Anti-Bot-Schutz auf Cloudflare-geschützten oder Google-Seiten
- Authentifiziertes Browsing mit importierten Cookies
- Token-effiziente Web-Interaktion in langlebigen Agenten-Workflows
- Integration mit OpenClaw, Claude Desktop (via MCP), LangChain und eigenen Agenten
Ressourcen
- GitHub: https://github.com/jo-inc/camofox-browser
- Camoufox: https://camoufox.com
- OpenClaw Integration: https://openclaw.ai
- Dokumentation: https://jo-inc-camofox-browser.mintlify.app
CamoFox Browser ist MIT-lizenziert, wird aktiv gepflegt (neueste Version April 2026) und weit verbreitet für produktive KI-Agenten-Webautomatisierung eingesetzt.