Cloudflare Browser Run: Edge-Native Infrastructure for AI Agents (12 minute read)

View Original ↗
AI 導讀 technology infrastructure 重要性 4/5

Cloudflare 將 Browser Run 併發限制提升至 120,並直接開放 CDP 端點,打造專為 AI 代理設計的邊緣網路基礎設施。

  • 預設併發瀏覽器數量從 30 大幅提升至 120,利用全球溫機池消除冷啟動時間。
  • 原生支援 CDP 與 WebMCP,讓 AI 代理能直接控制瀏覽器並呼叫網站提供的專屬工具。
  • 整合 Live View 即時預覽、會話錄影與人類接管機制,大幅強化自動化任務的除錯能力。

Cloudflare 推出 Browser Run 並將併發限制提升至 120

Cloudflare 將預設併發瀏覽器數量從 30 提升至 120,正式將 Browser Rendering 更名為 Browser Run。這項更新直接開放了 CDP(Chrome 開發者工具協定),讓 AI 代理(AI Agents)能夠在無須管理伺服器的情況下,於全球邊緣網路運行無頭瀏覽器,並支援人類隨時接管操作。

AI 代理需要瀏覽器來瀏覽網站、讀取頁面、填寫表單與擷取資料。為了滿足這些需求,Cloudflare 決定將原本的產品重新命名,使其成為專為 AI 代理設計的基礎設施。這項服務能執行完整的瀏覽器會話、透過程式碼或 AI 驅動、錄製與重播操作過程,甚至允許人類在代理需要幫助時介入。

開發者現在可以在全球邊緣網路上隨需啟動無頭的 Chrome 實例,無需自行管理基礎設施或維護瀏覽器版本。系統會在靠近使用者的節點開啟會話,以確保低延遲的連線品質,並且能根據需求動態擴展。若搭配 Agents SDK,更能建立可長期運行、具備記憶能力且能自主行動的代理。

企業用戶最關心的擴展性也得到大幅升級,預設的併發瀏覽器數量限制已從 30 增加到 120。每個會話都能即時從全球的溫機(warm instances)池中獲取瀏覽器資源,徹底消除了等待瀏覽器啟動的冷啟動時間。

開放 CDP 端點與 MCP 客戶端直接控制 Chrome

過去開發者控制瀏覽器多半依賴 Puppeteer 或 Playwright 等高階自動化工具,但現在 Browser Run 直接暴露了 CDP(Chrome開發者工具協定:底層驅動瀏覽器自動化的通訊協定)的終端節點。這代表現有的 CDP 自動化腳本只需修改一行設定,將 WebSocket URL 指向 API,就能直接在 Cloudflare 上運行。

直接使用 CDP 傳遞原始訊息給 AI 模型,可以實現更節省 Token 的瀏覽器控制方式。這也解鎖了許多無法透過常規高階套件完成的進階瀏覽器動作,例如 JavaScript 深度除錯。代理框架本身就原生支援 CDP 溝通,現在可以直接與端點連線,獲得對瀏覽器的最高控制權。

伴隨 CDP 端點的開放,Browser Run 也開始支援 MCP(Model Context Protocol:標準化 AI 模型與外部工具溝通的協定)客戶端。包含 Claude Desktop、Cursor 與 OpenCode 等 AI 程式碼助手,現在都能透過 Chrome DevTools 團隊提供的 chrome-devtools-mcp 套件,將 Browser Run 作為其遠端瀏覽器來使用。

支援 WebMCP 讓網站主動向 AI 代理暴露操作工具

現代網頁介面主要是為人類設計的,這使得 AI 代理在導航時常常遇到不可靠的情況。為解決這個問題,Cloudflare 率先支援了由 Google Chrome 團隊推出、並於 Chromium 146+ 版本實裝的 WebMCP 瀏覽器 API,讓網頁能對代理變得更友善。

這套機制依賴兩個核心 API 運作:navigator.modelContext 允許網站註冊專屬工具,而 navigator.modelContextTesting 則讓代理能夠發現並執行這些工具。例如,旅遊預訂網站可以直接宣告 search_flights 工具並要求輸入參數,代理便能直接呼叫,不再需要透過緩慢的「截圖-分析-點擊」循環來摸索使用者介面。

工具是在頁面上即時被發現的,而非預先載入,這對於廣大的長尾網站尤為重要。預先為所有可能造訪的網站載入 MCP 伺服器並不實際,也會耗盡上下文窗口。現在透過網頁本身暴露工具,即便 UI 發生改變,代理依然能穩定完成導航與任務。

為了讓開發者測試這些新興功能,Cloudflare 提供了一個運行 Chrome Beta 版的實驗性資源池。透過最新的 wrangler browser create --lab --keepAlive 300 命令列指令,開發者可以直接從終端機建立與管理支援 WebMCP 的實驗性瀏覽器會話。

引入 Live View 即時預覽與 Session Recordings 強化除錯

自動化流程並非總是完美無缺,開發者經常抱怨當腳本失敗時無法得知具體原因。為此新增的 Live View 功能讓開發者能即時觀看代理的瀏覽器會話。無論是檢查 DOM 結構、控制台日誌還是網路請求,只要遇到缺少按鈕或出現 CAPTCHA,都能第一時間察覺。

無法全程盯著即時畫面的情況,則可交由 Session Recordings 處理。這項功能會將 DOM 變更、滑鼠與鍵盤事件以及頁面導航捕捉為結構化的 JSON 格式,方便在會話結束後完整重播。啟動瀏覽器時傳遞 recording:true 參數即可啟用錄影功能,並可使用 rrweb-player 進行回放。

控制台的介面也經過了重新設計。過去儀表板僅顯示瀏覽器會話的日誌,現在全新的 Runs 標籤頁整合了每一項請求紀錄。開發者可以根據端點過濾資訊,並查看包含目標 URL、狀態與持續時間在內的詳細資料,即使是單純的截圖或 PDF 請求也一覽無遺。

Human in the Loop 允許人類接管與單一 API 網頁爬蟲

當 AI 代理遇到需要驗證的登入畫面或意外的邊緣情況時,程式不再只能選擇失敗。Human in the Loop 工作流程允許人類打開活動會話的 Live View 網址,直接接手進行點擊、輸入憑證或提交表單等操作。問題解決後,人類便可將控制權交還給代理繼續執行任務。

針對單純的資料獲取需求,Cloudflare 近期也推出了 /crawl 端點,只需一次 API 呼叫就能爬取整個網站。系統會自動發現頁面並以 HTML、Markdown 或結構化 JSON 格式返回資料,同時允許開發者設定爬取深度並略過未更改的頁面。針對這類 Quick Actions 的限制,也已在先前提升至每秒 10 個請求。

這項爬蟲功能被設計為一個「守規矩的機器人」。它會尊重網站擁有者的設定,使用具備密碼學簽名的獨立機器人 ID,並嚴格遵循 robots.txt 與 AI Crawl Control 協議。它不會試圖繞過 Cloudflare 自身的機器人防護或 CAPTCHA 驗證機制,將內容的開放權完全交還給網站所有者。

將無頭瀏覽器與即時除錯、人類接管機制整合至全球邊緣網路,正在為 AI 代理打造下一代標準化基礎設施。

Abstract

Cloudflare has rebranded its Browser Rendering service to BROWSER RUN, introducing new features for AI agents.