, ,

從Query到策略調度:Google多Agent白皮書, 揭示企業AI新邏輯

2024–2025 年間,AI 產業正掀起快速轉向『 Agents導向(Agentic)』架構的浪潮。OpenAI 的 ChatGPT、Elon Musk 主導的 Grok 以及 Google 研發的 Gemini 等消費級應用相繼問世,在市場上推動了「AI Agents」風潮。然而相較之下,企業端對 AI Agent架構的採用仍處於起步探索階段,部署步伐更趨審慎,涉及的系統整合與治理複雜性也明顯提高。

企業在導入 AI Agents時面臨一系列現實挑戰。首要難題是如何確保模型輸出的品質與可靠性。為此,企業亟需建立嚴謹的評估標準與持續監控機制,避免 AI Agents不受控地行動,導致「智慧自動化」演變成操作混亂。同時,如何建立完善的治理框架與風險控管,以及在人機協作中劃清責任界線,確保自主決策符合企業倫理與法規標準,也是不可迴避的難題。

針對上述趨勢與挑戰,Google 的 Antonio Gulli 團隊近期發表了《Agents Companion》白皮書作為觀察與理解的核心材料。其中對 AgentOps(AI Agent營運)、Agentic RAG( Agent導向的檢索增強生成)和多 Agent協作等主題進行了深入探討,為企業部署 AI Agents提供了全面的理論與實踐指引。接下來,本文將從品牌廠商、數位轉型負責人與產品決策者的視角出發,解析該白皮書中的六大關鍵議題,並為臺灣企業帶來本地化且可操作的洞察。

一、多 Agent系統與單 Agent系統:本質差異與商業意涵

在AI應用日益複雜的今天,多 Agent系統(multi-agent system)與單 Agent系統之間的差異,正深刻影響企業的數位策略。單 Agent系統可視為一個「單兵作戰」的AI助理,通常獨立執行明確任務;而多 Agent系統則彷彿由多位專家組成的團隊,各自扮演不同角色,協同合作完成任務。本質上,多 Agent架構會將複雜問題拆解為子任務,交給專門的智能體分工處理,使AI整體具備適應性、更高效且具可解釋性的工作流程。例如,在客戶服務場景中,一個AI Agent可能負責查詢用戶資料,另一個負責處理退款流程,第三個進行情緒分析與回覆,彼此配合即可自動化完成整個服務流程,這是單一巨型模型難以勝任的。

多 Agent系統的關鍵優勢在於專業化與協作:每個 Agent能深入其專長領域,彼此交叉驗證結果,提高整體精確度。多個 Agent還可併行處理子任務,大幅縮短任務完成時間,並在其中一個 Agent失效時由其他 Agent補位,提升韌性。相較之下,單 Agent系統雖然架構簡單、統一管理,但往往因為充當「通才」而難以兼顧所有面向。在商業實踐中,這意味著多 Agent架構更適合複雜、跨領域的任務:例如企業的內部資訊查詢,同時涉及法務、財務和技術知識,就可由多個專精不同領域的智能體合作完成。而單 Agent可能適合聚焦單一明確職能,例如撰寫行銷文案或簡單客服問答。

當然,多 Agent協作也帶來新挑戰,如 Agent間的溝通與協調成本。企業需建立良好的 Agent編排(orchestration)機制,確保訊息與任務在 Agent之間順暢傳遞,避免出現混亂或重工。另外,多 Agent系統的開發維護複雜度更高,需要監控每個 Agent的表現並持續調整協作策略。這些都要求企業在技術架構與團隊分工上進行相應的調整。然而,對於追求數位轉型的公司而言,投資多 Agent系統往往能帶來更大的商業價值——因為它讓AI不再侷限於單點功能,而是擴展為靈活適應各種情境的AI團隊

二、AgentOps:從 MLOps 到組織級 AI 生產化治理的演進

當企業將AI Agent從概念驗證推向實際生產環境,品質和可靠性便成為最大挑戰。Google最新白皮書強調,傳統的機器學習運維流程(MLOps)需進一步拓展為AgentOps(智能體維運),才能有效管理日益複雜的AI Agent部署。AgentOps 是生成式AI運維(GenAIOps)的一個子領域,核心在於如何讓AI Agent在生產環境中高效、可靠地運行。相較於MLOps著重模型訓練部署,AgentOps額外涵蓋了工具管理、 Agent的大腦提示(目標、設定、指令)編排、長短期記憶機制以及任務分解等要素。換言之,它將DevOps與MLOps的最佳實踐延伸到 Agent層面,確保 Agent能持續交付價值。

在企業治理的視角下,AgentOps意味著將AI Agent納入和傳統IT系統同等嚴謹的運維流程。首先是版本控制、CI/CD 自動化部署、日誌監控與安全機制——這些DevOps的基本功在AgentOps中一樣不能少。例如, Agent使用的外部API調用需要與常規軟體相同的認證與錯誤處理機制,以確保安全和穩定。其次是指標驅動的優化:每個 Agent上線後,都應對其關鍵績效指標(KPI)進行監控,透過A/B測試等方法持續改進。這裡的指標不僅包括 Agent完成任務的成功率,還應該關注對最終業務價值的影響,如提升了多少生產力、創造了多少營收等。成功的AgentOps實施需要技術、流程與人員三方面協調配合,將AI Agent技術深度融入組織運營模型。也就是說,企業在導入AI Agent時,必須同步調整內部團隊分工與流程,明確誰來開發、誰來監管這些 Agent,以及出現問題時的責任歸屬。

值得強調的是,AgentOps不是對既有流程的替代,而是在既有DevOps/MLOps基礎上的加法。傳統IT和機器學習的經驗仍然適用,例如建立單元測試來驗證 Agent的工具調用是否符合預期,或使用安全沙箱測試 Agent行為,防範風險。新增加的部分則在於 Agent特有的運維內容:如工具插件的版本管理、Prompt模板的版本管理,以及 Agent記憶庫的數據更新頻率等。對企業而言,這代表要培養新的能力和團隊,例如“AI Agent工程師”或“PromptOps”專家,負責持續改進 Agent的提示語和知識整合效果。只有具備組織級的AI生產治理框架,企業才能讓一批AI Agent從demo走向成熟穩定的“數位員工”。

  • 延伸觀察:*業界開始出現專門支援AgentOps的平台與工具。Google Cloud近期即針對企業推出了Agentspace平臺,強調內建安全性、監控等企業級功能,方便開發者將多 Agent系統迅速部署在生產環境。據Google團隊透露,他們自身已在該平臺上構建自有AI Agent,并計畫在2025年推出更多相關功能,協助開發者更輕鬆地建置、管理 Agent。這些動向顯示,AgentOps正從理念落地為實際工具,幫助企業把AI Agent的管理養成日常工作的一部分。同時,一些領先企業也意識到,“看不到就無法信任”——只有建立完善的監控和治理機制,才能放心地將關鍵任務交給AI。

三、Agentic RAG 與 AI 搜尋的新邏輯:從 Query 到策略性知識調度

隨著企業數據量爆炸式增長,傳統的AI搜尋方式正在讓位於策略性知識調度的新模式。其中,Agentic RAG(Agentic Retrieval-Augmented Generation,即 Agent增強式生成)被視為檢索式生成的新邏輯突破點。傳統的RAG流程比較僵化:當用戶提出查詢(query)時,系統從向量資料庫檢索幾段相關內容交給大型模型生成回答。然而,這種一次性檢索的方式在面對含糊、多步驟或需要多角度資訊的問題時往往力不從心。Agentic RAG 則引入了自主的檢索 Agent,可以根據查詢情況進行反覆的推理與搜尋優化,猶如一名資訊獵手在多個資料源中來回摸索,直到找到可靠答案為止。

在Agentic RAG架構下,AI Agent會將原始的自然語言問題拆解並轉化為一系列子查詢,逐步探索相關知識領域。具體策略包括:動態擴充或重組查詢(避免只靠單次關鍵字匹配)、多階段檢索(先尋找總體概念,再深入具體細節)、智能選擇資料源(不同 Agent針對結構化數據、非結構化文本或圖像等不同類型知識庫進行檢索),以及引入評估 Agent交叉驗證資訊真偽。後者尤為重要:一個專門的 Agent可以對主 Agent檢索到的內容進行事實檢查和矛盾檢測,在答案生成前過濾掉可能的謬誤,減少幻覺錯誤。通過這種自主迭代,Agentic RAG能夠提供比傳統RAG更準確、上下文相關的回答,大大提升信息檢索在決策支援上的可靠度。

對企業而言,Agentic RAG帶來的新價值在於知識管理與搜索效率的質變。以前,員工可能需要嘗試多次查詢、瀏覽多個系統才能拼湊出完整答案;現在,智能 Agent可以接管這種繁瑣過程,自動為用戶調度各種知識來源並彙整結果。例如,在法務合規場景中, Agent可先檢索法律法規資料庫,再查詢企業內部政策文件,最後將結果彙總成建議措施並列出依據來源,節省法務團隊大量時間。不僅如此,Agentic RAG的適應性使其能跟上瞬息萬變的資訊:面對最新的市場動態或技術資料, Agent可自動調整檢索策略確保資訊最新最相關。這種「智慧搜尋」的能力,將企業內部的海量數據真正轉化為隨取隨用的洞見,增強決策的即時性與準確性。

值得注意的是,再強大的檢索 Agent也需要良好的資料基礎設施支撐。Google 白皮書建議企業優先優化自身的搜索引擎與知識庫建設,例如對文件進行語義切片和添加豐富的中繼資料,提升底層搜索的覆蓋率和精度。同時,可以結合向量資料庫與傳統排序器(ranker),確保返回結果既相關又精煉。這些最佳實踐已融入Google的企業產品中——比如 Vertex AI Search 提供了文件解析、嵌入向量微調、快速向量搜尋和重新排序等一系列功能,方便開發者構建Agentic RAG應用。換言之,未來的AI搜尋將不再只是回答用戶的單一問題,而是能根據任務需要進行策略性調度,主動提出關聯問題、整合多源知識,成為企業智庫中真正會思考的「搜尋頭腦」

  • 延伸案例:*Agentic RAG的理念正在各行各業落地。例如,一些金融情報公司已經開發 Agent來優化研報搜尋: Agent先針對模糊的投資問題生成多個精確子問題,再逐一搜索內部研究報告,最後匯整出有依據的分析結論。Google在總結中更指出,這種多 Agent強化的檢索生成能顯著改善答案相關性,前提是企業也要同步強化自身搜尋能力——包括語義分塊文檔、豐富標註資訊、精調向量嵌入模型,以及為向量搜索結果增加傳統排序程序。可見,Agentic RAG既是對AI Agent能力的考驗,也是對企業數據治理與搜尋技術的全面挑戰。在不久的將來,那些積極升級內部搜尋基礎建設並採用Agentic RAG的企業,將能在知識經濟中拔得頭籌。

四、評估與監控 Agent:KPI、軌跡追蹤與人類回饋機制

無論AI Agent多麼強大,如果企業無法有效評估和監控其行為,就難以放心將業務交給它們運行。“如果你無法觀測,就無法信任”,這句話在AI Agent治理中尤為真實。首先,企業需要為 Agent設定清晰的關鍵績效指標(KPI)。這既包括業務層面的成果(例如客服 Agent是否提高了客戶滿意度或縮短了解決問題的時間),也包括任務層面的指標(如 Agent目標完成率、關鍵步驟執行比例)。大多數智能體圍繞特定目標而設計,因此目標完成率是最核心的衡量標準之一。此外,每個目標往往細分為若干關鍵任務或用戶互動點——企業應獨立監測這些關鍵環節的嘗試次數與成功率,以找出 Agent流程中的薄弱環節。除了任務成功與否,傳統IT運維指標如響應延遲、錯誤率等,同樣適用於衡量 Agent運行品質。這些高階指標可匯總在儀表板上,幫助管理者時刻掌握 Agent對業務的影響。

然而,單看結果並不足以全面評估 Agent。AI Agent往往執行一連串行動步驟(即軌跡,trajectory)才產生最後答案。因此,我們需要監控 Agent在過程中做了什麼:用到了哪些工具?每一步輸入輸出是什麼?有無多餘或無效的操作?這種對行動軌跡的追蹤,有助於我們理解 Agent的決策邏輯並進行調適。實踐中,開發者可以為每個任務設計一個理想的參考軌跡,然後比較 Agent實際行為與理想路徑的差異。例如,在線客服 Agent回答客戶退款問題時,預期軌跡也許是:查詢訂單->檢查退貨政策->給出答覆。如果 Agent偏離這一路徑(比如不必要地查詢了物流狀態),就能及時發現和優化。學術和業界已出現一些自動化方法來評估軌跡,如精確匹配( Agent步驟序列與參考完全一致視為成功)或不嚴格匹配(允許多餘步驟只要核心步驟順序正確),以及Precision/Recall等指標來衡量 Agent所執行工具調用的相關性與遺漏率。透過雷達圖等可視化方式呈現多維軌跡指標,可以直觀展示 Agent在哪些方面表現出色、哪些方面有待加強。

當然,再完善的自動評估體系也無法替代人類的判斷。因此Human-in-the-loop(人類介入)機制在關鍵環節不可或缺。一方面,企業應鼓勵最終用戶(無論是員工還是客戶)對 Agent的輸出提供反饋,例如簡單的👍👎評價或意見表單。這些一線反饋能直接指出 Agent的實際效用,幫助找出「 Agent回答有用嗎?有沒有誤解需求?」等問題。反饋來源可以很廣:普通用戶、內部質檢員、領域專家,都可以參與對 Agent表現的評議**。另一方面,在高度專業或高風險的任務(如醫療診斷建議、投資決策輔助)中,人類專家應對 Agent的關鍵決策進行審核把關——這不僅是為了安全,也是為了不斷校準 Agent的評估模型**。例如,Google提到可用大型模型擔任“自動評審員”(autoraters)來打分 Agent答案,但最終仍需透過人類回饋來調整這些自動評審員的偏差。總之,人類的介入讓 Agent的評估閉環更加完整:人提供高層次判斷和價值觀考量,機器負責細節監測和速度,兩者結合才能確保AI Agent既高效又符合人類期望

  • 延伸資訊:*為了簡化 Agent的監控與調試,市場上出現了一些專門工具。例如 LangSmith(由LangChain團隊推出)提供了對 Agent決策過程的可視化追蹤,開發者可以直觀看到 Agent每一步行動及使用的Prompt,有助於診斷問題。另一些公司則採用「雙 Agent審核」機制:讓第二個 Agent監視第一個 Agent的行為,提供類似審計報告的記錄。更有前瞻性的企業開始建立AI治理委員會,定期審視AI Agent的KPI與失誤案例,確保 Agent決策遵循公司的倫理和合規要求。例如某些金融機構引入AI助手時,要求每月對 Agent的錯誤回答類型進行分析,並由風控團隊審核改進方案。這些舉措背後的共同理念是:將AI Agent視為新的「數位員工」,就必須建立類似對人類員工的監管與評估制度,以制度化的方式保障AI Agent為企業帶來正面價值。

五、從 AI 助理到虛擬承包商:企業如何設計責任、規格與資源配置機制

隨著AI Agent能力增強、參與任務日益關鍵,企業開始將其定位從單純助理升級為虛擬承包商(Contractor Agent)。所謂虛擬承包商,是指企業以類似外包合同的方式來約束和管理AI Agent:為每個 Agent分配明確的任務合同,規定目標、範圍、交付物和驗收標準,並建立反饋與責任機制。這種轉變源於一個現實需求——當我們希望AI自主執行複雜任務時,僅靠一段非正式的提示(prompt)描述往往不足以保證結果可靠。就好比和人類外包團隊合作,必須透過合同明確工作範疇和期望成果,對AI Agent也需要類似的正式規範來“畫下紅線”。

在這種框架下,企業設計AI任務時會制訂一份「 Agent合同」。首先,合同會詳述任務目標和成功判據:明確要求 Agent“做到什麼程度才算完成”,以及可衡量的驗收指標。例如,若讓AI市場分析師撰寫一份競品報告,合同中或許會規定報告需包含特定章節、覆蓋哪些競爭對手、數據來源需經核實,且文字表述符合公司風格指南等。這些就是交付物的規格定義,也是驗收時對照的依據。其次,合同界定任務範圍(Scope):界定 Agent應處理的內容,以及明確哪些不屬於本任務範圍。例如上例中,合同可聲明AI不需要分析公司財報(若那超出此次分析目的),以防 Agent把精力耗費在次要內容上。透過這種方式,企業將AI Agent的自主性限制在可控的邊界內,避免其“自由發揮”出錯。

另一個關鍵設計是資源配置與優先級機制。當企業內部多個AI Agent同時運行多份“合同”時,資源(如計算資源、API配額、數據訪問權限)該如何分配?為此,合同可以包含優先級欄位或 SLA(服務等級協議),明確該任務的重要性和所需資源等級。執行引擎需要根據這些合同設定,確保高優先級的 Agent獲得足夠算力並及時執行,而非關鍵任務的 Agent則在資源緊張時讓位。這類似企業在人力派遣上分輕重緩急,保證整體產能最佳化。此外,合同允許溝通與反饋也是必要環節。理想情況下,AI Agent收到任務合同後,能先進行“合同評審”,判斷自己是否完全理解要求、是否具備完成的能力。如有疑問, Agent可透過內部機制向任務發起人提出澄清或調整要求(類似合同談判)。這個Contract Iteration過程確保 Agent不會在誤解目標的情況下草率行動。同時,在任務進行中, Agent也可按合同規定的節點反饋進度或遇到的困難,讓人類負責人及時介入協助或修正合同內容。整套流程旨在引入人類管理AI的閉環,讓AI像承包商一樣對自己的合同負責、對結果品質負責,而企業則扮演監督與評估的角色。

值得一提的是,虛擬承包商模式還允許任務再分解:當一項合同任務過於龐大或複雜時,AI Agent可以依照預先制定的規則將其拆分成多個子合同,並調用其他輔助 Agent來完成。比如讓AI產品經理 Agent負責“設計一款新App概念”,它可能進一步生成「市場調研」「功能規劃」「財務預測」等子合同,指派給專門的市場分析 Agent、需求分析 Agent和財務 Agent分工完成,最後自己彙總結果。這種總承包商-分包商的AI協作模式,使得複雜項目也能在嚴格合同框架下由多智能體協同完成,且每個子任務都有明確定義和驗收標準。對企業來說,好處在於可管可控:每個AI Agent執行什麼、出了什麼結果、一目了然。如果成果未達合同標準,可以要求 Agent重試甚至更換 Agent,正如對待人類外包商那樣。在責任劃分上,企業也能更清晰地界定AI造成的失誤源自哪個子環節,方便追責和改進。

  • 延伸案例:Google 在 Agentspace 平台中引入了“ Agent合同”的概念,勾勒出未來企業應用AI的藍圖。據白皮書介紹,Agentspace 定義了完善的 Agent承包流程:從合同制定、分發給 Agent執行,到執行過程中的監控,再到結果驗收與回饋,形成閉環。這些實踐讓我們看到,未來的AI Agent將更深地嵌入企業流程,並以制度化的方式被管理。AI不再是任意發揮的黑盒,而是受合同約束的“數位承包商”,和人類員工一道協作,為企業創造價值且接受評價。這種轉變有望大幅提升AI應用的可靠性和透明度,同時也倒逼企業自身建立更成熟的AI治理體系。

六、實例分析:Google Agentspace、NotebookLM 與未來企業內部資訊網的重構可能

面對多 Agent系統帶來的可能性,Google亦提供了具體實踐範例——AgentspaceNotebookLM,展示企業內部資訊生態如何被AI重塑。Google Agentspace是Google Cloud推出的一套企業AI解決方案,它集成了企業搜索、對話 Agent和工作流程自動化等功能,目標是打造一個公司內部的AI資訊與助理平臺。傳統的企業知識管理系統往往存在內容分散、個性化不足、無法自動解答等局限,而Agentspace透過AI將各種分散的資料源(如文件、郵件、數據庫)整合在同一介面下,讓員工能以自然語言查詢並獲得條理清晰且有據可依的答案。更進一步,Agentspace還能驅動複雜的智能體工作流程:也就是說,員工不僅可以問它問題,還可以指派任務給它自主執行,比如自動生成週報初稿、根據客戶反饋自動整理Bug列表等。整個過程Agentspace都注重安全性與可信度:其架構基於Google Cloud安全設計,內建存取控制(RBAC)、VPC服務控制以及身分與存取管理(IAM)等機制,確保數據隨時受到保護並符合企業合規要求。對管理者而言,Agentspace提供監管儀表板來編排和監控多個AI Agent——哪些 Agent在運行、使用了哪些資料、遇到什麼問題,都一覽無遺。可以預見,伴隨這類平臺的普及,未來知識型員工將從“四處搜索資料”轉變為統一調度AI Agent來獲取資訊和完成任務,企業內部的資訊網路將更趨智能且以人為本。

另一個值得關注的產品是 NotebookLM(筆記本語言模型),它定位為研究和學習助手,本質上是一個讓AI幫助用戶閱讀和整理資料的平台。在企業環境中,員工經常面臨大量文件、報告需要研讀,NotebookLM企業版正是為此設計:使用者可以將各種來源的文件(例如PDF報告、會議記錄、網頁文章)上傳到NotebookLM工作空間,接著AI模型會解析這些文件,提取關鍵概念並生成摘要或筆記。用戶可以與NotebookLM對話,詢問文件中的細節、讓它解釋某段內容的涵義,甚至請它將多份文件的觀點串聯起來做比較分析。相當於一位專屬的研究助理,幫助知識工作者從繁瑣的資訊收集中解脫,直抵理解和決策。NotebookLM企業版在功能上更進一步:例如提供了AI生成的語音摘要,員工可以“聽”報告重點,加深對內容的掌握。同時它強調企業級的安全與隱私:所有資料處理都遵循公司安全政策,敏感資訊被嚴格保護,不會洩露。這使NotebookLM能夠融入企業日常工作流程,例如新品研究、競品情報分析、內部培訓等,成為知識管理體系中的重要一環。未來,我們可能會看到NotebookLM與Agentspace這類系統結合——前者作為員工的個人知識助理,後者作為全公司的智能資訊樞紐,共同構築新一代企業內部資訊網

綜合來看,Google Agentspace和NotebookLM預示著企業內網重構的巨大可能性。傳統內網往往是靜態的文件資料庫或FAQ列表,而未來內網將更像一個智慧交互門戶:員工提出任務或問題,背後是一整套AI Agent網絡在協同處理,從搜尋知識、分析整理到執行操作,最後將結果以自然易懂的形式呈現給員工。這不僅大幅提高資訊獲取效率,也改變了組織內知識流動的方式——知識不再孤立在部門文件夾裡,而是在AI的推動下實時流通並轉化為決策支持。企業可以依自身需求,定製一系列專屬AI Agent:如行銷洞察 Agent、法務合規 Agent、財務分析 Agent、工程知識庫 Agent等,讓各部門人員都有貼合工作背景的智能助手。這些 Agent甚至可以直接連接內部系統執行操作(在授權範圍內),真正把內網從資訊中心升級為動作中心。當然,這也要求企業IT架構更加開放且安全,可供AI存取各類資料與服務,同時對AI行為進行審計和約束。未來的企業內網重構,既是技術工程,也是組織變革:公司需要培養員工與AI協作的數位素養,制定AI使用準則與倫理規範,確保科技與制度建設同步。

  • 延伸案例:*目前已有先行者開始品嚐這種未來內網的甜頭。金融業巨頭摩根士丹利近期就打造了一款內部專用的GPT聊天機器人,供16,000多名財富管理顧問使用,以自然語言檢索公司內部龐大的知識庫。這款AI助理被形容為讓每位顧問都擁有“24小時待命的首席投資策略長”,能夠即問即答各種複雜的財務問題。透過深度整合內部文件與研究報告,它可以快速提取關鍵洞見並列出相關來源供進一步閱讀。例如,顧問只需詢問「某項理財服務的開戶步驟是什麼?」,AI便會從內網多個文件中整理出完整的步驟列表,甚至將說明轉換成客戶容易理解的語句,並附上原始資料的連結。結果是,顧問不必再花大量時間搜索和對比文件,就能在幾秒內獲取可靠答案,從而更快回應客戶需求。這一案例充分證明,對話式AI內網的價值是現實可行的:知識庫不再是冰冷的檔案,而成了有溫度的對話夥伴。隨著Google Agentspace、NotebookLM等技術的成熟,越來越多企業將重構自家內部資訊網,讓AI成為組織智慧的神經中樞,賦能每一位員工在對的時刻獲取對的知識並採取行動。

更多深度文章:

閱讀原文:


Keywords:

AI智能體、多代理系統、AgentOps、Agentic RAG、NotebookLM、Agentspace、虛擬承包商、企業內網、生成式AI、知識管理

Leave a Reply

Your email address will not be published. Required fields are marked *