柱 2:API 治理
本板块基于以下源:#19, #20, #21, #22, #23, #24, #25
一、核心观点
-
「API 成熟度决定 Agentic AI 成熟度」——这是 Deloitte「API Governance for Agentic AI」(2026 年 4 月)的核心论断。一个企业的 API maturity model 直接决定它能在多大尺度、多大速度上部署 Agent。API 不成熟的企业,Agent 永远只能在「demo」层级跑。出处:Deloitte, API governance for agentic AI[1]。
-
API 治理是 Agentic 时代的「重新发现」:Salesforce 直陈:「Security gaps, versioning issues, shadow assets, inconsistent onboarding — these are the same challenges that enterprise API programs spent years solving. The difference is that they’re now arriving at scale, on infrastructure that wasn’t designed for autonomous consumers, and at a pace that manual governance processes can’t match.」出处:Salesforce, MuleSoft Omni Gateway[2]。
-
「Gartner 2025 预测:< 50% 企业 API 会被管理」:API 增长速度已经超过 API 管理工具能跟上的程度。在 Agent 时代这一缺口被放大——Agent 每次推理可能调用 5-20 个 API,无治理的 API 在 Agent 链条里被放大成 5-20 倍的风险。出处:MuleSoft, 3 Best Practices for API Governance[3](引 Gartner)。
-
「Headless 360」与「Everything-as-an-API」:Salesforce 提出 Agent 时代企业必须做到 expose every platform capability as an API, CLI, or MCP tool。这一定位把企业能力的可消费性从「面向人」扩展到「面向 Agent」,是一种根本性架构转变。出处:Salesforce[2]。
-
API 管理的四大支柱仍然是 design / monitoring / documentation / security——但每个支柱在 Agent 时代都需要新增内容。Kong 列出 4 pillar 框架;现在需要叠加:design 加 LLM-friendly schema、monitoring 加 token 跟踪、documentation 加 MCP 描述、security 加 prompt injection 防护。出处:Kong, API Management Best Practices[4]。
-
「Three-Layer Architecture」(System / Process / Experience APIs)+ 事件驱动是 Deloitte 推荐的 agentic 友好 API 架构:System APIs 暴露原子能力;Process APIs 编排业务逻辑;Experience APIs 给 Agent / 应用消费。事件驱动(Event-Driven Architecture)是 Agent 异步协作的必要基础。出处:Deloitte, API Governance for Agentic AI[1]。
-
「Unified Catalog」打破点工具陷阱:单独的 AI Gateway、单独的 MCP Server、单独的 LLM Router 都是「solving one layer at a time」——「doesn’t solve a full-stack problem」(Salesforce)。企业需要一个统一 catalog + 一致策略层,覆盖 API / MCP / LLM / A2A 流量。出处:Salesforce[2]。
-
API 治理 ≠ 阻碍创新:MuleSoft 反复强调「How can we protect APIs without slowing down innovation?」——答案是把治理嵌入 CI/CD(automatic governance checks throughout the development lifecycle),用 governance ruleset 替代人工审核,预置 OWASP API Top 10 / OpenAPI Best Practices 等通用规则集。出处:MuleSoft, API Governance Best Practices[3]。
-
「Identity Propagation」是 agentic 时代 API 治理的关键新需求:传统 API 网关只验证调用方身份;agentic API 网关必须把「最终用户身份 + Agent 身份」一起传递(end-to-end identity),让被调用的下游系统能基于真实用户做权限判断。出处:Salesforce[2]、OpenID Identity Whitepaper[5](详见柱 4)。
-
「Gravitee / Kong / Apigee 三足鼎立 + AI Gateway 新赛道」:传统 API 网关厂商(Apigee / Kong / MuleSoft / Gravitee)都在 2025-2026 推出 AI Gateway 能力(LLM proxy、token tracking、prompt safety);同时新生 AI Gateway(Portkey、Helicone、LiteLLM)正在抢市场。出处:Gravitee, API Governance for AI[6](#25)。
二、重要性综述
如果说数据治理是 Agent 的「认知材料」,API 治理就是 Agent 的「行动通路」。Agent 的价值来自能 take action——发起转账、修改订单、触发审批、写入 CRM——而这些 action 全都通过 API(或 MCP 包装的 API)发生。API 治理失效 = Agent 治理失效,没有例外。
Deloitte 把这层逻辑讲得最清楚。在「API Governance for Agentic AI」一文中,Deloitte 明确提出「Why is API maturity necessary?」和「How API maturity accelerates agentic AI」两个关键命题:
-
没有规范化的 API 描述(OpenAPI / AsyncAPI / GraphQL schema),Agent 无法可靠发现和调用能力;
-
没有统一的版本管理,Agent 升级一次模型就可能调坏一个业务流程;
-
没有 enterprise data model,Agent 在不同 API 间需要做大量数据格式转换,错误率指数上升;
-
没有 event-driven 架构,多 Agent 协作只能轮询,性能崩塌。
「Three-layer architecture」(System / Process / Experience APIs)+「Event-Driven Architecture」是 Deloitte 推荐的 agentic 友好 API 基线(Deloitte[1])。这套架构与传统 SOA 看似相似,但关键差异在:在 Agent 时代,Process API 必须显式建模业务事件、状态机、补偿逻辑,让 Agent 能在失败后回滚;Experience API 必须既能被 UI 消费也能被 Agent 消费,这意味着每个 endpoint 都要有 MCP-compatible 描述。
Salesforce「The defining infrastructure shift of the agentic era」论断值得反复引用:「your AI program is probably further along than your governance is; companies are building AI agents faster than they can govern them. According to S&P Global, 42% of companies abandon them before they even reach production.」42% 的 PoC 死亡率说明 API 治理不足以前是「迟早要解决的问题」,现在变成了「不解决就死」的问题(Salesforce[2])。
API 治理在 agentic 时代的核心扩展点有 5 个:
-
MCP Conversion:把已有 OpenAPI / SOAP / GraphQL 接口自动包装成 MCP server,让 Agent 能像调用 tool 一样调用业务能力。MuleSoft Omni Gateway 把这做成产品:「years of OpenAPI (REST) into governed, agent-ready tools in minutes, with authentication and compliance controls inherited automatically」。
-
Token Economy & LLM Routing:API Gateway 升级成 AI Gateway,能跟踪每个 Agent / 每个用户 / 每个用例的 token 消耗,能按 latency / cost / capability 智能路由到不同 LLM。
-
Prompt Safety & Content Guardrails:在 API 调用层做 input/output 内容过滤(PII 检测、Jailbreak 检测、有害内容过滤),不让坏 prompt 进 LLM、不让敏感输出出 LLM。
-
Correlation IDs / End-to-End Tracing:Salesforce 强调「correlation IDs across every interaction in an agent chain, making the full audit trail available before something goes wrong rather than after」。
-
Federated Governance:大型企业有多个 gateway(前端、后端、SaaS 内置、第三方),需要一个 federated control plane 把策略一次定义、多处执行,不强制替换既有网关。
Kong 的四支柱——design / monitoring / documentation / security——仍然适用,但每个支柱内涵被扩展(Kong[4]):
-
Design:LLM-friendly schema(明确的字段命名、稳定的响应格式、机器可读的错误码);
-
Monitoring:token 跟踪 + Agent-level usage analytics + 异常调用模式检测;
-
Documentation:OpenAPI + AsyncAPI + MCP descriptors,被 Agent 实时消费而非给开发者读;
-
Security:传统 AuthN/AuthZ + Agent identity +
prompt injection 检测 + rate limiting per agent。
三、方案利弊
方案 A:传统 API 网关纵深升级(MuleSoft / Apigee / Kong / IBM API Connect)
-
概述:在已有 API 管理产品上叠加 AI Gateway 模块(LLM proxy、MCP 支持、token tracking)。
-
适用场景:已经在用 vendor API 网关、有 API 治理团队的大企业。
-
优势:继承已有 IAM/audit/observability 集成;学习曲线最低;vendor 支持成熟。
-
劣势:AI Gateway 能力相对新生,可能不如专门 AI Gateway 灵活;vendor 锁定加深。
方案 B:专门 AI Gateway(Portkey / Helicone / LiteLLM / Cloudflare AI Gateway)
-
概述:专为 LLM/Agent traffic 设计的新一代 Gateway,强调 token 经济、模型路由、prompt 治理。
-
适用场景:技术驱动型企业,用例集中在 LLM API;初创和中型企业。
-
优势:上线快、功能精;定价对中等规模友好。
-
劣势:与企业级 IAM / SIEM / ITSM 集成有限;缺乏完整 API 生命周期管理;存在被传统厂商收购或反超的风险。
-
出处:Galileo, Best LLMOps Platforms[7](#26)讨论了这条赛道的厂商。
方案 C:「Universal API Management + Federated Governance」(MuleSoft Omni Gateway 路线)
-
概述:在多 vendor 网关之上加一层 federated control plane,统一策略、统一 catalog、统一可见性。
-
适用场景:年营收 500 亿美元 +、有多个 gateway 历史遗留的大型集团;并购多。
-
优势:不替换、加一层;避免 multi-year 网关迁移项目;可平滑演进。
-
劣势:control plane 本身有 vendor 选择风险;策略表达力可能不及单一原生网关。
-
出处:Salesforce MuleSoft Omni Gateway[2]。
方案 D:自建 API Gateway + Open Source Service Mesh
-
概述:基于 Envoy / Istio / Kuma 等开源组件自建网关,自定义 AI 治理逻辑。
-
适用场景:超大规模科技公司、强自研文化、数据主权要求。
-
优势:完全可控、无 vendor 锁定;可深度定制。
-
劣势:工程投入巨大;运维负担重;需要持续跟进 MCP/A2A 标准演进。
-
出处:参见 InfoQ 和 BCG 关于「Platform thinking」的讨论。
选型建议
埃森哲典型客户的 API 治理蓝图:短期 1 年用方案 A(现有网关 + AI 模块);中期 2-3 年用方案 C(Federated Governance);长期目标态是 C+B 混合(统一 control plane + 多 vendor data plane)。方案 D 仅适合 < 10 个 vendor 锁定担忧极重的客户。
四、风险
-
「点工具陷阱」:单独买 AI Gateway、单独买 MCP server、单独买 LLM router,结果三套策略、三套审计、三处 token 跟踪,无法回答「我的 Agent 整体合规吗?」。Salesforce 直接点名这是 buyer 最大的误判。对策:选 federated 策略平面或 universal gateway。出处:Salesforce[2]。
-
「MCP Wrapping 过快」:把所有 OpenAPI 都自动转换成 MCP server,结果 Agent 看到 500 个 tool,无法在合理时间内选择对的 tool(context overflow + tool selection accuracy 下降)。对策:先分类、按业务域聚合 tool,再选择性 MCP 化。出处:BCG, Building Effective Enterprise Agents[8]。
-
API 描述质量不足:Agent 调用 API 时严重依赖 description / parameter docstring 来选 tool 和构造参数。文档不全 = Agent 选错 tool / 传错参数。对策:用 AI lint 工具自动检测 OpenAPI 描述完整度;把「描述完整度」做成 API 上架准入门槛。出处:MuleSoft[3]。
-
Token 失控:没有 per-agent token 配额,单个失控 Agent 一晚上烧光月度预算。Galileo 引 S&P Global:42% 企业放弃 AI 项目,token 失控是重要原因。对策:default per-agent / per-use-case token quota;异常 spike 自动熔断。出处:Galileo[7]。
-
Shadow MCP Server:开发者自建 MCP server 不走中央治理,部署到生产环境暴露内部 API。对策:MCP server 上架强制注册;Mesh/Gateway 默认 deny unknown MCP endpoints。出处:CSA, MCP Security[9](参见柱 4 详述)。
-
Identity 丢失:Agent 调用下游 API 时只传 Agent 自己的 service account,丢失了「最终用户是谁」,导致下游系统按 Agent 的最大权限执行,违反最小权限原则。对策:implement OAuth 2.1 on-behalf-of flow + token exchange,强制传播 end-user identity。出处:OpenID Whitepaper[5]、Salesforce[2]。
五、适用场景
优先重投 API 治理:
-
年营收 100 亿美元 +、API 数量 > 500 的企业;
-
已经在做数字化转型但 API 治理停留在静态 catalog 阶段的企业;
-
监管行业(金融、医疗、能源)。
可分阶段投入:
-
中型企业(10-100 亿):先选一个 vendor 网关 + AI 模块,2 年后再考虑 federated;
-
API 数量 < 200 的企业:先做 OpenAPI 完整度治理,再上 AI Gateway。
可暂缓:
-
API 数量 < 50、Agent 用例 < 3:用代码层 SDK 治理即可;
-
完全 SaaS-only 的小企业:依靠 vendor 内置网关。
六、最佳实践案例
案例 1:Salesforce MuleSoft Omni Gateway GA(2026 年 5 月)
客户场景:管理混合网关环境的 platform team(既有 MuleSoft、又有 Apigee、还有 Kong)。 关键能力:
-
「one enforcement layer across all of it — policies applied once, consistently, regardless of which underlying gateway is handling the traffic」;
-
「No parallel governance stacks, no manual reconciliation across vendors」;
-
AI Architect 不再需要做「custom integration」——既有 API 几分钟变成 governed, agent-ready tool;
-
Token usage、model routing、unified LLM access 在 shared policy layer。
意义:MuleSoft 把「Universal API Management」概念从理念变成产品;可作为埃森哲在大型客户的标杆参考。 出处:Salesforce, MuleSoft Omni Gateway[2]。
案例 2:MuleSoft 内部用 Anypoint API Governance + Catalog CLI
做法:Pre-built rulesets(Anypoint API Best Practices、OpenAPI Best Practices、OWASP API Security Top 10、Authentication Security Best Practices);governance check 嵌入 CI/CD;不符合规范的 API 上架被自动 block。 意义:把「治理 vs 创新」张力变成「自动化治理 → 加速创新」。 出处:MuleSoft, API Governance Best Practices[3]。
案例 3:Deloitte API Maturity Model
框架要点:
-
API 成熟度阶段:Ad-hoc → Reactive → Managed → Productized → Agentic-Ready;
-
Three-Layer Architecture:System / Process / Experience;
-
EDA:Event-Driven Architecture 是 agentic 时代 API 的必要基础设施;
-
Enterprise Data Models:跨 API 共享的标准化数据模型是 AI 训练和 Agent 推理的关键。
应用:埃森哲做客户 AI Readiness Assessment 时可直接复用此评估维度。 出处:Deloitte, API Governance for Agentic AI[1]。
案例 4:Kong API 管理四支柱实践
框架:Design / Monitoring / Documentation / Security;每支柱在 agentic 时代延展。 已知客户:金融、电信、零售大型客户(Kong 客户名册)。 关键实践:rate limiting per consumer、developer portal、OpenAPI documentation 自动生成、JWT/OAuth2 集成。 出处:Kong, API Management Best Practices for 2025[4]。
案例 5:Gravitee AI Governance for Agentic Era
关键能力:原生支持 LLM 流量治理、token quotas、AI policy enforcement、与 OpenAI/Anthropic/Azure OpenAI 等模型对接的 governed proxy。 适用客户:中等规模欧洲客户、强 GDPR 合规。 出处:Gravitee, API Governance for AI[6]。
案例 6:Medium Vedcraft「Agentic Gateway」概念
核心思想:AI Agent 时代的 Gateway 必须同时管 API / MCP / LLM / A2A 四类流量;标准 API Gateway 只管 API 是不够的。 出处:Medium Vedcraft, The Agentic Gateway[10]。
下一节:柱 3:LLMOps / AgentOps
参考文献
1. Deloitte, API governance for agentic AI
2. Salesforce, MuleSoft Omni Gateway
3. MuleSoft, 3 Best Practices for API Governance
4. Kong, API Management Best Practices
6. Gravitee, API Governance for AI
7. Galileo, Best LLMOps Platforms