通过 AI 延伸人类智能：微软研究院用胡塞尔现象学重新定位 AI——它强大不是因为复制了人类智能，而是因为预设并延伸了沉淀在人类认知与语言中的结构

Extending Human Intelligence Through AI

Ken Archer & Harald Wiltsche (Microsoft Research) Ken Archer 为微软负责任 AI（Responsible AI）团队的组产品经理（Group Product Manager）；Harald Wiltsche 为林雪平大学（Linköping University）教授。本文为微软研究院博客对二人合著论文《The Origins of Artificial Intelligence in Natural Intelligence》（人工智能在自然智能中的起源）的官方科普版改写 · 发布于 2026-05-28 · 收录于 2026-06-02

🔗 阅读英文原文

🎧 AUDIO 听一段语音版日报

0:0019:41

📌 一句话核心

微软研究院借胡塞尔现象学重定位 AI：它不是复制人类智能，而是延伸沉淀在人类语言与认知中的结构。LLM 因此能生成连贯回应，也会因缺乏对世界的活生生介入而幻觉；AI 安全的责任仍在人类构建者。

💡 核心观点

核心命题：AI 不是复制人类智能，而是『预设』并延伸它。现代 AI 系统之所以强大，不是因为它们 replicate 了人类智能，而是因为它们 presuppose 了人类智能——通过延伸那些已经存在于人类认知与语言中的结构。这个视角同时解释了 AI 『令人惊叹的能力』与『反复出现的边界』，并为构建可信 AI 提供了一条更踏实的路径。
从一个矛盾现象出发。AI 能写文章、生成代码、总结复杂概念、流畅对话，却仍在人类觉得直觉的任务上挣扎：可靠追踪物体穿越变化、在陌生情境中做组合性推理、区分真相与貌似可信的虚构。这些矛盾催生了两极化争论——一派视其为人类式智能的早期形态，另一派斥为『高级版自动补全』（sophisticated autocomplete）。
胡塞尔现象学提供的第三条路。作者借助 Edmund Husserl 的现象学（以及 The Blind Spot、The Abstraction Fallacy 等跨学科工作）转换问题：不问『AI 是否正变得像人一样智能』，而问『AI 为什么有效——是否因为它依赖于那些根植于人类认知的结构』。核心概念是：语言本身已包含人类理解的『沉淀结构』（sedimented structures），AI 学会建模并延伸它们。
感知不是被动接收，语言是稳定结构的表达。人类把世界体验为穿越变化而保持稳定的事物——一只杯子在我们绕它走动时仍是同一只杯子，一段旋律即使单个音符逐个消逸仍可辨识。『red』『round』『larger than』等词语描述的是起源于生活体验的关系。语言由此把这些稳定结构表达为概念形式。
为什么会幻觉：人类对世界负责，AI 只对文本负责。大语言模型学习的是这个语言世界内部的统计关系——捕捉概念在庞大人类著述中如何关联，这解释了它为何能跨领域产生连贯回应；但也解释了它为何幻觉。人类始终『对世界负责』（answerable to the world），体验不断校正预期与信念；AI 则只是在文本内部延伸模式，可以极其流畅地接续推理，却缺乏锚定意义与真相的『对世界的活生生介入』。
『组合性鸿沟』是结构性边界而非工程局限。语言模型在熟悉推理模式上表现好、在被要求以真正新颖方式组合概念时失败。研究越来越表明：更大的模型在『流畅度与事实召回』上的提升，远快于『真正组合性推理』的提升。作者认为这是结构性边界：AI 能延伸已沉淀在语言中的模式，却不具备让人类生成真正新概念关系的『面向世界的理解』。
多模态系统的脆弱同源。结合语言与视觉的系统往往能给图像正确打标签，却无法对物体及其部件做稳健推理。原因是它们学的是『视觉模式与语言之间的相关性』，而不是像人类那样感知穿越时间展开的稳定物体。结果是『看似流畅却在熟悉模式之外脆弱』的系统。
重构 AI 安全：两极都误解了现状。公众讨论在『流氓超级智能』与『AI 几乎无风险』两极之间摆动。作者认为两者都误解了当前系统的本质：最迫近的风险不是因为 AI 拥有类人意图，而是因为它能在『缺乏对世界的反思性责任』下延伸推理模式——生成有说服力却无根据的输出、规模化自动执行有缺陷的决策、或在治理不善的环境中执行有害行动。
从『模型安全』转向『系统安全』，harnesses 是架构根本特征。这解释了为何 AI 安全正从 model safety 转向 system safety。企业已依赖分层防护（业界称为 harnesses）来约束、验证、监控 AI 行为。论文主张这不是临时补丁，而是反映了 AI 架构的根本特征：可信行为来自构建者承担责任，这份责任『无法委托给模型、也无法与模型分担』。
与企业可信 AI 部署的趋势高度一致。作者明确指出，这一解释与企业越来越采取的可信 AI 部署方式紧密对齐：组织需要『能延伸人类智能、同时保持可治理、可审计、与人类监督对齐』的系统。把 AI 理解为『派生式智能』（derived form of intelligence），清晰地解释了为何分层治理、评估与运营控制如此重要。
现象学不只是批评，更是理解 AI 承诺的框架。作者认为，AI 系统揭示了关于人类认知本身的深刻东西：意义可以被形式化、被延伸、被以强大的新方式规模化。AI 的核心社会风险反而是『踢掉它起源于人类经验与认知的梯子』——把 AI 误解为贬低人性的对手智能，反过来也贬低了 AI 本身的真正承诺。
最终落点：同时承认两个真相。问题不是 AI 是否会替代人类智能，而是我们如何负责任地构建『延伸人类理解、同时保持植根于世界』的系统。若把 AI 误作自主心灵，会过度信任；若贬为无足轻重的把戏，会错过这个时代最重要的技术发展之一。更踏实的解读是：AI 是人类智能的真正延伸——正因如此，人类仍须对它如何被理解、治理和使用负责。

🎯 启示与思考

## 一、为什么这篇「哲学味很重」的文章值得给客户高管看这篇文章表面是微软研究院的一篇现象学科普，骨子里却是一份极其精炼的「AI 认识论 + 治理论」立场声明，且出自微软负责任 AI 团队（Ken Archer 是 Responsible AI 的组产品经理）。它的价值不在于教高管什么是胡塞尔，而在于它提供了一套**不滑向两极的、可对客户复述的 AI 心智模型**——这恰恰是当前企业 AI 转型沟通中最稀缺的东西。注：以下为基于原文向咨询场景的推论延展，属于我的判断，已与原文论点区分。当前给客户做 AI 战略时，最大的认知障碍往往不是技术细节，而是高管心里那个未明说的「AI 到底是什么」的隐含模型。这个隐含模型通常落在两极：要么是「它快变成天网了」（恐惧、不敢动），要么是「不就是个高级搜索/自动补全」（轻视、不愿投）。这篇文章给的第三条路——**AI 是人类智能的『延伸』而非『替代』或『把戏』**——正好是把客户从两极拉回中间、让他们愿意理性投入的认知锚点。 ## 二、「AI 延伸而非复制人类智能」直接服务于 Copilot 的定位叙事文章的核心命题——AI 强大是因为它「预设并延伸」了沉淀在人类语言中的结构——几乎是微软 Copilot 产品哲学的学术背书。注：以下为推论延展。 Copilot 这个名字本身就是「副驾」而非「自动驾驶」，强调的就是「延伸人类、人类仍在驾驶位」。这篇 MSR 文章给了这个定位一个深层的、非营销话术的理论依据： - 给客户讲 M365 Copilot 时，可以引用「AI 延伸的是已沉淀在人类语言/文档中的理解」来解释**为什么 Copilot 在有企业自身语料（邮件、文档、知识库）时才真正强大**——因为它延伸的正是组织自己沉淀下来的结构。这把「为什么要接入 Graph / 企业数据」从技术必要性升级成了认识论必然性。 - 给客户讲 Copilot Studio 自建 agent 时，「沉淀结构」概念支撑了「先把领域知识结构化、再让 agent 延伸」的方法论——而不是指望模型凭空『懂』业务。 ## 三、「幻觉是结构性边界」对受监管行业客户的治理含义文章把幻觉和组合性鸿沟解释为**结构性边界而非可被工程消除的 bug**，这一点对生命科学、金融等受监管行业客户极其重要。注：以下为推论延展。很多客户（尤其合规驱动的）抱着「等模型再迭代两版幻觉就没了」的幻想推迟落地。这篇文章给了一个权威反驳：幻觉源于「AI 只对文本负责、不对世界负责」的根本架构，**不会因为模型变大而消失**——更大的模型只是更流畅、更难被察觉地出错。这对客户的实际含义是： - 不要把治理寄望于「等更好的模型」，而要**现在就把『验证』『溯源』『人类背书』工程化进流程**。 - 这正好对接 Azure AI Foundry 的内容安全 / 评估（evaluation）能力、以及 Copilot 的引用追溯（citation）能力——把「AI 只对文本负责」这个结构性缺陷，用「系统层防护」补上。 ## 四、「从模型安全到系统安全 / harnesses」是埃森哲最该抢的服务化机会文章最具操作性的论点是：AI 安全正从 model safety 转向 system safety，组织依赖分层防护（harnesses）来约束、验证、监控 AI 行为；而且**可信行为来自构建者承担责任，无法委托给模型**。注：以下为推论延展。这句话几乎是为咨询/集成商量身定做的商业机会，因为它明确说了「责任在构建系统的人这边，不在模型供应商那边」——也就是说，**客户买了 Azure OpenAI / Copilot 不等于买到了可信**，中间这层「harness 工程 + 治理」正是埃森哲这类公司可以服务化交付的： 1. **Harness 工程包**：围绕客户的 Azure AI 工作负载，设计约束层（输入/输出过滤、工具调用白名单）、验证层（自动评估、人审环节）、监控层（遥测、异常检测）。这是可标准化、可复用的交付资产。 2. **AI 责任边界界定服务**：帮客户厘清「哪些责任无法委托给模型、必须由组织自己的流程承担」——这对 MD 层面与客户 CRO/CIO 对话极有分量，因为它把 AI 治理从「技术配置」抬升到「企业责任架构」。 3. **与本文姊妹篇（Jack Clark《探索未来》中的『验证层 / verification layer』概念）形成闭环**：两篇文章从不同角度（一个哲学认识论、一个产业实践）都指向同一结论——人类的核心新角色是「验证 AI 产出、为其运营风险定价」。可作为客户 talent & org transformation 论述的双重理论支撑。 ## 五、给客户沟通的「认知校准」话术资产注：以下为我的判断。这篇文章最适合被提炼成给客户董事会的一页纸「AI 心智模型校准」： - **不要把 AI 当对手智能**（会让你恐惧到不敢动，且会贬低人类自身价值）； - **也不要把 AI 当无足轻重的把戏**（会让你错过时代级机会）； - **正确姿势：把 AI 当作人类智能的延伸**——因此（a）它在有你自己的数据/知识沉淀时才最强，（b）幻觉是结构性的、必须靠系统层治理而非等待模型变好，（c）责任永远在你（构建与使用方）这边，不能甩给模型供应商。这套话术的好处是：它既给了客户投入的理由（AI 是真正的延伸、值得认真做），又给了客户落地的纪律（必须配套治理、责任自负），避免了「要么躺平要么盲目 all-in」两个失败模式。对零售快消、奢侈品（L'Oréal、LVMH 类）这种品牌责任极重的客户，「AI 产出的责任在你」这一点尤其能引起共鸣——他们绝不能接受「品牌发声出了问题、却把锅甩给模型」。 ## 六、与本期另一篇的互文本期同时精读了 Jack Clark 的《与未来和解》。两篇放在一起有强烈互文：Clark 从产业一线观察到人类正迁移到「验证层」，这篇 MSR 文章从认识论层面解释了**为什么必然如此**——因为 AI 结构上只对文本负责、不对世界负责，所以「对世界负责」这件事永远只能由人来做。一个是「正在发生的事实」，一个是「为什么必然如此的原理」。给客户做 AI 时代组织设计，这两篇可以一前一后用：先用 Clark 让客户相信趋势真实，再用这篇让客户理解趋势背后不可逆的结构性原因。

📜 中文解读

一、一个矛盾现象：流畅却脆弱

今天的 AI 系统能写文章、生成代码、总结复杂思想，并以惊人的流畅度对话。然而同样这些系统仍在人类觉得直觉的任务上挣扎：可靠地追踪物体穿越变化、在陌生情境中做组合性推理、把真相与貌似可信的虚构区分开。

这些矛盾催生了两极化的 AI 争论。一派把当前系统看作人类式智能的早期形态；另一派斥之为高级版自动补全（sophisticated autocomplete）。

近期一系列跨学科工作——包括 Adam Frank、Marcelo Gleiser 与 Evan Thompson 的《The Blind Spot》，以及 DeepMind 研究者 Alexander Lerchner 的《The Abstraction Fallacy》——正浮现出一幅不同的图景。它们不再问「AI 系统是否正在以人类的意义变得智能」，而是问一个更基本的问题：如果 AI 系统之所以有效，是因为它们依赖那些根植于人类认知的结构呢？ 这一视角转变借鉴了 Edmund Husserl（胡塞尔）的现象学，有助于理解现代 AI 的能力与局限。

二、核心论点：AI 延伸的是沉淀在语言中的人类理解

在论文《The Origins of Artificial Intelligence in Natural Intelligence》（人工智能在自然智能中的起源）里，作者主张：现代 AI 系统最好既不被理解为人类心灵、也不被理解为无足轻重的统计把戏，而是延伸了起源于人类认知本身的结构。

进一步借助胡塞尔现象学，论文提出：语言已经包含了人类理解的『沉淀结构』（sedimented structures）——AI 系统学会建模并延伸这些结构。 这一视角同时解释了当代 AI 的能力与边界。

感知不是被动接收

人类感知不是简单地被动接收感官数据。我们把世界体验为穿越变化而展开的稳定事物：一只杯子在我们绕它走动时仍是同一只杯子；一段旋律即使单个音符逐个消逝仍可被辨认。语言通过把这些稳定结构表达为概念形式而涌现——「红」「圆」「大于」这些词，articulate（清晰表达）的是起源于生活体验的关系。

为什么 AI 能流畅，也为什么会幻觉

大语言模型学习的是这个语言世界内部的统计关系。它们捕捉概念在庞大人类著述中如何相互关联，这解释了 AI 系统为何能跨众多领域产生连贯回应。

但这也解释了它们为何会幻觉。人类始终对世界负责（answerable to the world）：体验持续校正我们的预期与信念。 AI 系统则相反——它们延伸的是文本本身内部的模式。它们能以惊人的流畅度接续一条推理线，却缺乏那种锚定意义与真相的、对世界的活生生的介入（lived engagement with the world）。

三、框架解释了 AI 研究中反复出现的难题

组合性鸿沟（compositionality gap）

这一框架帮助解释了 AI 研究中几个反复出现的挑战。其一是「组合性鸿沟」——语言模型倾向于在熟悉的推理模式上表现良好，却在被要求以真正新颖的方式组合概念时失败。研究越来越多地表明：更大的模型在提升流畅度与事实召回上，远快于提升真正的组合性推理。

在作者看来，这不只是工程局限，而是结构性边界：AI 系统能延伸已经沉淀在语言中的模式，却不具备那种让人类生成真正新概念关系的、面向世界的理解。

多模态系统的脆弱

类似的模式出现在结合语言与视觉的多模态系统中。这些系统往往能正确给图像打标签，却仍在对物体及其部件做稳健推理时失败。它们学到的是视觉模式与语言之间的相关性，而不是像人类那样感知穿越时间展开的稳定物体。结果是一些「看起来令人印象深刻地流畅、却在熟悉模式之外出奇地脆弱」的系统。

四、重构 AI 安全：从模型安全到系统安全

这一视角也重新框定了关于 AI 安全的争论。公众讨论常在「流氓超级智能」的恐惧与「AI 几乎不构成有意义风险」的论断之间摆动。作者的研究表明，两个极端都误解了当前系统的本质。

最迫近的风险，不是因为 AI 拥有类人意图，而是因为它能在缺乏对世界的反思性责任（reflective responsibility to the world）的情况下延伸推理模式。 系统可能生成有说服力却无根据的输出、规模化地自动执行有缺陷的决策、或在治理不善的环境中被嵌入并执行有害行动。

这解释了为什么 AI 安全正日益从「模型安全」转向「系统安全」。实践中，组织已经依赖分层防护——业界越来越称之为「harnesses」——来约束、验证、监控 AI 行为。作者的论文主张：这些机制不是临时补丁，而是反映了 AI 架构本身的某种根本特征——可信行为来自 AI 系统构建者对其行为承担责任，这份责任无法委托给模型、也无法与模型分担。

与企业可信 AI 部署的对齐

作者明确指出，这一解读与企业越来越多采取的可信 AI 部署方式紧密对齐。组织需要的系统，是那种既能延伸人类智能、又保持可治理、可审计、与人类监督对齐的系统。把 AI 理解为一种『派生式智能』（derived form of intelligence），清晰地解释了为何分层治理、评估与运营控制如此重要。

五、展望：现象学不只是批判，更是理解 AI 承诺的框架

作者认为，现象学提供的不只是对 AI 的批判，更是一个理解 AI 承诺的框架。AI 系统揭示了关于人类认知本身的某种深刻之物：意义可以被形式化、被延伸、被以强大的新方式规模化。

由此，AI 的核心社会风险反而是「踢掉它起源于人类经验与认知的那把梯子」（kicking away the ladder of its origins）——把 AI 误解为一种贬低我们人性的对手智能，反过来也就贬低了 AI 本身的真正承诺。

于是问题不在于 AI 是否会替代人类智能，而在于：我们如何负责任地构建『延伸人类理解、同时保持植根于那份理解所由生的世界』的系统？ 若把 AI 系统误作自主心灵，我们冒着过度信任它们的风险；若贬之为无足轻重的把戏，我们冒着错过这个时代最重要技术发展之一的风险。

一种更踏实的解读同时承认两个真相：AI 是人类智能的真正延伸——也正因如此，人类仍对它如何被理解、治理和使用负责。

💎 金句精选

"Modern AI systems are powerful not because they replicate human intelligence, but because they presuppose it, by extending structures already present in human cognition and language."

「现代 AI 系统之所以强大，不是因为它们复制了人类智能，而是因为它们预设了人类智能——通过延伸那些已经存在于人类认知与语言中的结构。」

"What if AI systems work because they rely on structures that are rooted in human cognition?"

「如果 AI 系统之所以有效，是因为它们依赖那些根植于人类认知的结构呢？」

"Language already contains sedimented structures of human understanding—structures that AI systems learn to model and extend."

「语言已经包含了人类理解的『沉淀结构』——AI 系统学会建模并延伸这些结构。」

"Humans remain answerable to the world: experience continually corrects our expectations and beliefs. AI systems, by contrast, extend patterns within text itself."

「人类始终对世界负责：体验持续校正我们的预期与信念。AI 系统则相反——它们延伸的是文本本身内部的模式。」

"AI systems can extend patterns already sedimented in language, but they do not possess the world-directed understanding that allows humans to generate genuinely new conceptual relations."

「AI 系统能延伸已经沉淀在语言中的模式，却不具备那种让人类生成真正新概念关系的、面向世界的理解。」

"The most immediate risks arise not because AI possesses human-like intentions, but because it can extend patterns of reasoning without reflective responsibility to the world."

「最迫近的风险，不是因为 AI 拥有类人意图，而是因为它能在缺乏对世界的反思性责任的情况下延伸推理模式。」

"Trustworthy behavior emerges from the work of builders of AI systems responsible for their behavior, a responsibility that cannot be delegated to or shared with models."

「可信行为来自 AI 系统构建者对其行为承担责任，这份责任无法委托给模型、也无法与模型分担。」

"The central societal risk of AI thus turns out to be kicking away the ladder of its origins in human experience and cognition."

「由此，AI 的核心社会风险反而是『踢掉它起源于人类经验与认知的那把梯子』。」

"AI is a genuine extension of human intelligence—and precisely because of that, humans remain responsible for how it is understood, governed, and used."

「AI 是人类智能的真正延伸——也正因如此，人类仍对它如何被理解、治理和使用负责。」

#AI #微软研究院 #现象学 #胡塞尔 #幻觉 #组合性 #AI安全 #负责任AI #可信AI #AI治理

← 返回精读列表

阅读英文原文 →