aidigest.club
← 返回精读 DEEP READ

当 AI 构建自己:Anthropic 递归自我改进长文精读

When AI builds itself

Marina Favaro and Jack Clark Anthropic Institute 作者;Jack Clark 为 Anthropic 联合创始人,Marina Favaro 为 Anthropic Institute 研究作者 · 发布于 2026-06-06 · 收录于 2026-06-06
🎧 AUDIO 听一段语音版日报
0:0022:30

📌 一句话核心

Anthropic 用公开 benchmark 与内部未披露数据说明:AI 已在加速 AI 研发本身。Claude 贡献超过 80% 合入代码、工程师代码产出提升 8 倍,研究执行能力快速接近自动化;真正瓶颈正在从“做事”转向“判断、验证与治理”。

💡 核心观点

  1. 核心命题:AI 正在进入“构建自身”的前夜:文章不是说递归自我改进已经发生,而是给出一个连续谱:从早期人类写代码,到聊天机器人辅助,再到 coding agents 写改整文件,今天的 autonomous agents 能运行代码、委派数小时工作;如果趋势继续且算力足够,未来 AI 系统可能自主设计、开发自己的后继版本。Anthropic 明确说“not there yet”“not inevitable”,但警告它可能比多数机构准备得更早到来。
  2. 外部 benchmark 显示能力时间跨度正在加速延长:METR 测得 AI 可可靠完成任务的时长约每 4 个月翻倍,快于此前约 7 个月翻倍趋势:2024 年 3 月 Claude Opus 3 能做约 4 分钟人类任务;一年后 Claude Sonnet 3.7 可做约 1.5 小时任务;再一年后 Claude Opus 4.6 可做 12 小时任务。如果趋势保持,今年熟练人员数天级任务可能进入模型范围,2027 年可能触达数周级任务。
  3. Anthropic 内部工程数据是全文最硬证据:截至 2026 年 5 月,Anthropic 合入代码中超过 80% 由 Claude 编写;Claude Code 2025 年 2 月 research preview 前该比例仍是低个位数。2026 年第二季度,典型工程师每日合入代码量达到 2024 年的 8 倍。Anthropic 也承认 lines of code 会高估真实生产力,但它仍显示工程流程出现显著加速。
  4. 质量差距正在收窄,review 成为新瓶颈:Claude 在最开放任务上的成功率 2026 年 5 月达到 76%,六个月提升 50 个百分点;Anthropic 内部许多人认为 Claude 代码质量在 2025 年末仍低于人类、如今已大致持平,并预期年内可能超过。更关键的是,Anthropic 已用自动 Claude reviewer 预审代码,回溯分析显示它本可在生产前抓住约三分之一导致 claude.ai 事故的 bug。
  5. 研究执行已经从“有帮助”跃迁到“超人”区间:在固定目标、固定正确性检查的小型训练优化任务中,Claude Opus 4 在 2025 年 5 月平均约 3 倍加速;到 2026 年 4 月 Claude Mythos Preview 达到约 52 倍。校准点是:熟练人类研究员通常需 4-8 小时达到约 4 倍。Anthropic 强调绝对倍数不能当真实训练加速读,但同一实验设置下的跨模型提升非常清晰。
  6. 开放式研究仍未完全交给 AI,但边界在推进:Anthropic 2026 年 4 月展示 Claude agent 端到端做 weak-to-strong supervision 开放研究:两名人类研究员约一周恢复 23% gap,agent 在 800 累计小时和约 1.8 万美元算力下恢复 97%。文章保留限定:问题和评分 rubric 仍由人类选择,结果未干净迁移到生产规模模型;但在给定边界内,实验设计由 agent 完成。
  7. “研究 taste / judgement”是最后的人类护城河,但 Anthropic 认为它也可能被模型学会:文章把 AI 研发拆成 engineering 与 research:Claude 已能解决欠规格工程问题、执行明确定义实验;明显差距在选择目标、判断哪些问题值得做、哪些结果可信、何时停止。Anthropic 对 129 个研究 detour 片段做测试,模型在 2025 年 11 月比人类下一步更好的比例为 51%,2026 年 4 月 Mythos Preview 升到 64%,这被视为早期信号。
  8. 三种未来:停滞扩散、复合效率增长、完整递归自我改进:第一种是趋势变成 S 曲线,但 Anthropic 认为不太可能;第二种是 AI lab 持续获得复合效率,人类仍定方向、判结果,100 人公司可能做 1 万或 10 万人组织的工作;第三种是 AI 系统能完整研发后继模型,人类转向监督、验证和治理一个“virtual lab”。文章最担心后两种,因为它们留给制度适应的时间更短。
  9. 治理结论不是单边刹车,而是“可验证暂停”的制度能力:Anthropic 认为如果能有效放慢技术以让社会结构和 alignment research 跟上,通常是好事;但如果减速只是让最不谨慎者追上,反而更不安全。可信暂停需要多个前沿实验室、多个国家、同条件停止,并能验证彼此真的停止;而 AI 训练比导弹发射井更难侦测,单边暂停则只能改变谁领先,不能创造缺失的公共 deliberation。

🎯 启示与思考

## 1. 这篇文章真正的新意:Anthropic 把“递归自我改进”从科幻概念拉回组织运营指标 过去谈 recursive self-improvement,容易落入两个极端:一边是抽象的 intelligence explosion,另一边是“还早,别杞人忧天”。Anthropic 这篇的价值在于,它没有从哲学概念开场,而是从工程组织的 throughput、代码归因、review 成功率、实验加速倍数、研究 next-step judgement 这些可观察指标切入。它实际上提出了一个更可操作的判断框架:不要问“AI 是否已经会完全自我改进”,而要问“AI 研发链条里还有哪些环节必须由人类完成,以及这些环节的占比是否正在缩小”。 这对企业和咨询场景很关键。因为企业不需要等到完整 AGI 或 RSI 才会被重塑。只要“doing”的成本在组织内被显著压低,瓶颈就会立刻转移到需求选择、验证、治理、资源编排和变更管理。换句话说,AI transformation 的核心不再是“员工会不会用 Copilot 写邮件/代码”,而是“公司有没有能力吸收 10 倍、100 倍的实验和产出”。Anthropic 自己遇到的 Amdahl’s law——代码变多后 human code review 成为瓶颈——正是所有企业都会遇到的缩影。 ## 2. 对企业 AI 生态:卖点应从“个人提效”升级到“组织吞吐量重构” 这篇文章给 Copilot、Claude Code、企业 agent 项目一个非常强的高管叙事:AI 的价值不是让每个人省半小时,而是让组织的生产函数换轨。Anthropic 工程师 8 倍代码产出、合入代码超过 80% 由 Claude 编写,本质上说明“工作单元”正在从人手执行变成 agent 执行,人类负责目标、约束、审核和优先级。 对企业 AI 转型和云/协作平台生态而言,这意味着方案包装需要改变。过去讲 Copilot adoption,常见 KPI 是使用率、节省时间、员工满意度;现在更应该设计一套“agentic operating model”的指标:每个产品经理可并行推进多少实验、每个工程团队的 review capacity 如何扩容、自动化产出如何进入安全门禁、哪些任务允许 agent 独立运行、哪些必须人类审批。客户真正的问题会从“我要不要买 Copilot license”升级为“我如何把公司改造成能承载 agent 金字塔的组织”。 ## 3. 递归改进的企业版不是 AI 自己造下一个 Claude,而是企业流程自己加速自己 完整 RSI 也许还没发生,但企业内部会先出现“局部递归改进”:agent 写测试、修 bug、生成工具,再用这些工具帮助更多 agent 工作;agent 帮团队做数据清洗和仿真,产出的 tooling 又扩大下一轮分析能力;agent 帮安全团队发现漏洞,安全团队的修复和检测流程又被 agent 自动化。Anthropic 提到 Claude 一次性完成 800 多个 API error fixes、把一类错误降低 1000 倍,这就是典型例子——不是一个大英雄项目,而是过去没人愿意做、也没人有足够上下文做的长尾清理被 agent 规模化吃掉。 这类能力对大型企业非常值钱,因为大企业的技术债、流程债、数据债通常不是“没人知道有问题”,而是“每个问题都不值得单独开项目”。当 AI 把单个修复的边际人力成本降到接近零,治理良好的企业会突然获得清理多年积压的能力。咨询服务可以围绕“debt liquidation by agents”形成新产品:代码库债务、知识库债务、流程 SOP 债务、权限治理债务、数据质量债务,都可以变成 agent swarm 的持续工作流。 ## 4. 风险重点:企业会先被“验证能力不足”卡住,而不是被“生成能力不足”卡住 Anthropic 最值得高管警惕的地方,是它把人类角色从写代码/跑实验推向 review、validation、verification。生成越来越便宜,但验证没有同步便宜,组织就会产生大量“看似完成、无人真正理解”的产出。文章里 Anthropic 员工的感受非常真实:一切顺利时觉得自己不再重要;出问题时又发现自己已经不知道系统到底做了什么。 这对企业 AI 落地是红线。未来 12-24 个月,领先企业和落后企业的差距不在于谁能生成更多 PPT、代码或分析,而在于谁能构建可信验证栈:自动测试、policy-as-code、审计 trail、模型输出抽检、human-in-the-loop 的升级路径、权限隔离、异常回滚。没有验证栈的 agent 化,会从效率工具变成风险放大器;有验证栈的 agent 化,才可能成为组织复利。 ## 5. 对 AI 战略的最终判断:现在要准备的不是“一个 AI 工具”,而是一套“高速组织”的刹车和仪表盘 Anthropic 的治理主张也适用于企业:如果能安全地慢下来是好事,但单边慢下来会让不谨慎者追上。因此现实选择不是“不用 AI”,而是在加速同时建设可观测、可验证、可暂停的机制。企业版对应物就是:哪些 agent 行为可自动执行,哪些必须审批;什么指标触发暂停;谁有权恢复;如何证明某条高风险链路真的停了;如何在供应商、外包商和内部团队之间统一审计口径。 这篇文章可以成为面向 CXO 的战略素材:它把“AI 研发自己加速自己”这个看似遥远的问题,转译成每家公司马上会遇到的组织设计问题。谁能最早把 agent 产出、验证、治理和业务优先级连接成闭环,谁就能吃到 AI 复合效率;谁只把 AI 当成个人助手采购,谁就会在下一轮组织吞吐量竞争中落后。

📜 中文解读

一、文章开场:从人类研发 AI,到 AI 参与研发 AI

Anthropic 这篇《When AI builds itself》讨论的是递归自我改进(recursive self-improvement):一个 AI 系统能够自主设计并开发自己的后继版本。文章首先划清边界——Anthropic 并不认为今天已经到达这一步,也不认为它必然发生;但它认为,现有技术趋势已经足够清晰,且可能比多数机构准备得更早抵达。

文章把 AI 研发历史拆成几个阶段:2021-2023 年,人类构建第一代 Claude,流程像普通科技公司一样,由人在电脑上写代码和文档;2023-2025 年,聊天机器人帮助生成短代码片段,人类复制到编辑器里;2025-2026 年,coding agents 能自己写改代码,有时能完成整个文件;今天,autonomous agents 已能运行代码,并把数小时工作委派给其他 agent;未来某个时间点,如果闭环完成,Claude 的未来版本可能由 Claude 自己持续改进。

二、外部证据:模型可完成任务的时间跨度正在快速变长

文章首先引用外部 benchmark。METR 的研究显示,AI 模型能可靠自主完成的任务时长约每 4 个月翻倍,快于早期每 7 个月翻倍的趋势。2024 年 3 月,Claude Opus 3 可以完成约 4 分钟人类任务;一年后,Claude Sonnet 3.7 可完成约 1.5 小时任务;再一年后,Claude Opus 4.6 可完成 12 小时任务。若趋势保持,熟练人员数天级任务今年可能进入模型能力范围,2027 年模型可能处理数周级任务。

同样模式出现在软件工程和科研 benchmark 上。SWE-bench 要求模型在真实开源代码库中修复真实 bug,模型两年内从低个位数分数走向接近饱和。CORE-Bench 测试模型是否能复现实有研究结果,AI 系统从 2024 年约 20% 成功率,到 15 个月后接近饱和。METR 还发现 Claude Mythos Preview 至少能工作 16 小时,并处于 METR 现有任务可测范围上沿。

三、内部工程证据:Claude 已写下 Anthropic 大量生产代码

更关键的证据来自 Anthropic 内部。文章说,构建前沿模型大致包含工程和研究两类工作:工程包括写代码、搭基础设施、监督模型训练;研究包括决定跑什么实验、解释结果、选择下一步想法。Anthropic 认为,在工程和研究两侧,趋势一致:Claude 已经能在很多执行层面承担工作,但在目标选择和判断上仍有明显差距。

截至 2026 年 5 月,Anthropic 合入代码中超过 80% 由 Claude 编写。Claude Code 在 2025 年 2 月 research preview 前,这一比例仍是低个位数。代码产出也随之变化:Anthropic 前四年每位工程师每日合入代码量大体稳定;2025 年 Claude 开始能运行代码后曲线向上;2026 年模型能在更长时间跨度上自主工作后斜率再次变陡。2026 年第二季度,典型工程师每日合入代码量达到 2024 年的 8 倍。Anthropic 同时提醒,lines of code 不是完美指标,会高估真实生产力,但它足以说明加速正在发生。

一项 2026 年 3 月对 130 名 Anthropic 研究团队员工的调查显示,中位受访者估计,在有 Mythos Preview 的情况下,他们在原本就会做的项目上产出约为没有 AI 模型时的 4 倍。Anthropic 认为真实 uplift 可能低一些,但方向与其他观察一致:大量技术员工正以多倍速度完成核心工作。

文章还举了一个长尾清理案例:2026 年 4 月,Claude 交付 800 多个修复,将一类 API 错误降低 1000 倍。监督这项工作的工程师估计,人类完成同样任务可能需要 4 年,因为修别人 bug 很慢、很痛苦,也需要同时掌握大量陌生上下文。

四、质量证据:Claude 代码正在接近人类水准

文章把“好代码”拆成两个标准:第一,它能工作;第二,其他工程师能理解并继续维护。第一个标准上,Anthropic 认为证据明确。员工中途纠正、重定向或接管 Claude 的比例过去一年持续下降,即使在复杂和开放任务上也如此。最开放任务中,Claude 成功率 2026 年 5 月达到 76%,六个月提升 50 个百分点。文章举例:一次常规升级导致数万训练任务崩溃,工程师只给 Claude 一些文本上下文和 cluster access;Claude 逐个排查运行任务和环境设置,找到一个 obscure debugging flag,复现并确认修复,两小时完成通常需两三天的工作。

第二个标准上,差距仍在但快速收敛。Anthropic 内部没有完全共识,但许多人认为 2025 年末 Claude 写的代码质量仍低于人类,如今已大致持平,并预期年内可能更好。这已经改变 Anthropic 的代码审查方式:拟合入代码会先由自动 Claude reviewer 查看 bug、安全漏洞和其他缺陷。回溯分析显示,如果过去每次变更都有 Claude reviewer,约三分之一导致 claude.ai 事故的 bug 本可在生产前被抓住。

五、研究执行:固定目标实验中的能力从 3 倍跃迁到 52 倍

每次 Anthropic 发布模型,都会做同一个测试:给 Claude 一段训练小模型的代码,要求它在保持正确性检查通过的前提下尽可能提速。目标和成功指标事先固定,因此 Claude 的任务是改代码、运行、计时、重复。这是一个微型实验研究循环。

2025 年 5 月,Claude Opus 4 相对起始代码平均约 3 倍加速;到 2026 年 4 月,Claude Mythos Preview 达到约 52 倍。作为校准,熟练人类研究员通常需要 4-8 小时达到约 4 倍。Anthropic 提醒绝对倍数取决于起始代码优化空间,不能当作真实世界训练提速读;更有信息量的是同一实验设置下的跨模型比较,以及与熟练人类的比较。

六、开放式研究:Claude 开始自己提出实验

2026 年 4 月,Anthropic 发布了 Claude 运行开放式 AI safety 研究项目的演示。Claude-powered agents 被给定一个开放问题:弱模型能否可靠监督强模型?它们需要提出假设、测试、与并行 agent 分享发现并迭代。

这项任务有明确 floor 和 ceiling:floor 是弱监督者自己表现,ceiling 是强模型用正确答案训练后的表现。两名人类研究员约一周恢复 23% 的 gap;agents 在 800 累计小时和约 1.8 万美元算力下恢复 97%。文章也强调限制:结果没有干净迁移到生产规模模型,人类仍选择了问题并创建评分 rubric。但在这些边界内,agent 自己设计了所有实验,人类唯一重要角色是定方向。

Anthropic 还考察 Claude 是否能在真实研究会话里给出更好的下一步。研究者在开放调查中有时会走 detour,Anthropic 找出 129 个这类片段,把 detour 前内容给不同 Claude 模型,让它们建议下一步,再由另一个能看到最终结果的 Claude 判断 AI 或人类建议谁更好。这个设置不是公平人机对比,因为样本刻意选择了人类方向有改进空间的时刻;但它提供了真实、困难、下一步不明显的情境。结果是:2025 年 11 月 Opus 4.5 在 51% 的案例中优于人类选择,2026 年 4 月 Mythos Preview 升到 64%。Anthropic 把这看成模型开始改善研究判断的早期信号。

七、人类角色正在缩窄:从执行转向 taste 和 judgment

文章认为,人类在 AI 开发流程中的角色正一步步缩窄。等人类和 AI 代码质量达到持平,人类可能完全停止亲自写代码,转向只做 review。但如果人类 review 速度跟不上 Claude 生成速度,review 就会成为 AI 研发瓶颈。同样,当 Claude 能跑实验,问题就从“如何跑实验”变成“哪些实验值得跑”。

Anthropic 认为,目前人类比较优势仍在 research taste 和 judgment:选择哪些问题重要、哪些结果可信、何时承认一条路径是死路。文章引用员工感受,指出 Claude 的效率也改变了团队协作的社会结构:过去工作依赖人和人之间的小忙、互惠和共同上下文;Claude 更快、没有人情债,但每次由 Claude 取代求助同事,也是一份人类协作机会的消失。

八、反方与保守结论:即使 AI 永远没有好 taste,也会产生复合加速

文章承认一个自然反对意见:仍在人类手中的目标选择,可能才是最重要的。如果没有这种判断力,Claude 只是强助手,不是能独立推动 AI 进步的系统。Anthropic 说,目前并不清楚今天的训练方法和架构能否解锁这种能力。

但它也指出,AI 进步很少来自纯粹 eureka 时刻。Transformer、mixture-of-experts 这样的范式转变多年才出现一次;中间大量进步是增量式的:扩大规模、看哪里坏、修复、再试。这正是 Claude 擅长的工作流。即使 Claude 永远没有好 research taste,保守读法也意味着复合加速:人类把时间集中在个位数比例的方向设定工作上,Claude 处理其余部分,每个工程师或研究员都能指挥远多于过去的工作。较不保守的读法则是,Claude 在研究判断上的早期提升可能预示 taste 也只是另一种会先失败、后学会的 AI 能力。

九、三种可能未来

第一种未来是趋势停滞,但今天能力广泛扩散。当前指数轨迹可能其实是 S 曲线,判断力瓶颈可能无法靠扩大 compute 和 data 解决,或者真正限制来自芯片、电力、互连带宽等供应链。即使模型能力冻结在今天,世界仍会大变:Project Glasswing 显示 Mythos Preview 数周内发现全球关键系统中一万多个高危和严重漏洞,网络防御瓶颈已从发现漏洞转向修补速度;100 人公司也可能越来越能做 1000 人公司的工作。Anthropic 认为这种未来给政府和社会最多适应时间,但它不认为这是最可能情景。

第二种未来是 AI lab 持续获得复合效率。AI 开发大幅自动化,但人类继续定研究方向、判断结果。组织效率持续提升,100 人公司可能做 1 万或 10 万人组织的工作。知识工作和政府服务会被重塑,也可能被用于大规模个性化操纵或威权监控。Anthropic 认为现有证据指向这一情景,但 Amdahl’s law 会不断制造新瓶颈:Anthropic 已在工程中遇到 human code review 成为瓶颈;研究侧也出现想法、工具、仿真激增,多到组织无法全部追。识别和修复瓶颈,可能成为任何组织最重要的能力。

第三种未来是完整递归自我改进。若能力趋势持续,且 AI 系统获得 transformative human ingenuity 所需能力,AI 可能设计和优化自身。此时 AI 开发速度主要取决于 compute 可用性,或发现训练/推理效率的速度。人类角色大幅缩小,主要转向监督、验证、确认一个由 AI 运行的 virtual lab。Anthropic 对 alignment 在这种未来如何解决最不确定:模型可能足够对齐也足够有 research taste,能发现和实现人类尚未找到的新解;也可能今天模型中罕见的 misalignment 随模型构建后继而复合,变得更频繁、更不被理解,直到人类失控。

十、Anthropic 的治理立场:需要可验证的减速或暂停选项

文章最后转向治理。Anthropic 表示,如果能够有效放慢技术发展,让社会结构和 alignment research 跟上,可能是好事;但如果减速只是让最不谨慎者追上,所有人会更不安全。在缺少全球协调机制的情况下,公司和政府必须在竞争与地缘压力下做安全决策。

Anthropic 希望世界拥有放慢或临时暂停前沿 AI 开发的选项。Anthropic Institute 将与他人合作研究并采取行动,建设可信减速或暂停所需系统。这些系统要能让前沿开发者验证全球其他人真的停止或放慢,并确保坏人不能借协调暂停秘密超车。如果这种系统存在,且其他前沿开发者也以可验证方式同步减速或暂停,Anthropic 预计自己也会这样做。

但难点很大。一个有意义暂停需要多个资源充足、接近前沿、位于多国的实验室在同等条件下停止,并能验证彼此真的停止。AI 训练 run 比导弹发射井更容易隐藏,输入也更通用,秘密违约的激励极强,因为谁在别人暂停时继续推进,谁可能继承领先地位。可信暂停还必须说明触发条件、解除条件和裁决者。

Anthropic 认为这在原则上未必不可能,世界曾为其他复杂技术建立验证制度;但那些制度花了几十年,而 AI 没有那么长时间。单个实验室单边暂停可以立即做到,却只能改变领先者是谁,不能创造缺失的公共 deliberation。未来几个月,Anthropic 将组织政策制定者、研究者、民间社会和其他 AI 公司讨论这些问题,尤其是完整递归自我改进以及如何创建更好的协调和 deliberation 选项。

💎 金句精选

"Taken far enough, and given enough compute, that trend points to an AI system capable of fully autonomously designing and developing its own successor."

「如果这种趋势走得足够远、并且有足够算力,它指向的是一个能够完全自主设计并开发自身后继版本的 AI 系统。」

"We are not there yet, and recursive self-improvement is not inevitable. But it could come sooner than most institutions are prepared for."

「我们尚未到达那里,递归自我改进也并非不可避免。但它可能比多数机构准备得更早到来。」

"As of May 2026, more than 80% of the code we merge into Anthropic’s codebase was authored by Claude."

「截至 2026 年 5 月,Anthropic 合入代码库的代码中超过 80% 由 Claude 编写。」

"In the second quarter of 2026, the typical engineer was merging 8× as much code per day as they were in 2024."

「2026 年第二季度,典型工程师每天合入的代码量是 2024 年的 8 倍。」

"On the most open-ended tasks, Claude’s success rate reached 76% in May 2026, up 50 percentage points in six months."

「在最开放的任务上,Claude 的成功率在 2026 年 5 月达到 76%,六个月内提升 50 个百分点。」

"In this part of the research workflow—optimizing steps within a clearly defined experiment—Claude has gone from super helpful to superhuman in under a year."

「在研究流程的这一部分——优化一个明确定义实验中的步骤——Claude 在不到一年内从“非常有帮助”变成了“超人水平”。」

"The comparative advantage of humans as of right now is still in seeing the bigger picture and thinking beyond the confines of the immediate task."

「截至目前,人类的比较优势仍在于看到更大的图景,并跳出眼前任务的边界思考。」

"Put simply: the doing (i.e., writing the code, running the experiment, producing the result) now costs almost nothing in human time, even if it still has costs in compute."

「简单说,执行工作——写代码、跑实验、产出结果——如今几乎不再消耗人类时间,尽管仍然消耗算力。」

"We believe it would be good for the world to have the option to slow or temporarily pause frontier AI development to enable societal structures and alignment research to keep up with the advance of the technology."

「我们认为,世界若能拥有放慢或临时暂停前沿 AI 开发的选项,让社会结构和 alignment research 跟上技术进步,将是好事。」

"A unilateral pause by one lab, by contrast, is achievable immediately, but accomplishes much less: it would change who the front-runner is, but it would not create the wider deliberative process that is currently missing."

「相比之下,单个实验室单边暂停可以立即做到,但作用小得多:它会改变谁是领先者,却不能创造当前缺失的更广泛审议过程。」

#Anthropic #递归自我改进 #AI R&D #Claude Code #AI Safety #生产力 #AI 治理