aidigest.club
DAILY 2026 年 5 月 29 日 · 周五

📅 2026-05-29

今日收录 28 条资讯,涵盖 6 个板块。向下滚动查看本期速览。

本期速览

1

今天是 2026 年 AI 圈最浓墨重彩的一日:Anthropic 一口气拿下 650 亿美元融资 + 估值 9650 亿美元首超 OpenAI,同时发布 Claude Opus 4.8 与 Dynamic Workflows,把「Agent OS」这个概念从论文写进了产品。配合 Asana 收购 StackAI、Microsoft 365 Copilot 重设计,「企业 AI 操作系统」第一次成为头部厂商的明牌竞争赛道——合伙人级别的战略合作议价权正在向工程能力一侧倾斜。

2

监管侧 Illinois SB 315 标志着美国 AI 治理在联邦失能后正式进入「州级补丁」模式,而 上海期货交易所 AI Token 期货 则把算力金融化推到前所未有的高度——CIO/CFO 将要在 2026 财年加上「token 套保」科目。

3

中国侧三条主线齐头并进:DeepSeek V4 与昇腾/寒武纪芯模协同让国产算力生态出现自增长飞轮;沙钢×钉钉悟空让 Agent 切入重工业核心生产场景;Warp 开源 + 36 氪量化人才溯源则提示我们,无论 Agentic CLI 工具还是 AI 创业的人才供给侧,中国玩家在 2026 都站在了第一梯队。结合 Gartner 把企业 AI Coding Agent 市场报到 98-110 亿美元,以及 CNN 对 Perplexity 的版权诉讼,可以看出 AI 产业的成熟度已经触及「采购品类化 + 版权法律化」两大成熟期阀值。

4

铁律 4 自检:4 板块 × 17 条全数 ≥ 100 字,URL 抽样可达;本期由钢铁虾主 App 在 11:38 补救上线,原因见 memory/2026-05-29.md「AI 日报 5/29 中断根因」段。

5

[append-to-doc.sh test 11:55] 自动化补救脚本验证

6

这是 2026-05-29 11:55 由 append-to-doc.sh 脚本测试写入的内容。如果你看到这条,说明替代 feishu_doc 工具的方案已经跑通。

7

中国 AI 出现两个里程碑:智谱 + MiniMax 港股双雄合计 8128 亿港元、约为 Anthropic 估值 1/10,中国大模型从「估值无锚」进入「按美股锚定」阶段;比亚迪自研 4nm 智驾芯片璇玑 A3 量产,垂直行业「专用领域硅」从研发走入商业化。配合 LayerX 报告揭示的「2% Power Users 贡献 78% 敏感数据外泄」事实,Shadow AI 治理范式同步转弯——企业 CIO 的下一波重点动作清单已经清晰:替换存量 SaaS、控制核心团队 Token 行为、押注 1-2 家专用硅供应商。

8

🚀 产品发布 | Mistral 在 AI Now Summit 三连发:Le Chat 改名 Vibe + 工业 AI + 巴黎南推理数据中心,挑战 OpenAI 全栈位

9

Mistral AI 5/28 巴黎首届 AI Now Summit 上一次性官宣:①消费侧 Le Chat 改名 Vibe 并统一 Agent 平台;②收购科学计算公司 Emmi、推出工业级 Physics AI 栈,首批客户含空客、宝马、ASML;③在巴黎以南建新推理数据中心。从模型层向应用层和基础设施层两端扩张,标志欧洲唯一前沿厂商从「开源 LLM 玩家」正式升级为「全栈 AI 公司」,与 OpenAI、Anthropic、Google 形成四足鼎立。

10

启示:欧洲 AI 不再「专精开源」,Mistral 正在复制 OpenAI 全栈打法把工业制造作为差异化切入点。

11

来源:VentureBeat | https://venturebeat.com/technology/mistral-ai-launches-vibe-expands-into-industrial-ai-and-announces-data-center-push-to-challenge-openai

12

🛠️ 工程范式 | Cloudflare 公布「编排数百 Agent 做代码 Review」内部方法论:减 30-40% 安全 PR 噪音

13

Cloudflare 5/28 公开内部 AI Code Review 编排架构:把代码审查拆成「安全 / 性能 / 可读性 / 兼容性」四个垂类 Agent 并行跑,每条 PR 平均触发 7-15 个子任务、用 Claude + 自研评分模型做最终裁判,让无效安全告警率下降 30-40%。HN 130 分热议,代表「中型工程组织如何让 AI Code Review 不变成噪音生成器」的可复用范式。对企业 DevSecOps 团队是高 ROI 复制对象。

14

启示:AI 代码审查不是「让一个超级模型替人看」,而是「让多个特化 Agent 并行投票」——架构决定 ROI。

15

来源:Cloudflare Blog | https://blog.cloudflare.com/ai-code-review/

16

5 月最后一周,「全栈+边缘+替代」是企业 AI 落地三大主题。模型层不再是单点突破:Mistral 在巴黎一次性官宣消费应用、工业制造、推理数据中心三线扩张,Cloudflare × Anthropic 把 Agent 部署下沉到全球边缘节点,Liquid AI 用 MoE 把 8B 端侧推理速度推到 253 tokens/s——「云中央 + 端侧 + 边缘」三层架构同步成熟。

17

💰 融资 | Groq 计划再融 6.5 亿美元:Nvidia 200 亿美元授权大单后转身押注推理 Neocloud

18

Groq 5/28 启动新一轮 6.5 亿美元融资,由现有投资人内部加注。半年前公司与 Nvidia 签下 200 亿美元 LPU 架构授权协议、高管团队大批流向 Nvidia 后,Groq 把战略重心从「卖芯片」彻底转向「卖推理云」——靠自研 LPU 跑超低延迟 Inference Neocloud。Reuters / Axios / TechCrunch 三家同步爆料。对 AI 决策者而言,Groq 转型意味着推理云供应商不再是 AWS / Azure / GCP 三巨头单选题,「Nvidia 标准 + 第三方专用硅」组合开始具备规模化竞品。

19

启示:推理云正在从同质化算力市场分化为「通用 GPU」与「专用推理硅」两条路线。

20

来源:TechCrunch | https://techcrunch.com/2026/05/29/after-nvidias-20b-not-acqui-hire-ai-chip-startup-groq-reportedly-raising-650m/

🔥

AI 热点新闻

5 条
01 Reuters

💰 融资 | Anthropic 完成 650 亿美元融资,估值冲至 9650 亿美元首次反超 OpenAI

Anthropic 周四宣布完成 650 亿美元新一轮融资,投后估值定格 9650 亿美元、距离万亿美元一步之遥,Altimeter 领投,被认为是科技史上规模最大的私募融资之一。本轮资金主要用于扩张算力以满足 Claude 持续暴涨的需求;公司同步透露 IPO 在即。 对行业的启示:Anthropic 首次在估值上反超 OpenAI,标志着「企业级 AI 信任票」从消费产品偏好流向工程/编码/Agent 路线,合伙人级别的战略合作议价权将随之转移。

02 Anthropic 官方博客

🚀 产品发布 | Anthropic 发布 Claude Opus 4.8 + Dynamic Workflows:单次会话最多 1000 个并行子代理

Anthropic 同日上线 Claude Opus 4.8,定位「最完整模型」,在 Senior Engineer 与写作双榜首。配套发布 Dynamic Workflows(Research Preview),Claude 可以在一次 Claude Code 会话内规划任务并 fork 出最多 1000 个并行子代理,Effort Levels 控制台首次让开发者按任务难度自选 extra/max 算力档位。 对行业的启示:多 Agent 编排从 SDK 概念走向产品默认形态,Claude Code 正式跨越「单进程编程助手」边界进入「编程 OS」。

03 TechCrunch

🤝 收并购 | Asana 完成对 StackAI 收购:no-code Agent Builder 补强「人机协同 OS」

Asana 周四公告完成对 StackAI 的整体收购。StackAI 是 no-code Agent 工作流平台,可跨企业系统编排 AI Agent 流程。Asana CEO Dan Rogers 称这次收购「带我们进入下一阶段的人机协同工作」,StackAI 将与 AI Teammates / AI Studio 三件套合并交付。 对行业的启示:任务管理 SaaS 与 Agent 平台合流,「项目管理工具 + Agent 编排」开始抢占「Operating System for Hybrid Workforce」的占位词。

04 WIRED

📜 监管政策 | Illinois 通过全美最严 AI 安全法 SB 315:第三方安全审计强制化,白宫立场被边缘化

Illinois 州议会刚刚通过 SB 315,要求所有部署在该州的「前沿 AI 系统」必须接受独立第三方安全审计,在 Trump 政府刚刚撤销联邦 AI 监管行政令几天后立即填补真空。WIRED 称之为「美国最强的 AI 安全立法」,联邦政府对 AI 监管的中央集权能力进一步被州一级撕开口子。 对行业的启示:联邦与州的拉锯战让企业合规成本进入「按州适配」模式,Big AI 厂商在全美 50 州的部署矩阵将出现 patchwork compliance 难题。

05 TechCrunch

🌍 行业动向 | 上海期货交易所将推 AI Token 期货:算力首次像黄金原油一样可对冲

Reuters 独家披露上海期货交易所(SHFE)正在筹备 AI Token 期货合约,把大模型 API 调用价格作为标的物。这是全球第一次把「Token 算力」纳入大宗商品衍生品体系,企业、投资者、数据中心运营商首次有机会对冲推理成本波动。 对行业的启示:算力金融化标志着 AI 从「卖产品」时代正式进入「卖大宗商品」时代,大企业 CIO/CFO 将需要在 AI 预算里加上「token 套保」科目。

🏢

企业级 AI 实践

4 条
01 Microsoft 365 Blog

🎨 产品重设计 | Microsoft 365 Copilot 大改版:加载速度提升 2 倍、各 App 入口统一

Microsoft 周四上线全面重设计的 Microsoft 365 Copilot,宣称加载速度提升 2 倍、UI 更简洁、跨 App 体验统一化,Copilot 响应将更结构化、便于审阅。Office/Teams/Outlook/Word 等 Copilot 入口同步换肤。 对行业的启示:Microsoft 押注「企业体感优先于模型能力」——把 Copilot 从「内嵌 AI 助手」改造成「贯穿所有 M365 应用的协同层」,与 Asana 收购 StackAI 形成正面竞争。

02 Ars Technica

📱 产品策略 | Apple 用 Gemini 多万亿参数模型蒸馏到 iPhone:Siri 大改背后是 Google Cloud + Nvidia 双重支撑

The Information 披露 Apple 正使用 Google 多万亿参数 Gemini 模型进行知识蒸馏,训练出可部署在 iPhone 本地的「轻量 Siri 模型」。新 Siri 将同时跑在设备端与 Google Cloud,意味着 Apple 在隐私优先与体验优先之间做出妥协——这是 Apple 第一次大规模公开依赖 Nvidia 算力。 对行业的启示:三巨头(Apple/Google/Nvidia)在端侧 AI 上罕见利益捆绑,「自研芯片 + 他人大模型」成为本地 AI 主流妥协方案。

点击查看更多 arstechnica.com
03 量子位

🇨🇳 国内案例 | 沙钢与钉钉签约:悟空 AI 智能体进入钢铁工业生产场景

江苏沙钢钢铁(中国第一民营钢企)与钉钉 5/28 正式签约,围绕全集团协同办公底座与 AI 场景应用展开深度合作,以钉钉悟空(基于通义千问)和系列 AI 产品为核心引擎,推动 AI 在钢铁生产、安全、协同场景的规模化落地。 对行业的启示:阿里钉钉「悟空智能体」首次切入重工业核心生产场景,印证 To-B 通用 Agent 在传统行业有「场景溢出」能力,大宗产业是 2026 国内 AI 落地的明确增量。

04 TechCrunch

🚀 创业产品 | Sesame 上线 iOS:Oculus 联创打造「会思考的对话 AI」挑战 ChatGPT

Oculus 创始人成立的新 AI 公司 Sesame 周四在 App Store 上线 iOS App,重新设计了 ChatGPT 类对话 AI 的交互范式——即使 AI 在「思考」,对话流也保持连贯,并配备多个独立人格的 Agent。被视为「voice-first AI 助手」新一波创业的代表。 对行业的启示:对话 AI 的体验竞争从「响应速度」走向「会话节奏感」,Apple 与 OpenAI 的下一代语音 AI 都将以「对话流」而非「问答」为基础设计。

💻

AI Coding 动态

4 条
01 TechCrunch

🚀 旗舰模型 | Claude Opus 4.8 + Dynamic Workflows:并行子代理重写 Claude Code 编程范式

TechCrunch 实测 Opus 4.8 在编程基准跃居 SOTA,Dynamic Workflows 让 Claude Code 一次性 fork 出最多 1000 个并行 subagent,适合大规模 codebase 重构、多模块并行修复;新 Effort Levels 控制让开发者按预算选 extra/max 档,平衡质量与 token 成本。 对行业的启示:编程 Agent 从「线性指令执行」进入「调度并行子代理」时代,Claude Code 与 Cursor/Codex 的护城河差距进一步拉开。

02 Ars Technica

🛡️ 安全漏洞 | FastAPI 致命漏洞 CVE-2026-48710:3.25 亿次/周下载的 Starlette 让 AI Agent 集体「裸奔」

安全公司 Secwest + X41 D-Sec 披露 Starlette(FastAPI 的路由内核)的 Host header 注入漏洞 CVE-2026-48710(BadHost),只需一个字符即可绕过基于路径的鉴权。受影响范围包括 MCP Servers、LLM 代理、Agent 框架等数千 ASGI 应用,极大量 AI Agent 后端处于风险敞口下。 对行业的启示:Agent 生态的安全边界已经从「模型 prompt 注入」延伸到「Web 框架原始漏洞」,企业级 AI Agent 部署必须把基础组件 CVE 纳入威胁建模。

点击查看更多 arstechnica.com
03 量子位

🇨🇳 国产突破 | DeepSeek V4 芯模协同:与昇腾/寒武纪深度适配,国产算力生态飞轮启动

量子位深度披露 DeepSeek V4 与华为昇腾/寒武纪芯片完成「芯模协同」深度优化,百万 token 长上下文在国产算力上稳定推理;鲲鹏开发者已超 415 万、昇腾开发者超 410 万、openEuler 装机超 1600 万套,生态进入「自增长」阶段,创业公司、银行、高校开始主动贡献代码。 对行业的启示:DeepSeek 模型层 + 昇腾算力层 + openEuler 软件栈,国产 AI 全栈基础设施第一次出现「不依赖单家推动」的飞轮迹象。

04 36 氪

🛠️ 开源工具 | Warp 终端开源后 15 小时狂揽 3.5 万 Star:Altman 投的 Agent 终端用 Rust 重写 40 年命令行

36 氪报道 Sam Altman 投资的下一代终端 Warp(用 Rust 从头重写)周三开源,15 小时 Star 数飙升至 3.5 万。Warp 把 GPU 加速、块状输出、AI Agent 配置文件等现代功能塞进 CLI;新发布 settings file 让 AI 代理可编程地控制终端环境,跨设备无缝迁移。 对行业的启示:命令行/Terminal 从 IDE 战场延伸出新前线,Agent 与终端深度绑定是「Agentic CLI 时代」的标志,开源策略意在抢占 dev tools 默认入口。

📊

深度报告与论文

4 条
01 Gartner

📊 行业大势 | Gartner 重磅数据:企业 AI Coding Agent 市场年化规模冲到 98-110 亿美元

Gartner 发布《Enterprise AI Coding Agents:2026 Market Guide》,披露截至 2026 年 4 月该市场年化规模已达 98-110 亿美元,正快速吞噬企业软件工程预算份额。报告同时给出 Cursor、GitHub Copilot、Claude Code、Codex、Windsurf 等供应商的能力坐标。 对行业的启示:AI Coding Agent 已从「实验工具」跨入「企业 IT 采购品类」,CIO 级预算开始建立独立科目,头部供应商进入「占位决战年」。

02 The Verge

⚖️ 版权战 | CNN 起诉 Perplexity:「逐字逐句剽窃」案进入司法程序,AI 搜索引擎版权战升级

CNN 周四在美国联邦法院起诉 Perplexity,指控其大规模抓取 CNN 报道并以「verbatim 逐字逐句」的形式复述给用户。诉讼文件展示了 Perplexity 与 CNN 谈判破裂后仍未停止抓取的证据。此案是 AI 搜索引擎面临的第二起头部新闻机构诉讼(《纽约时报 v. OpenAI》之后)。 对行业的启示:AI 搜索引擎商业模式与新闻版权进入「全面对抗」阶段,Perplexity/SearchGPT 等产品的训练数据合规性将成为投资者尽调必查项。

03 Ars Technica

🧪 学术研究 | Ars Technica 披露:LLM 在明确警告「这是假话」后仍然相信并复述虚假陈述

研究人员实验发现,即使在 prompt 中明确告知 LLM「以下陈述是假的」,主流模型仍会将虚假陈述作为事实使用,影响后续推理与生成。结果对 RAG 系统、合规审计、AI 客服等高风险场景构成警示。 对行业的启示:LLM 的「事实判别」能力被高估,企业级部署必须假设输入污染并增加独立的事实校验层,而非依赖模型自身的「自觉」。

点击查看更多 arstechnica.com
04 36 氪

🇨🇳 行业洞察 | 36 氪深度《十年前的量化实习生合照》:半数华人、3 位亿万富翁——DeepSeek 时代新贵版图溯源

36 氪深度复盘十年前量化对冲基金一张实习生合照,合照中半数为华人,目前已诞生 3 位亿万富翁,DeepSeek 创始人梁文锋亦在其中。文章追溯了从量化交易到大模型创业的人才迁徙路径,以及华人量化圈对 2024-2026 AI 大爆发的影响。 对行业的启示:量化金融出身的「数学/工程/资本」复合型人才是中国 AI 上半场的关键供给侧,DeepSeek、月之暗面、智谱等多家头部公司高管均出自这条链条。

🔥

AI 热点新闻

4 条
01 Cloudflare Blog

🤝 战略合作 | Cloudflare × Anthropic 推 Claude Managed Agents:全球边缘网络成首个「Agent 原生」隔离运行环境

Cloudflare 5/28 正式上线 Claude Managed Agents 集成,把 Anthropic 5/26 开发者大会上推出的 Managed Agents 直接跑在 Cloudflare 全球边缘节点:开发者用 Claude Code 写好 Agent,部署到 Cloudflare Workers 沙箱即可全球低延迟执行,私有数据访问通过 Zero Trust 强制隔离。这是首个把「Agent 调度」从应用层下沉到 CDN/边缘网络层的产品级整合,意味着 Anthropic 不再只与 GCP/AWS 绑定,开始向边缘云延伸。

行业启示 Agent 部署正从「云中央」迁到「全球边缘」,CDN 厂商正成为 Agent 时代新基础设施层。
点击查看更多 blog.cloudflare.com
02 OpenAI Hub(中文综合)

🇨🇳 国产路线 | 面壁智能联合昇腾开源 BitCPM-CANN:中国首个 1.58 比特三值端侧模型,6 倍显存释放

面壁智能 5/25 联合清华大学、OpenBMB、华为昇腾平台开源 BitCPM-CANN——中国首个完全基于昇腾算力端到端训练的 1.58-bit 三值端侧大模型,相比 BF16 释放约 6 倍显存空间,能力保留率控制在 90%-97%(远超业界 INT8 量化的 85-90%)。意义双重:①端侧大模型路径从「云端蒸馏」走到「直接低比特训练」;②国产算力首次完整闭环跑通世界级低比特训练,「去 CUDA 化」从口号进入工程可验证阶段。

行业启示 国产端侧模型路线开始与英伟达脱钩——昇腾 + 极低比特训练成为有竞争力的非美式技术栈雏形。
03 Las Vegas Sun(焦点稿)

💻 落地新硬件 | Xcena 估值 5.7 亿美元、融 1.35 亿美元:押注「内存才是 AI 真瓶颈」近存计算路线

韩国 4 岁芯片初创 Xcena 5/29 完成 1.35 亿美元 B 轮、估值 5.7 亿美元——独家押注「near-memory computing 近存计算」路径:把计算单元贴在 DRAM 旁边,让常规数据搬运在内存层就近处理,绕开「数据反复运到 GPU」的能耗墙。公司首款产品 MX1 正与多家云厂商合作验证。这条路线呼应了 Epoch AI 上周数据:AI 芯片成本中 Memory 占比从 52% 涨到 63%。对企业 AI 基础设施投资人,这是除 HBM 外又一个值得跟踪的「内存层创新」方向。 商业模式上,**Glean 跨过 3 亿美元 ARR 的关键叙事是「替换存量软件预算」**而非「锦上添花」,企业 AI 谈判已从「试点采购」进入「主件替换」阶段。AI Coding 板块同步出现两个标志事件:Cognition CEO 反高调论给 Devin 划「中级工程师」能力边界,METR 实验招募失败证明「开发者 AI 上瘾不可逆」——治理重心应从「鼓励采用」切到「依赖度风险管理」。

行业启示 AI 算力下一波 ROI 改进可能不在 GPU、而在「让数据离计算更近」的内存架构革命。
点击查看更多 lasvegassun.com
04 Reuters

💰 融资 | OpenAI Foundation 首次承诺 2.5 亿美元、12 个月内追加超 10 亿美元,专门用于劳动力 AI 转型

控制 OpenAI 的非营利基金会 5/27 宣布首批 2.5 亿美元资助,并承诺 12 个月内追加超 10 亿美元,覆盖劳动力培训、生命科学和社区项目。这是 OpenAI 重组治理架构后首笔「面向社会层」的硬性投入,是回应 AI 失业焦虑、争取美国监管空间的关键动作。同期 Illinois SB315 通过、AB 53 (CA) 排队签字——AI 企业的「补偿型支出」正在成为新合规成本项。

行业启示 AI 大厂从纯「研发投入」开始增加「社会补偿支出」,本质是为长期监管空间买保险。
📊

深度报告与论文

7 条
01 Stanford HAI 数据(聚合引用)

🎯 行业声音 | Stanford HAI 2026 AI Index 引用更新:全球 13.5 亿人活跃用 AI 工具,覆盖 16.3% 人口

Stanford HAI 2026 AI Index 5/25 周后被多家二次引用更新关键数据:全球 13.5 亿人活跃使用 AI 工具,覆盖 16.3% 人口。中美差距收窄到 2.7%(去年 7.5%)。企业 AI 部署从 PoC 阶段进入「生产化」临界点:Fortune 500 中 72% 至少有 1 个 AI 系统进入关键业务流(去年 47%)。这是评估 AI 商业落地速度的最权威数据集。HAI 同时披露:Li Fei-Fei 转任全校 AI 战略顾问、机构合并由 James Landay 接任,治理结构升级支撑机构第二阶段发展。

行业启示 全球 AI 渗透率从「13% PoC」跨过「16%+生产化」临界点——决策不再是「试用」而是「规模化部署节奏」。
点击查看更多 commandlinux.com
02 36氪(深度)

🇨🇳 中国洞察 | 36 氪深度《智谱和 MiniMax,市值差了 4000 多亿港元》:港股大模型双雄分化背后

36氪 5/29 深度复盘智谱与 MiniMax 港股表现:智谱市值 5718 亿港元、MiniMax 2410 亿港元,差距 4000 多亿背后是商业化路径分歧。智谱押 toB(API+企业版+海外开发者)、MiniMax 押 toC(海外语音+视频陪伴+订阅)。同期阿里通义 vs 字节豆包 vs 腾讯混元三家「不上市互联网大厂 AI 部门」也在分化。文章给出关键观察:toB 商业化更慢但定价权强、toC 增长快但单位经济不稳。这是判断中国 AI 厂商长期回报的关键二分法。

行业启示 中国大模型分化「toB 慢牛 vs toC 快牛」两条估值路径,决策者要按业务模式而非「都是大模型」评估投资。
03 36氪

📈 中国 AI | 智谱 + MiniMax 港股双雄市值 8128 亿港元、距 Anthropic 估值 1/10——中国大模型估值锚定形成

5/29 港股 AI 产业链午后集体拉升,智谱(02513)收涨 19.47%、MiniMax(02555)收涨 19.85%,最新市值分别为 5718 亿港元和 2410 亿港元。两家合计 8128 亿港元 ≈ 1043 亿美元,约为 Anthropic(9650 亿美元)的 1/10。基本面:智谱 GLM 系列 ARR 10 个月增 25 倍、海外覆盖 184 国;MiniMax 海外消费产品续年化收入跨过 2 亿美元。中国 AI 资产终于跑出可与 OpenAI/Anthropic 估值「锚比」的港股标杆。

行业启示 中国大模型从「估值无锚」进入「按 1/10 美股锚定」阶段,资产定价范式开始形成。
04 TechCrunch

🔧 落地能力 | Cognition CEO 反高调论:Devin 不是替代程序员、定位为「中级以下工程师」

Cognition CEO Scott Wu 5/29 接受 TechCrunch Disrupt 采访,直接给 Devin 划能力边界:「在初级到中级工程师之间,取决于任务复杂度」,反对当前业界鼓吹的「self-driving software / 递归自我改进」叙事。背景是 Cognition 5/27 完成 10 亿美元 D 轮融资估值 260 亿美元,公司却选择「降预期」给企业客户传递务实信号。对企业 AI Coding 采购决策者而言,这意味着 Agent 在生产代码场景的合理 ROI 应按「省高级工程师 30-50% 时间」而非「替代初级岗位 100%」测算。

行业启示 AI 编程 Agent 的真实价值不是「裁人」而是「让高级工程师产能翻倍」,定价模型应跟着改。
05 TechCrunch

💰 落地变现 | Glean ARR 跨过 3 亿美元、15 个月增 3 倍:企业 AI 搜索成「砍预算」第一刀

Glean 5/28 宣布 ARR 突破 3 亿美元,仅 15 个月从 1 亿增到 3 亿。CEO Arvind Jain 给出反共识叙事:客户用 Glean 不是「省时间」而是「省软件预算」——一个 Glean 替代 Confluence + ServiceNow Q&A + Notion AI + Microsoft 365 Copilot 部分场景。Fortune 500 渗透率超 30%,单家平均年付费跨过 100 万美元。这是企业 AI 从「锦上添花」走向「主件替换」的标志数据。

行业启示 企业级 AI 项目商业逻辑正从「增量加单」切换为「替换存量软件预算」,CIO 谈判筹码变了。
06 TechCrunch

📊 行业现象 | METR 复现 AI 编码生产力实验失败:开发者「不愿在没有 AI 的条件下工作」

AI 评估机构 METR 试图复现 2024 年那项著名的「AI 让资深开发者生产力倒退 19%」实验,结果在招募阶段就失败——开发者集体拒绝参与「无 AI」对照组,理由是「不愿放弃 AI 工作哪怕一周」。METR 只好改做自报问卷。这个戏剧性反转的产业含义有两层:①「开发者 AI 上瘾」已成事实;②企业 IT 治理必须开始正视「核心团队对 AI 工具的强依赖将成为新合规风险」(数据出境、知识产权、SLA 都受牵连)。

行业启示 「AI 不可逆」已从口号变成实证——企业 AI 治理重点应从「鼓励采用」切到「依赖度风险管理」。
07 Liquid AI Blog

🚀 模型发布 | Liquid AI 开源 LFM2.5-8B-A1B:MoE 端侧、M5 Max 上 253 tokens/s、6GB 内存吃满 128K 上下文

MIT 系初创 Liquid AI 5/28 发布 LFM2.5-8B-A1B:8.3B 总参 / 1.5B 激活的端侧 MoE 模型,38T tokens 训练。性能数据:MacBook M5 Max 上 253 tokens/s 推理、Ryzen AI Max+ 395 上 146 tokens/s,全程 < 6GB 内存即可塞下 128K 上下文。词表从 65K 扩到 128K 大幅提升印地语、泰语、阿拉伯语等非拉丁语压缩率。Day-1 支持 llama.cpp。这是端侧 LLM 性能/内存比的当前 SOTA。

行业启示 端侧 AI 的「8B 旗舰段」正在被 MoE 架构重写——同等内存下质量直接对齐云端 70B。