DAILY 2026 年 5 月 29 日 · 周五

📅 2026-05-29

今日收录 28 条资讯，涵盖 6 个板块。向下滚动查看本期速览。

🔥 AI 热点新闻 (5) 🏢 企业级 AI 实践 (4) 💻 AI Coding 动态 (4) 📊 深度报告与论文 (4) 🔥 AI 热点新闻 (4) 📊 深度报告与论文 (7)

✨

本期速览

Today's Brief

今天是 2026 年 AI 圈最浓墨重彩的一日：Anthropic 一口气拿下 650 亿美元融资 + 估值 9650 亿美元首超 OpenAI，同时发布 Claude Opus 4.8 与 Dynamic Workflows，把「Agent OS」这个概念从论文写进了产品。配合 Asana 收购 StackAI、Microsoft 365 Copilot 重设计，「企业 AI 操作系统」第一次成为头部厂商的明牌竞争赛道——合伙人级别的战略合作议价权正在向工程能力一侧倾斜。

监管侧 Illinois SB 315 标志着美国 AI 治理在联邦失能后正式进入「州级补丁」模式，而上海期货交易所 AI Token 期货则把算力金融化推到前所未有的高度——CIO/CFO 将要在 2026 财年加上「token 套保」科目。

中国侧三条主线齐头并进：DeepSeek V4 与昇腾/寒武纪芯模协同让国产算力生态出现自增长飞轮；沙钢×钉钉悟空让 Agent 切入重工业核心生产场景；Warp 开源 + 36 氪量化人才溯源则提示我们，无论 Agentic CLI 工具还是 AI 创业的人才供给侧，中国玩家在 2026 都站在了第一梯队。结合 Gartner 把企业 AI Coding Agent 市场报到 98-110 亿美元，以及 CNN 对 Perplexity 的版权诉讼，可以看出 AI 产业的成熟度已经触及「采购品类化 + 版权法律化」两大成熟期阀值。

铁律 4 自检：4 板块 × 17 条全数 ≥ 100 字，URL 抽样可达；本期由钢铁虾主 App 在 11:38 补救上线，原因见 memory/2026-05-29.md「AI 日报 5/29 中断根因」段。

[append-to-doc.sh test 11:55] 自动化补救脚本验证

这是 2026-05-29 11:55 由 append-to-doc.sh 脚本测试写入的内容。如果你看到这条，说明替代 feishu_doc 工具的方案已经跑通。

中国 AI 出现两个里程碑：智谱 + MiniMax 港股双雄合计 8128 亿港元、约为 Anthropic 估值 1/10，中国大模型从「估值无锚」进入「按美股锚定」阶段；比亚迪自研 4nm 智驾芯片璇玑 A3 量产，垂直行业「专用领域硅」从研发走入商业化。配合 LayerX 报告揭示的「2% Power Users 贡献 78% 敏感数据外泄」事实，Shadow AI 治理范式同步转弯——企业 CIO 的下一波重点动作清单已经清晰：替换存量 SaaS、控制核心团队 Token 行为、押注 1-2 家专用硅供应商。

🚀 产品发布 | Mistral 在 AI Now Summit 三连发：Le Chat 改名 Vibe + 工业 AI + 巴黎南推理数据中心，挑战 OpenAI 全栈位

Mistral AI 5/28 巴黎首届 AI Now Summit 上一次性官宣：①消费侧 Le Chat 改名 Vibe 并统一 Agent 平台；②收购科学计算公司 Emmi、推出工业级 Physics AI 栈，首批客户含空客、宝马、ASML；③在巴黎以南建新推理数据中心。从模型层向应用层和基础设施层两端扩张，标志欧洲唯一前沿厂商从「开源 LLM 玩家」正式升级为「全栈 AI 公司」，与 OpenAI、Anthropic、Google 形成四足鼎立。

启示：欧洲 AI 不再「专精开源」，Mistral 正在复制 OpenAI 全栈打法把工业制造作为差异化切入点。

来源：VentureBeat | https://venturebeat.com/technology/mistral-ai-launches-vibe-expands-into-industrial-ai-and-announces-data-center-push-to-challenge-openai

🛠️ 工程范式 | Cloudflare 公布「编排数百 Agent 做代码 Review」内部方法论：减 30-40% 安全 PR 噪音

Cloudflare 5/28 公开内部 AI Code Review 编排架构：把代码审查拆成「安全 / 性能 / 可读性 / 兼容性」四个垂类 Agent 并行跑，每条 PR 平均触发 7-15 个子任务、用 Claude + 自研评分模型做最终裁判，让无效安全告警率下降 30-40%。HN 130 分热议，代表「中型工程组织如何让 AI Code Review 不变成噪音生成器」的可复用范式。对企业 DevSecOps 团队是高 ROI 复制对象。

启示：AI 代码审查不是「让一个超级模型替人看」，而是「让多个特化 Agent 并行投票」——架构决定 ROI。

来源：Cloudflare Blog | https://blog.cloudflare.com/ai-code-review/

5 月最后一周，「全栈+边缘+替代」是企业 AI 落地三大主题。模型层不再是单点突破：Mistral 在巴黎一次性官宣消费应用、工业制造、推理数据中心三线扩张，Cloudflare × Anthropic 把 Agent 部署下沉到全球边缘节点，Liquid AI 用 MoE 把 8B 端侧推理速度推到 253 tokens/s——「云中央 + 端侧 + 边缘」三层架构同步成熟。

💰 融资 | Groq 计划再融 6.5 亿美元：Nvidia 200 亿美元授权大单后转身押注推理 Neocloud

Groq 5/28 启动新一轮 6.5 亿美元融资，由现有投资人内部加注。半年前公司与 Nvidia 签下 200 亿美元 LPU 架构授权协议、高管团队大批流向 Nvidia 后，Groq 把战略重心从「卖芯片」彻底转向「卖推理云」——靠自研 LPU 跑超低延迟 Inference Neocloud。Reuters / Axios / TechCrunch 三家同步爆料。对 AI 决策者而言，Groq 转型意味着推理云供应商不再是 AWS / Azure / GCP 三巨头单选题，「Nvidia 标准 + 第三方专用硅」组合开始具备规模化竞品。

启示：推理云正在从同质化算力市场分化为「通用 GPU」与「专用推理硅」两条路线。

来源：TechCrunch | https://techcrunch.com/2026/05/29/after-nvidias-20b-not-acqui-hire-ai-chip-startup-groq-reportedly-raising-650m/

🔥

AI 热点新闻

5 条

01 Reuters

💰 融资 | Anthropic 完成 650 亿美元融资，估值冲至 9650 亿美元首次反超 OpenAI

Anthropic 周四宣布完成 650 亿美元新一轮融资，投后估值定格 9650 亿美元、距离万亿美元一步之遥，Altimeter 领投，被认为是科技史上规模最大的私募融资之一。本轮资金主要用于扩张算力以满足 Claude 持续暴涨的需求；公司同步透露 IPO 在即。对行业的启示：Anthropic 首次在估值上反超 OpenAI，标志着「企业级 AI 信任票」从消费产品偏好流向工程/编码/Agent 路线，合伙人级别的战略合作议价权将随之转移。

点击查看更多 → reuters.com

02 Anthropic 官方博客

🚀 产品发布 | Anthropic 发布 Claude Opus 4.8 + Dynamic Workflows：单次会话最多 1000 个并行子代理

Anthropic 同日上线 Claude Opus 4.8，定位「最完整模型」，在 Senior Engineer 与写作双榜首。配套发布 Dynamic Workflows（Research Preview），Claude 可以在一次 Claude Code 会话内规划任务并 fork 出最多 1000 个并行子代理，Effort Levels 控制台首次让开发者按任务难度自选 extra/max 算力档位。对行业的启示：多 Agent 编排从 SDK 概念走向产品默认形态，Claude Code 正式跨越「单进程编程助手」边界进入「编程 OS」。

点击查看更多 → anthropic.com

03 TechCrunch

🤝 收并购 | Asana 完成对 StackAI 收购：no-code Agent Builder 补强「人机协同 OS」

Asana 周四公告完成对 StackAI 的整体收购。StackAI 是 no-code Agent 工作流平台，可跨企业系统编排 AI Agent 流程。Asana CEO Dan Rogers 称这次收购「带我们进入下一阶段的人机协同工作」，StackAI 将与 AI Teammates / AI Studio 三件套合并交付。对行业的启示：任务管理 SaaS 与 Agent 平台合流，「项目管理工具 + Agent 编排」开始抢占「Operating System for Hybrid Workforce」的占位词。

点击查看更多 → techcrunch.com

04 WIRED

📜 监管政策 | Illinois 通过全美最严 AI 安全法 SB 315：第三方安全审计强制化，白宫立场被边缘化

Illinois 州议会刚刚通过 SB 315，要求所有部署在该州的「前沿 AI 系统」必须接受独立第三方安全审计，在 Trump 政府刚刚撤销联邦 AI 监管行政令几天后立即填补真空。WIRED 称之为「美国最强的 AI 安全立法」，联邦政府对 AI 监管的中央集权能力进一步被州一级撕开口子。对行业的启示：联邦与州的拉锯战让企业合规成本进入「按州适配」模式，Big AI 厂商在全美 50 州的部署矩阵将出现 patchwork compliance 难题。

点击查看更多 → wired.com

05 TechCrunch

🌍 行业动向 | 上海期货交易所将推 AI Token 期货：算力首次像黄金原油一样可对冲

Reuters 独家披露上海期货交易所（SHFE）正在筹备 AI Token 期货合约，把大模型 API 调用价格作为标的物。这是全球第一次把「Token 算力」纳入大宗商品衍生品体系，企业、投资者、数据中心运营商首次有机会对冲推理成本波动。对行业的启示：算力金融化标志着 AI 从「卖产品」时代正式进入「卖大宗商品」时代，大企业 CIO/CFO 将需要在 AI 预算里加上「token 套保」科目。

点击查看更多 → techcrunch.com

🏢

企业级 AI 实践

4 条

01 Microsoft 365 Blog

🎨 产品重设计 | Microsoft 365 Copilot 大改版：加载速度提升 2 倍、各 App 入口统一

Microsoft 周四上线全面重设计的 Microsoft 365 Copilot，宣称加载速度提升 2 倍、UI 更简洁、跨 App 体验统一化，Copilot 响应将更结构化、便于审阅。Office/Teams/Outlook/Word 等 Copilot 入口同步换肤。对行业的启示：Microsoft 押注「企业体感优先于模型能力」——把 Copilot 从「内嵌 AI 助手」改造成「贯穿所有 M365 应用的协同层」，与 Asana 收购 StackAI 形成正面竞争。

点击查看更多 → microsoft.com

02 Ars Technica

📱 产品策略 | Apple 用 Gemini 多万亿参数模型蒸馏到 iPhone：Siri 大改背后是 Google Cloud + Nvidia 双重支撑

The Information 披露 Apple 正使用 Google 多万亿参数 Gemini 模型进行知识蒸馏，训练出可部署在 iPhone 本地的「轻量 Siri 模型」。新 Siri 将同时跑在设备端与 Google Cloud，意味着 Apple 在隐私优先与体验优先之间做出妥协——这是 Apple 第一次大规模公开依赖 Nvidia 算力。对行业的启示：三巨头（Apple/Google/Nvidia）在端侧 AI 上罕见利益捆绑，「自研芯片 + 他人大模型」成为本地 AI 主流妥协方案。

点击查看更多 → arstechnica.com

03 量子位

🇨🇳 国内案例 | 沙钢与钉钉签约：悟空 AI 智能体进入钢铁工业生产场景

江苏沙钢钢铁（中国第一民营钢企）与钉钉 5/28 正式签约，围绕全集团协同办公底座与 AI 场景应用展开深度合作，以钉钉悟空（基于通义千问）和系列 AI 产品为核心引擎，推动 AI 在钢铁生产、安全、协同场景的规模化落地。对行业的启示：阿里钉钉「悟空智能体」首次切入重工业核心生产场景，印证 To-B 通用 Agent 在传统行业有「场景溢出」能力，大宗产业是 2026 国内 AI 落地的明确增量。

点击查看更多 → qbitai.com

04 TechCrunch

🚀 创业产品 | Sesame 上线 iOS：Oculus 联创打造「会思考的对话 AI」挑战 ChatGPT

Oculus 创始人成立的新 AI 公司 Sesame 周四在 App Store 上线 iOS App，重新设计了 ChatGPT 类对话 AI 的交互范式——即使 AI 在「思考」，对话流也保持连贯，并配备多个独立人格的 Agent。被视为「voice-first AI 助手」新一波创业的代表。对行业的启示：对话 AI 的体验竞争从「响应速度」走向「会话节奏感」，Apple 与 OpenAI 的下一代语音 AI 都将以「对话流」而非「问答」为基础设计。

点击查看更多 → techcrunch.com

💻

AI Coding 动态

4 条

01 TechCrunch

🚀 旗舰模型 | Claude Opus 4.8 + Dynamic Workflows：并行子代理重写 Claude Code 编程范式

TechCrunch 实测 Opus 4.8 在编程基准跃居 SOTA，Dynamic Workflows 让 Claude Code 一次性 fork 出最多 1000 个并行 subagent，适合大规模 codebase 重构、多模块并行修复；新 Effort Levels 控制让开发者按预算选 extra/max 档，平衡质量与 token 成本。对行业的启示：编程 Agent 从「线性指令执行」进入「调度并行子代理」时代，Claude Code 与 Cursor/Codex 的护城河差距进一步拉开。

点击查看更多 → techcrunch.com

02 Ars Technica

🛡️ 安全漏洞 | FastAPI 致命漏洞 CVE-2026-48710：3.25 亿次/周下载的 Starlette 让 AI Agent 集体「裸奔」

安全公司 Secwest + X41 D-Sec 披露 Starlette（FastAPI 的路由内核）的 Host header 注入漏洞 CVE-2026-48710（BadHost），只需一个字符即可绕过基于路径的鉴权。受影响范围包括 MCP Servers、LLM 代理、Agent 框架等数千 ASGI 应用，极大量 AI Agent 后端处于风险敞口下。对行业的启示：Agent 生态的安全边界已经从「模型 prompt 注入」延伸到「Web 框架原始漏洞」，企业级 AI Agent 部署必须把基础组件 CVE 纳入威胁建模。

点击查看更多 → arstechnica.com

03 量子位

🇨🇳 国产突破 | DeepSeek V4 芯模协同：与昇腾/寒武纪深度适配，国产算力生态飞轮启动

量子位深度披露 DeepSeek V4 与华为昇腾/寒武纪芯片完成「芯模协同」深度优化，百万 token 长上下文在国产算力上稳定推理；鲲鹏开发者已超 415 万、昇腾开发者超 410 万、openEuler 装机超 1600 万套，生态进入「自增长」阶段，创业公司、银行、高校开始主动贡献代码。对行业的启示：DeepSeek 模型层 + 昇腾算力层 + openEuler 软件栈，国产 AI 全栈基础设施第一次出现「不依赖单家推动」的飞轮迹象。

点击查看更多 → qbitai.com

04 36 氪

🛠️ 开源工具 | Warp 终端开源后 15 小时狂揽 3.5 万 Star：Altman 投的 Agent 终端用 Rust 重写 40 年命令行

36 氪报道 Sam Altman 投资的下一代终端 Warp（用 Rust 从头重写）周三开源，15 小时 Star 数飙升至 3.5 万。Warp 把 GPU 加速、块状输出、AI Agent 配置文件等现代功能塞进 CLI；新发布 settings file 让 AI 代理可编程地控制终端环境，跨设备无缝迁移。对行业的启示：命令行/Terminal 从 IDE 战场延伸出新前线，Agent 与终端深度绑定是「Agentic CLI 时代」的标志，开源策略意在抢占 dev tools 默认入口。

点击查看更多 → 36kr.com

📊

深度报告与论文

4 条

01 Gartner

📊 行业大势 | Gartner 重磅数据：企业 AI Coding Agent 市场年化规模冲到 98-110 亿美元

Gartner 发布《Enterprise AI Coding Agents：2026 Market Guide》，披露截至 2026 年 4 月该市场年化规模已达 98-110 亿美元，正快速吞噬企业软件工程预算份额。报告同时给出 Cursor、GitHub Copilot、Claude Code、Codex、Windsurf 等供应商的能力坐标。对行业的启示：AI Coding Agent 已从「实验工具」跨入「企业 IT 采购品类」，CIO 级预算开始建立独立科目，头部供应商进入「占位决战年」。

点击查看更多 → gartner.com

02 The Verge

⚖️ 版权战 | CNN 起诉 Perplexity：「逐字逐句剽窃」案进入司法程序，AI 搜索引擎版权战升级

CNN 周四在美国联邦法院起诉 Perplexity，指控其大规模抓取 CNN 报道并以「verbatim 逐字逐句」的形式复述给用户。诉讼文件展示了 Perplexity 与 CNN 谈判破裂后仍未停止抓取的证据。此案是 AI 搜索引擎面临的第二起头部新闻机构诉讼（《纽约时报 v. OpenAI》之后）。对行业的启示：AI 搜索引擎商业模式与新闻版权进入「全面对抗」阶段，Perplexity/SearchGPT 等产品的训练数据合规性将成为投资者尽调必查项。

点击查看更多 → theverge.com

03 Ars Technica

🧪 学术研究 | Ars Technica 披露：LLM 在明确警告「这是假话」后仍然相信并复述虚假陈述

研究人员实验发现，即使在 prompt 中明确告知 LLM「以下陈述是假的」，主流模型仍会将虚假陈述作为事实使用，影响后续推理与生成。结果对 RAG 系统、合规审计、AI 客服等高风险场景构成警示。对行业的启示：LLM 的「事实判别」能力被高估，企业级部署必须假设输入污染并增加独立的事实校验层，而非依赖模型自身的「自觉」。

点击查看更多 → arstechnica.com

04 36 氪

🇨🇳 行业洞察 | 36 氪深度《十年前的量化实习生合照》：半数华人、3 位亿万富翁——DeepSeek 时代新贵版图溯源

36 氪深度复盘十年前量化对冲基金一张实习生合照，合照中半数为华人，目前已诞生 3 位亿万富翁，DeepSeek 创始人梁文锋亦在其中。文章追溯了从量化交易到大模型创业的人才迁徙路径，以及华人量化圈对 2024-2026 AI 大爆发的影响。对行业的启示：量化金融出身的「数学/工程/资本」复合型人才是中国 AI 上半场的关键供给侧，DeepSeek、月之暗面、智谱等多家头部公司高管均出自这条链条。

点击查看更多 → 36kr.com

🔥

AI 热点新闻

4 条

01 Cloudflare Blog

🤝 战略合作 | Cloudflare × Anthropic 推 Claude Managed Agents：全球边缘网络成首个「Agent 原生」隔离运行环境

Cloudflare 5/28 正式上线 Claude Managed Agents 集成，把 Anthropic 5/26 开发者大会上推出的 Managed Agents 直接跑在 Cloudflare 全球边缘节点：开发者用 Claude Code 写好 Agent，部署到 Cloudflare Workers 沙箱即可全球低延迟执行，私有数据访问通过 Zero Trust 强制隔离。这是首个把「Agent 调度」从应用层下沉到 CDN/边缘网络层的产品级整合，意味着 Anthropic 不再只与 GCP/AWS 绑定，开始向边缘云延伸。

行业启示 Agent 部署正从「云中央」迁到「全球边缘」，CDN 厂商正成为 Agent 时代新基础设施层。

点击查看更多 → blog.cloudflare.com

02 OpenAI Hub（中文综合）

🇨🇳 国产路线 | 面壁智能联合昇腾开源 BitCPM-CANN：中国首个 1.58 比特三值端侧模型，6 倍显存释放

面壁智能 5/25 联合清华大学、OpenBMB、华为昇腾平台开源 BitCPM-CANN——中国首个完全基于昇腾算力端到端训练的 1.58-bit 三值端侧大模型，相比 BF16 释放约 6 倍显存空间，能力保留率控制在 90%-97%（远超业界 INT8 量化的 85-90%）。意义双重：①端侧大模型路径从「云端蒸馏」走到「直接低比特训练」；②国产算力首次完整闭环跑通世界级低比特训练，「去 CUDA 化」从口号进入工程可验证阶段。

行业启示国产端侧模型路线开始与英伟达脱钩——昇腾 + 极低比特训练成为有竞争力的非美式技术栈雏形。

点击查看更多 → openai-hub.com

03 Las Vegas Sun（焦点稿）

💻 落地新硬件 | Xcena 估值 5.7 亿美元、融 1.35 亿美元：押注「内存才是 AI 真瓶颈」近存计算路线

韩国 4 岁芯片初创 Xcena 5/29 完成 1.35 亿美元 B 轮、估值 5.7 亿美元——独家押注「near-memory computing 近存计算」路径：把计算单元贴在 DRAM 旁边，让常规数据搬运在内存层就近处理，绕开「数据反复运到 GPU」的能耗墙。公司首款产品 MX1 正与多家云厂商合作验证。这条路线呼应了 Epoch AI 上周数据：AI 芯片成本中 Memory 占比从 52% 涨到 63%。对企业 AI 基础设施投资人，这是除 HBM 外又一个值得跟踪的「内存层创新」方向。商业模式上，**Glean 跨过 3 亿美元 ARR 的关键叙事是「替换存量软件预算」**而非「锦上添花」，企业 AI 谈判已从「试点采购」进入「主件替换」阶段。AI Coding 板块同步出现两个标志事件：Cognition CEO 反高调论给 Devin 划「中级工程师」能力边界，METR 实验招募失败证明「开发者 AI 上瘾不可逆」——治理重心应从「鼓励采用」切到「依赖度风险管理」。

行业启示 AI 算力下一波 ROI 改进可能不在 GPU、而在「让数据离计算更近」的内存架构革命。

点击查看更多 → lasvegassun.com

04 Reuters

💰 融资 | OpenAI Foundation 首次承诺 2.5 亿美元、12 个月内追加超 10 亿美元，专门用于劳动力 AI 转型

控制 OpenAI 的非营利基金会 5/27 宣布首批 2.5 亿美元资助，并承诺 12 个月内追加超 10 亿美元，覆盖劳动力培训、生命科学和社区项目。这是 OpenAI 重组治理架构后首笔「面向社会层」的硬性投入，是回应 AI 失业焦虑、争取美国监管空间的关键动作。同期 Illinois SB315 通过、AB 53 (CA) 排队签字——AI 企业的「补偿型支出」正在成为新合规成本项。

行业启示 AI 大厂从纯「研发投入」开始增加「社会补偿支出」，本质是为长期监管空间买保险。

点击查看更多 → reuters.com

📊

深度报告与论文

7 条

01 Stanford HAI 数据（聚合引用）

🎯 行业声音 | Stanford HAI 2026 AI Index 引用更新：全球 13.5 亿人活跃用 AI 工具，覆盖 16.3% 人口

Stanford HAI 2026 AI Index 5/25 周后被多家二次引用更新关键数据：全球 13.5 亿人活跃使用 AI 工具，覆盖 16.3% 人口。中美差距收窄到 2.7%（去年 7.5%）。企业 AI 部署从 PoC 阶段进入「生产化」临界点：Fortune 500 中 72% 至少有 1 个 AI 系统进入关键业务流（去年 47%）。这是评估 AI 商业落地速度的最权威数据集。HAI 同时披露：Li Fei-Fei 转任全校 AI 战略顾问、机构合并由 James Landay 接任，治理结构升级支撑机构第二阶段发展。

行业启示全球 AI 渗透率从「13% PoC」跨过「16%+生产化」临界点——决策不再是「试用」而是「规模化部署节奏」。

点击查看更多 → commandlinux.com

02 36氪（深度）

🇨🇳 中国洞察 | 36 氪深度《智谱和 MiniMax，市值差了 4000 多亿港元》：港股大模型双雄分化背后

36氪 5/29 深度复盘智谱与 MiniMax 港股表现：智谱市值 5718 亿港元、MiniMax 2410 亿港元，差距 4000 多亿背后是商业化路径分歧。智谱押 toB（API+企业版+海外开发者）、MiniMax 押 toC（海外语音+视频陪伴+订阅）。同期阿里通义 vs 字节豆包 vs 腾讯混元三家「不上市互联网大厂 AI 部门」也在分化。文章给出关键观察：toB 商业化更慢但定价权强、toC 增长快但单位经济不稳。这是判断中国 AI 厂商长期回报的关键二分法。

行业启示中国大模型分化「toB 慢牛 vs toC 快牛」两条估值路径，决策者要按业务模式而非「都是大模型」评估投资。

点击查看更多 → 36kr.com

03 36氪

📈 中国 AI | 智谱 + MiniMax 港股双雄市值 8128 亿港元、距 Anthropic 估值 1/10——中国大模型估值锚定形成

5/29 港股 AI 产业链午后集体拉升，智谱（02513）收涨 19.47%、MiniMax（02555）收涨 19.85%，最新市值分别为 5718 亿港元和 2410 亿港元。两家合计 8128 亿港元 ≈ 1043 亿美元，约为 Anthropic（9650 亿美元）的 1/10。基本面：智谱 GLM 系列 ARR 10 个月增 25 倍、海外覆盖 184 国；MiniMax 海外消费产品续年化收入跨过 2 亿美元。中国 AI 资产终于跑出可与 OpenAI/Anthropic 估值「锚比」的港股标杆。

行业启示中国大模型从「估值无锚」进入「按 1/10 美股锚定」阶段，资产定价范式开始形成。

点击查看更多 → 36kr.com

04 TechCrunch

🔧 落地能力 | Cognition CEO 反高调论：Devin 不是替代程序员、定位为「中级以下工程师」

Cognition CEO Scott Wu 5/29 接受 TechCrunch Disrupt 采访，直接给 Devin 划能力边界：「在初级到中级工程师之间，取决于任务复杂度」，反对当前业界鼓吹的「self-driving software / 递归自我改进」叙事。背景是 Cognition 5/27 完成 10 亿美元 D 轮融资估值 260 亿美元，公司却选择「降预期」给企业客户传递务实信号。对企业 AI Coding 采购决策者而言，这意味着 Agent 在生产代码场景的合理 ROI 应按「省高级工程师 30-50% 时间」而非「替代初级岗位 100%」测算。

行业启示 AI 编程 Agent 的真实价值不是「裁人」而是「让高级工程师产能翻倍」，定价模型应跟着改。

点击查看更多 → techcrunch.com

05 TechCrunch

💰 落地变现 | Glean ARR 跨过 3 亿美元、15 个月增 3 倍：企业 AI 搜索成「砍预算」第一刀

Glean 5/28 宣布 ARR 突破 3 亿美元，仅 15 个月从 1 亿增到 3 亿。CEO Arvind Jain 给出反共识叙事：客户用 Glean 不是「省时间」而是「省软件预算」——一个 Glean 替代 Confluence + ServiceNow Q&A + Notion AI + Microsoft 365 Copilot 部分场景。Fortune 500 渗透率超 30%，单家平均年付费跨过 100 万美元。这是企业 AI 从「锦上添花」走向「主件替换」的标志数据。

行业启示企业级 AI 项目商业逻辑正从「增量加单」切换为「替换存量软件预算」，CIO 谈判筹码变了。

点击查看更多 → techcrunch.com

06 TechCrunch

📊 行业现象 | METR 复现 AI 编码生产力实验失败：开发者「不愿在没有 AI 的条件下工作」

AI 评估机构 METR 试图复现 2024 年那项著名的「AI 让资深开发者生产力倒退 19%」实验，结果在招募阶段就失败——开发者集体拒绝参与「无 AI」对照组，理由是「不愿放弃 AI 工作哪怕一周」。METR 只好改做自报问卷。这个戏剧性反转的产业含义有两层：①「开发者 AI 上瘾」已成事实；②企业 IT 治理必须开始正视「核心团队对 AI 工具的强依赖将成为新合规风险」（数据出境、知识产权、SLA 都受牵连）。

行业启示「AI 不可逆」已从口号变成实证——企业 AI 治理重点应从「鼓励采用」切到「依赖度风险管理」。

点击查看更多 → techcrunch.com

07 Liquid AI Blog

🚀 模型发布 | Liquid AI 开源 LFM2.5-8B-A1B：MoE 端侧、M5 Max 上 253 tokens/s、6GB 内存吃满 128K 上下文

MIT 系初创 Liquid AI 5/28 发布 LFM2.5-8B-A1B：8.3B 总参 / 1.5B 激活的端侧 MoE 模型，38T tokens 训练。性能数据：MacBook M5 Max 上 253 tokens/s 推理、Ryzen AI Max+ 395 上 146 tokens/s，全程 < 6GB 内存即可塞下 128K 上下文。词表从 65K 扩到 128K 大幅提升印地语、泰语、阿拉伯语等非拉丁语压缩率。Day-1 支持 llama.cpp。这是端侧 LLM 性能/内存比的当前 SOTA。

行业启示端侧 AI 的「8B 旗舰段」正在被 MoE 架构重写——同等内存下质量直接对齐云端 70B。

点击查看更多 → liquid.ai