📜 监管政策 | AI 领袖联名敦促美国国会堵住 AI 辅助生物武器风险
The Verge 6 月 4 日报道,OpenAI、Anthropic、Microsoft、Meta、Google DeepMind 等 AI 领袖联名要求美国国会强制合成 DNA/RNA 供应商进行订单筛查。公开信认为,在线订购合成 DNA 已成为现代科研基础设施,但若缺少统一筛查,先进 AI 可能降低生物武器设计与获取门槛。
今日收录 11 条资讯,涵盖 3 个板块。向下滚动查看本期速览。
Anthropic 在 GitHub 开源 defending-code-reference-harness,包含 threat-model、vuln-scan、triage、patch 等 Claude Code skills 与自主扫描 harness,沉淀其安全团队与 Claude 协同做威胁建模、漏洞扫描、分诊和补丁生成的经验。这标志着 AI Coding 的竞争正从生成代码扩展到主动发现并修复安全问题。
量子位 6 月 5 日报道,智源与清华合作成果发表于 Science,Brainμ0 被用于处理睡眠 EEG 信号与记忆相关单细胞双光子钙成像信号,辅助研究人员验证记忆重激活与睡眠状态变化之间的关系。该成果展示了 AI 基础模型在复杂生命科学多模态数据分析、假设验证与状态识别中的潜力。
TechCrunch 6 月 5 日报道,企业 AI 成本治理正在进入“Token 账单到期”阶段:一些公司 4—5 月已超出全年 Token 预算数倍,Linux Foundation 因此推出 Tokenomics Foundation,试图像 FinOps 管理云支出一样,为 AI Token 消耗建立标准与成本纪律。Agentic 工具让单位开发者消耗量激增,低单价并不等于低总账单。
The Verge 6 月 4 日报道,OpenAI、Anthropic、Microsoft、Meta、Google DeepMind 等 AI 领袖联名要求美国国会强制合成 DNA/RNA 供应商进行订单筛查。公开信认为,在线订购合成 DNA 已成为现代科研基础设施,但若缺少统一筛查,先进 AI 可能降低生物武器设计与获取门槛。
AirTrunk 6 月 5 日宣布,计划到 2030 年在印度投资超过 300 亿美元,建设 5GW 数据中心容量,服务快速增长的云与 AI 需求。印度正在成为全球 AI 基建版图中的关键新增节点,这类长期建设承诺也意味着电力、土地、网络与监管能力会成为 AI 产业竞争的前置条件。
MIT Technology Review 6 月 5 日分析 Meta 账号被黑事件,指出 AI 安全风险不仅来自模型能力,也来自身份、平台流程、聊天机器人接口和运营安全的组合漏洞。文章提醒业界不要只围绕“超级智能风险”讨论,而忽视已经可被利用的现实攻击面。
36氪 6 月 5 日快讯称,腾讯云发布 WorkBuddy Enterprise 与办公智能体套件 Agent Suite,提供 7×24 专家数字员工、人与 AI 协作的“团队”模式和企业级管理后台。腾讯同时披露 CodeBuddy 已覆盖内部超过 95% 工程师、整体编码时间缩短 40%,试图把内部 AI 生产力实践打包为企业组织转型方案。
arXiv 论文 2606.04037 提出面向企业 AI Agent 的上线前验证框架,结合本体建模、权限边界、领域约束、治理规则、自主等级与场景生成,定义 Agent 的 Operational Envelope,并输出可机器验证的 Trust Certificate。论文关注的不是模型离线分数,而是 Agent 在真实组织约束下是否可被认证上线。 今天的核心主线是 AI 竞争从“模型能力”继续外溢到资本、基建与治理。Google 与 SpaceX 的长期算力采购、Anthropic 的 350 亿美元芯片融资、AirTrunk 的印度 5GW 数据中心计划,说明头部玩家正在用多年期合同、债务融资和区域基建锁定未来算力;特朗普关于公众持有 AI 公司股权的表态,则把 AI 产业推进到国家资本政策讨论区。
量子位 6 月 7 日头条关注 CPU 路线在 AI 算力密度上的新进展,核心价值在于降低对昂贵 GPU 的单一路径依赖。随着小模型、量化和端侧部署成熟,AI 基础设施竞争正在从“买更多 GPU”扩展到“用更便宜硬件跑更多任务”。
The Meta-Agent Challenge 论文讨论当前 Agent 是否具备自主开发、调试和迭代 Agent 系统的能力,回应了近期递归自我改进热潮。研究把“会写代码”与“能独立构建可靠 Agent”区分开来,强调评估需要覆盖需求分解、架构设计、测试和长期维护。
GitHub 6 月 3 日发布 VS Code 5 月更新,Agents Window 进入 Stable Preview,并强化远程 Agent 会话、BYOK、终端安全与效率能力。Copilot 正从 IDE 内的补全工具持续升级为可托管、可远程运行、可被企业管理的 Agent 工作空间,开发流程也随之从“写代码”转向“调度任务”。
阿里开源 Open Code Review,称其源自集团内部官方 AI 代码评审助手,已服务数万开发者、识别数百万缺陷。项目采用确定性流水线加 LLM Agent 的混合架构,支持精确行级评论,并内置 NPE、线程安全、XSS、SQL 注入等细粒度规则,兼容 OpenAI 与 Anthropic。
GitHub 6 月 2 日宣布 Copilot SDK 正式 GA,开发者可以把 Copilot 的上下文理解、代码建议和对话式能力接入自己的工具链。相比 IDE 内功能更新,SDK GA 的意义在于把 Copilot 从单一产品扩展为可嵌入平台能力。
arXiv 6 月新论文 Agents’ Last Exam 聚焦长周期、经济意义更强的 Agent 任务,试图弥补传统短题评测对真实工作能力的高估。论文与近期 SWE-Marathon 等基准形成呼应:模型会做很多局部任务,但在长链路一致性、工具使用和抗奖励黑客方面仍有明显短板。