返回日报列表
2026-05-09

AI 日报 | 2026-05-09 周六

Claude for Office正式GA发布,覆盖Excel/PowerPoint/Word+Outlook公测,获得30256互动引爆企业AI办公赛道。Alex Albert披露Firefox团队在Claude Mythos Preview辅助下单月修复的安全漏洞超过过去15个月总和(11614❤️)。Sam Altman两连发:帮助开发者从程序员进化成超级英雄(3046❤️)+OpenAI将帮助企业安全建设(1439❤️)。arXiv新论文聚焦MoE架构创新(UniPool/EMO)和训练自由推理(BAMI/GUI Grounding)。Stability AI发布SD-XL 1.0宽松许可开源。Madhu Guru离任Google,曾从零构建Gemini业务。

今日看点

  • 1.Claude for Office GA发布:Excel/PowerPoint/Word全面可用+Outlook公测,获30256互动
  • 2.Alex Albert:Firefox在Claude Mythos Preview辅助下单月修复安全漏洞超过过去15个月总和(11614❤️)
  • 3.Sam Altman:帮助开发者进化成超级英雄比替代他们更酷(3046❤️)
  • 4.Sam Altman:OpenAI将帮助企业快速进行安全建设(1439❤️)
  • 5.steipete:/goal+GPT 5.5可完成带e2e测试的深度重构(1957❤️)

📄 前沿论文

UniPool: 跨层共享专家池重构MoE架构

arXiv

当前MoE架构中每层Transformer独占一组专家,深度扩展时专家数量线性增长。UniPool提出跨层全局共享专家池,打破逐层分配惯例,在同等参数量下提升模型容量利用率。

EMO: MoE预训练实现涌现模块化

arXiv

大模型通常作为单体系统部署,即使应用只需代码或数学等子能力也必须加载全量参数。EMO通过MoE预训练使模型自然涌现模块化结构,推理时可按需激活特定专家子集。

BAMI: 无需训练的GUI Grounding偏见缓解

arXiv

GUI Agent执行点击拖拽等操作时,在ScreenSpot-Pro等复杂基准上常因位置偏见而失败。BAMI提出无需额外训练的偏见缓解方法,直接提升现有模型的GUI Grounding准确率。

ActCam: 零样本联合相机与3D动作控制视频生成

arXiv

面向艺术创作场景,ActCam实现零样本同时控制演员动作和摄像机轨迹的视频生成,无需针对特定动作或运镜进行微调。

Verifier-Backed Hard Problem Generation: 用验证器生成高质量数学难题

arXiv

LLM虽能解决科学和数学问题,但难以生成有效、有挑战且新颖的问题——这是合成训练数据的核心障碍。本文提出用验证器反向驱动难题生成,确保生成的问题既困难又可解。

无基准如何验证LLM安全评分

arXiv

多语种、多行业、多监管体系的LLM安全评估往往缺乏标注基准。本文形式化了'无基准设置'下的比较性安全评分验证问题,为新兴市场和垂直领域的安全评估提供方法论。

🏢 大厂博客

Anthropic / X原文 →
Google AI Blog原文 →
Stability AI / GitHub原文 →

👷 AI Builder 动态

Alex Albert (Anthropic)X/Twitter

Firefox 团队在 Claude Mythos Preview 的辅助下,4月份修复的安全漏洞数量超过过去 15 个月的总和。这是 AI 辅助安全审计的标志性案例。

Sam Altman (OpenAI)X/Twitter

帮助软件开发者从程序员'宝可梦进化'成超级英雄,比尝试替代他们要酷得多。现在一个真正优秀的人能做到的事情令人难以置信。

Sam Altman (OpenAI)X/Twitter

OpenAI 希望帮助企业进行安全建设,并认为需要迅速启动这项工作。

Peter Steinberger (steipete)X/Twitter

/goal + GPT 5.5 体验令人惊叹。现在可以规划包含端到端测试的深度重构,并且一切正常运行。Claws 之间已有对话能力,Molty 正在学习如何委派 cron 任务。

Madhu Guru (ex-Google Gemini)X/Twitter

正式离开 Google。在 Google 期间帮助从零构建了两个业务:先是搜索与广告,后是 Gemini。三年前 OpenAI 和 Anthropic 领先,团队迎头赶上。

Dan Shipper / Kieran KlaassenX/Twitter

AI 平台战争即将到来。讨论了 xAI 算力交易、Anthropic Managed Agents、以及 Anthropic 如何将 API 转变为完整云平台的战略。

Aaron Levie (Box)X/Twitter

当 AI 让某件事变得容易做时,应默认这对所有人同样成立。如果对所有人成立,竞争力量将确保利润流向消费者而非生产者。

Garry Tan (Y Combinator)X/Twitter

GBrain 新增 thin-client 模式。Claude Code 或 Hermes 等二级 Agent 无需运行自己的 MCP 服务器,可直接通过 MCP 使用 GBrain。GStack 是个人 Claude Code 设置,在 Mac/PC 的 headed 模式下运行 /pair-agent 让 Claw/Hermes 进行网页交互。

Amjad Masad (Replit)X/Twitter

被称作史上最具病毒性的请愿书托管在 Replit 上。

🐙 GitHub 热门项目

📦
prompts.chat161,845

前身为 Awesome ChatGPT Prompts。分享、发现和收录社区提示词的免费开源项目,支持自托管。

📦
huggingface/transformers160,402

Transformers 模型定义框架,支持文本、视觉、音频和多模态领域最先进的机器学习模型。

📦
LifeManga235

iOS Swift 应用,结合 OpenAI GPT-Image 生成日式漫画风格 AI 艺术作品。

🌐 社区热点

Canvas 数据泄露:ShinyHunters 威胁公开学校数据

Hacker News[890 pts]

教育科技平台 Canvas 遭遇数据泄露,黑客组织 ShinyHunters 威胁公开大量学校数据。HN 热议中获 890 分。

AI 正在打破两种漏洞文化

Hacker News[143 pts]

AI 辅助代码生成正在同时影响安全研究人员和攻击者的工作方式,传统漏洞发现和修复文化面临范式转变。

Podman 无根容器与 Copy Fail 漏洞利用

Hacker News[108 pts]

Podman 无根容器模式下的 Copy Fail 漏洞技术分析,涉及容器逃逸和安全边界问题。

The MAD Podcast: OpenAI 董事会成员 Zico Kolter 谈前沿 AI 真实风险

YouTube / The MAD Podcast

Matt Turck 对话 OpenAI 董事会成员、CMU 机器学习系主任 Zico Kolter,深度讨论 AI 安全、AI 安全攻防、Agent 和前沿 AI 的真实风险。