AI 日报 | 2026-05-09 周六
Claude for Office正式GA发布,覆盖Excel/PowerPoint/Word+Outlook公测,获得30256互动引爆企业AI办公赛道。Alex Albert披露Firefox团队在Claude Mythos Preview辅助下单月修复的安全漏洞超过过去15个月总和(11614❤️)。Sam Altman两连发:帮助开发者从程序员进化成超级英雄(3046❤️)+OpenAI将帮助企业安全建设(1439❤️)。arXiv新论文聚焦MoE架构创新(UniPool/EMO)和训练自由推理(BAMI/GUI Grounding)。Stability AI发布SD-XL 1.0宽松许可开源。Madhu Guru离任Google,曾从零构建Gemini业务。
今日看点
- 1.Claude for Office GA发布:Excel/PowerPoint/Word全面可用+Outlook公测,获30256互动
- 2.Alex Albert:Firefox在Claude Mythos Preview辅助下单月修复安全漏洞超过过去15个月总和(11614❤️)
- 3.Sam Altman:帮助开发者进化成超级英雄比替代他们更酷(3046❤️)
- 4.Sam Altman:OpenAI将帮助企业快速进行安全建设(1439❤️)
- 5.steipete:/goal+GPT 5.5可完成带e2e测试的深度重构(1957❤️)
📄 前沿论文
当前MoE架构中每层Transformer独占一组专家,深度扩展时专家数量线性增长。UniPool提出跨层全局共享专家池,打破逐层分配惯例,在同等参数量下提升模型容量利用率。
大模型通常作为单体系统部署,即使应用只需代码或数学等子能力也必须加载全量参数。EMO通过MoE预训练使模型自然涌现模块化结构,推理时可按需激活特定专家子集。
GUI Agent执行点击拖拽等操作时,在ScreenSpot-Pro等复杂基准上常因位置偏见而失败。BAMI提出无需额外训练的偏见缓解方法,直接提升现有模型的GUI Grounding准确率。
LLM虽能解决科学和数学问题,但难以生成有效、有挑战且新颖的问题——这是合成训练数据的核心障碍。本文提出用验证器反向驱动难题生成,确保生成的问题既困难又可解。
👷 AI Builder 动态
Firefox 团队在 Claude Mythos Preview 的辅助下,4月份修复的安全漏洞数量超过过去 15 个月的总和。这是 AI 辅助安全审计的标志性案例。
/goal + GPT 5.5 体验令人惊叹。现在可以规划包含端到端测试的深度重构,并且一切正常运行。Claws 之间已有对话能力,Molty 正在学习如何委派 cron 任务。
正式离开 Google。在 Google 期间帮助从零构建了两个业务:先是搜索与广告,后是 Gemini。三年前 OpenAI 和 Anthropic 领先,团队迎头赶上。
AI 平台战争即将到来。讨论了 xAI 算力交易、Anthropic Managed Agents、以及 Anthropic 如何将 API 转变为完整云平台的战略。
GBrain 新增 thin-client 模式。Claude Code 或 Hermes 等二级 Agent 无需运行自己的 MCP 服务器,可直接通过 MCP 使用 GBrain。GStack 是个人 Claude Code 设置,在 Mac/PC 的 headed 模式下运行 /pair-agent 让 Claw/Hermes 进行网页交互。
🐙 GitHub 热门项目
🌐 社区热点
教育科技平台 Canvas 遭遇数据泄露,黑客组织 ShinyHunters 威胁公开大量学校数据。HN 热议中获 890 分。