AI 日报 | 2026-03-17
OpenAI Codex 子代理 GA;Qwen 3.5 Chat Template 修复 21 个工具调用 bug;Mistral 发布 Lean 4 代码证明助手
🦞 AI 日报 | 2026-03-17
📰 今日深度
1. OpenAI Codex 子代理正式发布,支持自定义 Agent 编排
来源:Simon Willison / OpenAI
OpenAI 昨日宣布 Codex 子代理功能正式上线,此前已在预览阶段测试数周。子代理允许开发者定义多个专用 Agent(如"explorer"、"worker"、"default"),通过 TOML 配置文件在 ~/.codex/agents/ 中自定义指令和模型选择,包括使用 gpt-5.3-codex-spark 等高速模型。
这一模式已成为编码 Agent 的行业标准。Simon Willison 的文档汇总显示,Claude Code、Gemini CLI、Mistral Vibe、OpenCode、VS Code 和 Cursor 都已支持类似的子代理架构。官方示例展示了如何通过单条 prompt 协调多个 Agent:Investigate why the settings modal fails to save. Have browser_debugger reproduce it, code_mapper trace the responsible code path, and ui_fixer implement the smallest fix once the failure mode is clear.
对于使用 Codex 的开发者,这意味着可以为不同任务类型分配专用 Agent,提高复杂工程任务的成功率。如果你的工作流涉及多步骤代码调试或大规模并行任务,子代理的并行执行能力值得探索。
🔗 https://simonwillison.net/2026/Mar/16/codex-subagents/
2. Qwen 3.5 Chat Template 修复 21 个工具调用 bug,支持并行 Agent 工作流
来源:r/LocalLLaMA
一位开发者在运行 Qwen 3.5 35B 进行 Agent 工作流时遇到官方 Chat Template 的多个 bug,花时间逐一修复后发布了改进版本。修复涵盖工具调用崩溃、并行调用失败、Agent 循环中断等 21 个问题。
这对于在本地部署 Qwen 3.5 进行 Agent 应用的开发者很有参考价值。官方模板的这些 bug 会导致工具调用不稳定,特别是在需要多工具并行执行或长循环 Agent 任务时。如果你正在用 Qwen 3.5 构建本地 Agent 系统,这个修复版本可以显著提升稳定性。
⚡ 快讯
-
我做了一个可视化拖拽 ML 训练器,无需代码,免费开源 — 厌倦了重复写 ML 样板代码的开发者分享了自己的工具,支持图形化配置模型训练流程 r/artificial → 如果你经常快速原型化 ML 模型,这个工具可以省掉不少重复代码
-
Picsart 推出 AI Agent 市场,创作者可"雇佣"AI 助手 — Picsart 的 AI Agent 市场将上线四个 Agent,让创作者通过市场化方式获取专用 AI 工具 TechCrunch AI → 内容创作者可以关注,未来可能有更多垂直领域的 Agent 市场出现
-
GPT-5.4 一周狂赚 10 亿美元 ARR,单次调用成本 80 美元但效率飙升 32 倍 — OpenAI 新模型创造了历史新高的收入记录,尽管单次调用成本高但用户因效率提升而接受 量子位 → 高成本模型的商业模式正在转变,从"便宜"转向"高效",值得关注你的 API 成本与收益比
-
NVIDIA GTC 2026 实时更新:CEO Jensen 分享 AI 最新进展 — NVIDIA 年度大会在圣何塞举行,CEO 分享了 AI 基础设施的最新动向 NVIDIA AI Blog → 关注 NVIDIA 的硬件和软件生态更新,可能影响你的 AI 基础设施选择
-
新 AI 翻译工具引发游戏保护社区分裂 — 创作者因使用 Patreon 资金开发 Gemini 驱动的翻译工具而道歉,引发关于 AI 在游戏本地化中的伦理讨论 Ars Technica AI → 游戏本地化社区对 AI 工具的态度仍有分歧,如果你在这个领域工作需要谨慎沟通
-
我搭建了一个系统让 5 个 AI 模型辩论地缘政治危机 — 开发者构建了一个管道,让 Claude、GPT-4o、Gemini 等模型就同一话题进行自主论证 r/artificial → 多模型对比和论证的工作流可以用于决策支持或内容生成,值得参考这个架构
-
NVIDIA DSX Air 加速 AI 工厂的部署时间 — NVIDIA 推出模拟工具,通过加速仿真降低 AI 工厂的部署周期 NVIDIA AI Blog → 大规模 AI 基础设施的部署成本在下降,这对初创公司的 AI 基础设施建设有利
-
我终于找到了让 ChatGPT 写得像人类的 prompt(免费) — 一位用户花了一年时间反向工程 ChatGPT,发现了能显著改善输出风格的 prompt 技巧 r/ChatGPT → 如果你经常用 ChatGPT 写文案,这个 prompt 可能值得试试
-
Anthropic 对齐科学团队成员讨论黑客勒索演习 — Anthropic 内部进行了模拟黑客勒索场景的对齐测试 Simon Willison → AI 安全测试的方法论在演进,包括对抗性场景模拟
-
OpenAI 心理健康专家团队一致反对"调皮"ChatGPT 功能上线 — OpenAI 内部专家对某项新功能的伦理风险提出警告,涉及 AI 在敏感话题上的行为边界 Ars Technica AI → 关注 OpenAI 的功能发布,某些新能力可能涉及伦理争议
🔮 博客选题
- 选题:用 Red-Green TDD 提升 Coding Agent 输出质量:实操指南
- 切入角度:基于 Simon Willison 在 Pragmatic Summit 分享的实战经验,写一篇"周末就能上手"的教程——如何在 Claude Code、Cursor、OpenCode 中配置 TDD 工作流,包括 prompt 模板、测试框架选择、Showboat 式手动验证的具体步骤,附前后对比效果。重点是"只需加五个 token 就能显著提升代码质量"这个实用技巧
- 来源新闻:Simon Willison 的 Pragmatic Summit 演讲分享