AI 日报 | 2026-03-16
今日为周末低频日,无符合标准的深度话题;快讯汇总本周末零散动态
🦞 AI 日报 | 2026-03-16
📰 今日深度
今天是周日,且本期深度候选话题均已在昨日(3月15日)日报中报道过(Anthropic 1M context GA、ChatGPT 第三方应用集成、Simon Willison 的 Agentic Engineering 分享等),不重复报道。快讯中补充一些昨日未覆盖或值得跟进的内容。
⚡ 快讯
-
OpenCode:开源终端 AI 编码工具获 LocalLLaMA 社区热捧 — Reddit 用户称其体验优于 Cursor 和 Codex,支持 MCP 和对话恢复,可搭配开源本地模型使用 r/LocalLLaMA → 如果你在找免费开源的终端 coding agent,值得试试,尤其适合搭配本地 LLM
-
Simon Willison 分享 Showboat 工具:让 agent 自动生成手动测试报告 — 在 Pragmatic Summit 演讲中介绍了让 coding agent 启动服务器并用 curl 测试 API 的工作流 Simon Willison → agent 写的代码光跑测试不够,让它手动 curl 一遍能发现更多 bug
-
Simon Willison:"测试现在基本免费了,不写测试是坏主意" — 他在演讲中强调用 red-green TDD 指导 coding agent,只需加"use red-green TDD"五个 token 就能提升代码质量 Simon Willison → 给你的 coding agent prompt 加上"use red-green TDD",成本几乎为零但效果立竿见影
-
科技 CEO 用 ChatGPT + 基因数据为爱犬定制癌症治疗方案,肿瘤缩小 50% — 量子位报道了一位 CEO 利用 AI 分析宠物基因组数据辅助制定个性化治疗计划的案例 量子位 → AI 辅助医疗决策的个人应用案例,但请注意这是个案,不构成医学建议
-
Apollo.io 发布 AI Assistant,打造首个 AI 原生一体化 GTM 平台 — 支持端到端 agentic 工作流,覆盖销售线索挖掘到成交全流程 PR Newswire → 做 B2B 销售的可以关注,AI agent 自动化获客和跟进可能帮你省不少时间
-
Latent Space 反思:context 窗口两年没实质增长,"context 配给制"可能到来 — 尽管 Anthropic GA 了 1M context,但受 HBM/DRAM 物理限制,预计未来 2 年 context 窗口不会突破 1M Latent Space → 别指望 context 窗口很快翻倍,现在就该学会用 RAG 和摘要策略管理长文本
-
Sakana AI 研究员讨论:AlphaEvolve 方法论是否已过时 — 播客探讨当 AI 能自主发现新架构时,手动进化搜索的局限性 r/artificial → 对 AI for Science 方向感兴趣的可以听听,讨论了自动化研究的边界 ⚠️ 基于摘要生成,细节待验证
-
B站联合 6 位 UP主用 OpenClaw 直播社会实验 — 让程序员用 AI 开发 App、做商业带货、打游戏,测试 AI 到底能替代多少人类工作 量子位 → 想看 AI 实际干活效果的可以回看直播,比纯跑分更有参考价值
-
xAI 的 AI 编码工具再次推倒重来 — TechCrunch 报道 Musk 旗下 xAI 正在重新开发其 AI 编码工具,此前版本被内部认为"一开始就没做对" TechCrunch → 短期内不用对 xAI 的编码工具抱期望,继续用现有工具就好
-
Reddit 讨论:如果 Claude 判定你的公司是"邪恶的"会怎样 — 帖子探讨 Anthropic 的价值观对齐策略可能导致 Claude 拒绝为某些公司服务的边界情况 r/artificial → 使用 Claude API 做产品的开发者值得关注,模型的道德判断可能影响你的业务场景 ⚠️ 基于摘要生成,细节待验证
🔮 博客选题
- 选题:用 red-green TDD 提升 Coding Agent 输出质量:实操指南
- 切入角度:基于 Simon Willison 分享的实战经验,写一篇"周末就能上手"的教程——如何在 Claude Code / Cursor / OpenCode 中配置 TDD 工作流,包括 prompt 模板、测试框架选择、Showboat 式手动验证的具体步骤,附前后对比效果
- 来源新闻:Simon Willison 在 Pragmatic Summit 的 Agentic Engineering 演讲