系统设计 | zjding'Log

不要低估Autoresearch所带来的影响

Karpathy 前几天在Twitter上讲了个故事，他睡前启动了一个 630 行的 Python 脚本。醒来时，83 次实验已经跑完，15 次改进被保留，验证损失从 0.9979 降到 0.9697。他继续让它跑了两天——700 次实验，20 个可叠加的训练优化，迁移到更大模型后训练速度快了 11%。Shopify CEO Tobi Lütke 拿到代码的第二天早上，报告了 19% 的性能提升。 ...

两小时，一个 Sonnet，七万星仓库的完整移植

583 次工具调用，311 个请求，58 美元。Random Labs 用一个 Sonnet 模型——不是 Opus，不是 o1——把一个 7 万星的 Python 库完整移植成了 TypeScript。两个小时，全程自主运行。 ...

给 AI 做软件的反直觉法则：越旧越好

TiDB Cloud 上每天新建的集群，超过 90% 是 AI Agent 创建的。不是人类开发者点按钮，是 Agent 自己调 API 拉起来的。这个数字改变了一个根本性的设计问题：当你的软件的主要用户不再是人，它应该长什么样？ ...