所有标签
标签: "agent"
论文精读 002 — Kernel Design Agents: 一个会造高性能 GPU kernel 的 agent 循环
HAN Lab 的“Kernel Mafia”把编程 agent 对准 MLSys-2026 Blackwell kernel 竞赛, 靠让 agent 自己跑优化循环拿到了名次。 细读 Kernel Design Agents(KDA): Humanize 的规划-执行-验证循环、 KernelWiki、 ncu-report-skill、 shape-aware 自调优、 竞赛结果、 以及 reward-hacking 的失效模式 —— 并映射到要在 AMD 上重建它需要什么。 手写 SVG 图, 双语。
论文精读 001 — Polar: 不打开盒子也能训练 Agent
Polar(arXiv 2605.24220, 出自 NVIDIA)训练语言 agent 的办法是代理它的 LLM API 调用, 而不是重写 harness。 集成点从 agent 本身挪到了模型 endpoint —— 正是我们用 SGLang 已经在跑的那道缝。 细读它的架构、 四步代理、 token-faithful prefix merging, 以及 SWE-Bench 结果, 配手写 SVG 图。