Jinn's Hub
about / blog / projects / EN /

Jin Pan

ML Systems / LLM Inference / RL Infrastructure

威斯康星大学麦迪逊分校计算机科学二年级 MS/PhD 学生,研究方向为 ML Systems。SGLang 社区贡献者,目前在 AMD GenAI 团队实习,专注 RL 系统和 GPU 核函数优化。

更多关于我 →

最新文章

查看全部
  • 论文精读 002 — Kernel Design Agents: 一个会造高性能 GPU kernel 的 agent 循环
    HAN Lab 的“Kernel Mafia”把编程 agent 对准 MLSys-2026 Blackwell kernel 竞赛, 靠让 agent 自己跑优化循环拿到了名次。 细读 Kernel Design Agents(KDA): Humanize 的规划-执行-验证循环、 KernelWiki、 ncu-report-skill、 shape-aware 自调优、 竞赛结果、 以及 reward-hacking 的失效模式 —— 并映射到要在 AMD 上重建它需要什么。 手写 SVG 图, 双语。
  • 论文精读 001 — Polar: 不打开盒子也能训练 Agent
    Polar(arXiv 2605.24220, 出自 NVIDIA)训练语言 agent 的办法是代理它的 LLM API 调用, 而不是重写 harness。 集成点从 agent 本身挪到了模型 endpoint —— 正是我们用 SGLang 已经在跑的那道缝。 细读它的架构、 四步代理、 token-faithful prefix merging, 以及 SWE-Bench 结果, 配手写 SVG 图。
  • 源码精读 006 — FlyDSL, 一个用 MLIR 撑骨架的 layout 代数 Python DSL
    AMD 的 FlyDSL 是 Fly dialect MLIR 编译器的 Python 前端, 把 layout 代数和 copy / MMA atom 一路 lower 到 CDNA3 / CDNA4 的 ROCDL。 examples 目录下 vectorAdd、 tiledCopy、 tiledMma、 preshuffle GEMM 四个例子构成一条严格的进阶阶梯, 按顺序读完, 你就掌握了 paged attention、 MoE GEMM、 flash attention 这些 production kernel 反复重组的所有零件。
  • FlyDSL 笔记 · Layout 之下的 BasisAttr
    上一篇 FlyDSL 精读把 layout 代数收在了五个词上, 这篇补的是更深一层的子概念 —— Fly_Basis 类型和 BasisAttr。 是什么、 为什么 layout 需要、 以及 mentor 给我的'完善它'任务从哪条线进入最干净。
  • 从 Python 到硅片 · 给 ML 工程师的编译器与体系结构小科普
    你可以把生产级 ML 系统写好几年, 都不知道 IR、 MLIR、 LLVM、 ISA、 FFI 这些词指什么。 这一篇是补丁 —— 写给本科 CS 念过、 但是 Compiler 和 Computer Arch 没好好上过的 ML 工程师。 配一份带 6 张 SVG 图、 中英双语的 HTML 深读。

近期项目

查看全部项目
  • Miles
    Enterprise RL framework for LLM/VLM post-training. Integrates SGLang rollout + Megatron training with FP8 pipeline and MoE support.
  • SpecForge
    Train speculative decoding draft models and port them to SGLang serving. Part of the SGLang ecosystem.
  • TritonForge
    LLM-powered GPU kernel synthesis: Train models to convert PyTorch ops into optimized Triton kernels via SFT+RL.
  • APRIL
    Active Partial Rollouts in Reinforcement Learning to Tame Long-tail Generation. A system-level optimization for scalable LLM training.
  • SGLang
    High-performance serving framework for large language models and multimodal models. Contributor.

联系方式

通过社交媒体或邮件联系我。

  • GitHub /
  • LinkedIn /
  • jpan236@wisc.edu
© 2026 • Jinn's Hub 🔬
Press Esc or click anywhere to close