Jinn's Hub
about / blog / projects / EN /
所有标签

标签: "CDNA3"

    源码精读 006 — FlyDSL, 一个用 MLIR 撑骨架的 layout 代数 Python DSL
    AMD 的 FlyDSL 是 Fly dialect MLIR 编译器的 Python 前端, 把 layout 代数和 copy / MMA atom 一路 lower 到 CDNA3 / CDNA4 的 ROCDL。 examples 目录下 vectorAdd、 tiledCopy、 tiledMma、 preshuffle GEMM 四个例子构成一条严格的进阶阶梯, 按顺序读完, 你就掌握了 paged attention、 MoE GEMM、 flash attention 这些 production kernel 反复重组的所有零件。
    源码精读 005 — GCNasm, 六十四道公案为你补全那本读不完的 AMD ISA 手册
    carlushuang 的 gcnasm 是 HIP 教程和 1200 页 CDNA3 ISA 手册之间罕见的中间地带: 64 个独立、 完整、 短小的 kernel, 把 AMD 高手亲手写的代码长什么样直接摊给你看。 6 小时认真读下来, 你会拿到一套能用的 MFMA / vmcnt 流水线 / DPP 跨 lane / 还有那条 LLVM 汇编器拒绝接受的指令的心智模型。
© 2026 • Jinn's Hub 🔬
Press Esc or click anywhere to close