Jinn's Hub
about / blog / projects / EN /
所有标签

标签: "training"

    NeMo-RL vs slime:RL 训练框架对比
    两个主流 RL 训练框架的深度对比:算法、工程质量、MoE 支持、ROCm 兼容性
    SFT 与 RL 训练指南
    SFT 和 RL 的核心区别、Loss 计算、数据构建到 RLHF 实战的完整指南
© 2026 • Jinn's Hub 🔬
Press Esc or click anywhere to close