Open
Description
模型
- 最新模型接入 P0
- Omni pending
a. 部署支持输出音频
b. 支持talker的训练 - All-to-All优化 pending
- embedding: 支持推理、部署 P0
- ✅reranker训练支持
- 序列分类: 多标签/回归支持量化
Megatron-SWIFT
- 新模型支持
a. 多模态: qwen2.5-VL/qwen2.5-Omni P1
b. ✅DeepSeekV3 P0 - fp8 P0
- LoRA支持 P0
- 支持提前预处理数据集 P1
- RLHF支持 P0
a. GRPO
b. KTO
c. ✅DPO - 断点续训 对齐 P0
训练
- RAY支持 P0
- 长文本ring attention P1
- AutoTP P1
RL
- GRPO
a. ✅多轮AsyncEngine P0
b. Agent MCP
c. sglang
d. 效率对比benchmark P0
e. 多机rollout - ✅GKD P0
- RLOO P1
- Reinforce++ P1
- 多模态PPO
全链路
推理与部署
- ✅sglang接入推理部署 P0
- GGUF支持
量化
- bnb支持多模态模型
- qlora支持merge-lora P1
- GGUF支持