🍭[Roadmap] ms-swift3.6

## 模型
1. 最新模型接入 P0
2. Omni pending
    a. 部署支持输出音频
    b. 支持talker的训练
3. All-to-All优化 pending
4. embedding: 支持推理、部署 P0
5. ✅reranker训练支持
6. 序列分类: 多标签/回归支持量化
## Megatron-SWIFT 
1. 新模型支持
    a. 多模态: qwen2.5-VL/qwen2.5-Omni P1
    b. ✅DeepSeekV3 P0
2. fp8 P0
3. LoRA支持 P0
4. 支持提前预处理数据集 P1
5. RLHF支持 P0
    a. GRPO
    b. KTO
    c. ✅DPO
6. 断点续训 对齐 P0


## 训练
1. RAY支持 P0
2. 长文本ring attention P1
3. AutoTP P1


## RL 
1. GRPO
   a. ✅多轮AsyncEngine P0
   b. Agent MCP
   c. sglang
   d. 效率对比benchmark P0
   e. 多机rollout
2. ✅GKD P0
3. RLOO P1
4. Reinforce++ P1
5. 多模态PPO

## 全链路
### 推理与部署
1. ✅sglang接入推理部署 P0
2. GGUF支持

### 量化
1. bnb支持多模态模型
2. qlora支持merge-lora P1
3. GGUF支持






Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

🍭[Roadmap] ms-swift3.6 #4561

模型

Megatron-SWIFT

训练

RL

全链路

推理与部署

量化

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

🍭[Roadmap] ms-swift3.6 #4561

Description

模型

Megatron-SWIFT

训练

RL

全链路

推理与部署

量化

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions