Skip to content

🍭[Roadmap] ms-swift3.6 #4561

Open
Open
@Jintao-Huang

Description

@Jintao-Huang

模型

  1. 最新模型接入 P0
  2. Omni pending
    a. 部署支持输出音频
    b. 支持talker的训练
  3. All-to-All优化 pending
  4. embedding: 支持推理、部署 P0
  5. ✅reranker训练支持
  6. 序列分类: 多标签/回归支持量化

Megatron-SWIFT

  1. 新模型支持
    a. 多模态: qwen2.5-VL/qwen2.5-Omni P1
    b. ✅DeepSeekV3 P0
  2. fp8 P0
  3. LoRA支持 P0
  4. 支持提前预处理数据集 P1
  5. RLHF支持 P0
    a. GRPO
    b. KTO
    c. ✅DPO
  6. 断点续训 对齐 P0

训练

  1. RAY支持 P0
  2. 长文本ring attention P1
  3. AutoTP P1

RL

  1. GRPO
    a. ✅多轮AsyncEngine P0
    b. Agent MCP
    c. sglang
    d. 效率对比benchmark P0
    e. 多机rollout
  2. ✅GKD P0
  3. RLOO P1
  4. Reinforce++ P1
  5. 多模态PPO

全链路

推理与部署

  1. ✅sglang接入推理部署 P0
  2. GGUF支持

量化

  1. bnb支持多模态模型
  2. qlora支持merge-lora P1
  3. GGUF支持

Metadata

Metadata

Assignees

No one assigned

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions