1、第一种方式可以正常推理 CUDA_VISIBLE_DEVICES=0 swift infer --adapters ./output/v2-20250731-152527/checkpoint-300 --stream true --merge_lora true --infer_backend vllm --vllm_max_model_len 8192 --temperature 0.7 --max_new_tokens 2048 2、swift export --adapters ./output/v2-20250731-152527/checkpoint-300 --merge_lora true merge后的模型只能输出结果,无法思考