Skip to content

fix: 更新 MindSpeed import 路径 (lite.ops.triton → ops.triton,适配 core_r0.16.0)#9415

Open
Weizhena wants to merge 1 commit into
modelscope:mainfrom
Weizhena:fix/mindspeed-import-path-core-r0.16.0
Open

fix: 更新 MindSpeed import 路径 (lite.ops.triton → ops.triton,适配 core_r0.16.0)#9415
Weizhena wants to merge 1 commit into
modelscope:mainfrom
Weizhena:fix/mindspeed-import-path-core-r0.16.0

Conversation

@Weizhena
Copy link
Copy Markdown

背景

MindSpeed core_r0.16.0 通过 MR !3432 将 Triton 算子路径从 mindspeed.lite.ops.triton.* 统一到 mindspeed.ops.triton.*(路径规范化),旧路径 mindspeed.lite.ops.triton 已不存在。

当前 ms-swift 的 swift/model/chunk_gated_delta_rule.py 仍使用旧路径,在搭配 MindSpeed core_r0.16.0 训练 Qwen3.5/3.6 GDN 模型时直接 ImportError。

用户目前需要手动创建桥接文件(mkdir -p mindspeed/lite/ops/triton + 重导出文件)才能运行,体验不佳。

修复

chunk_gated_delta_rule.py 中 7 处 import 路径从 mindspeed.lite.ops.triton 更新为 mindspeed.ops.triton

实测验证

在昇腾 910B3 + MindSpeed core_r0.16.0 + mcore-bridge release/1.4 上验证:

  • 模型:qwen3.6-27B 全量 SFT(TP=4, PP=2)
  • 修改后无需手动创建桥接文件,直接 import 成功,训练正常运行

兼容性

  • MindSpeed core_r0.16.0+:直接兼容(新路径)
  • MindSpeed 旧版本(< core_r0.16.0):需要用旧版 ms-swift 或手动创建反向桥接

@gemini-code-assist
Copy link
Copy Markdown
Contributor

Warning

You have reached your daily quota limit. Please wait up to 24 hours and I will start processing your requests again!

@addsubmuldiv
Copy link
Copy Markdown
Collaborator

可以做下兼容,老版本的路径还是旧的,0.16版本的暂时还没整个适配上来,还没有对各方面功能做验证

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants