Skip to content

Conversation

@hootandy321
Copy link

概述

实现了负载资源互感知的编译优化技术模块:算子融合优化框架,支持自动算子融合,通过内核级优化提升推理性能。

主要变更

核心融合模块

  • FusionScheduler: 运行时调度器,动态决策融合或回退执行路径

  • FusionConfig: 可配置的融合行为(开关、缓存、调试模式)

  • FusionHeuristics: 静态启发式规则进行融合决策(张量大小、节点数阈值)

  • KernelCompiler: 管理融合内核的编译和缓存

  • GraphConverter: 将计算图转换为可融合子图表示

  • SubGraph: 描述算子序列和依赖关系的数据结构

    配置示例

config = FusionConfig(
    enable_fusion=True,
    enable_cache=True,
    min_tensor_elements=1024,
    min_nodes_for_fusion=2
) 

文件变更

  • 新增 python/infinicore/fusion/ 模块(7个文件,约1400行)
  • 新增 add_rms_norm Metax 实现

@hootandy321 hootandy321 requested a review from a team January 29, 2026 07:08
@PanZezhong1725
Copy link
Collaborator

可以试着往demo131分支里提,那个分支应该有沐曦addrmsnorm实现

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants