陈一一的自留地
欢迎,在这随便写点东西~
ascend-kernel-ut
ascend-kernel-ut Ascend C 算子开发工具,通过 Kernel 直调工程完成算子中部分单元模块的完整开发流程(环境 → 设计 → 开发 → 测试 → 验收)。 为什么不直接用cannbot提供的kernel直调工程? 目前cannbot提供的kernel直调算子工程过于庞大,代
Flash Attention家族
介绍 FlashAttention V1 是 Transformer 领域里一个非常重要的优化工作,由 Tri Dao 等人在 2022 年提出。它的核心目标是: 不改变 Attention 数学结果(Exact Attention)的前提下,大幅降低显存访问(IO)开销。 为什么需要FlashAt