陈一一的自留地
首页
AscendC
大模型
陈一一的自留地
欢迎,在这随便写点东西~
Flash Attention家族
2026-05-26
:: Administrator
#推理
#算子
介绍 FlashAttention V1 是 Transformer 领域里一个非常重要的优化工作,由 Tri Dao 等人在 2022 年提出。它的核心目标是: 不改变 Attention 数学结果(Exact Attention)的前提下,大幅降低显存访问(IO)开销。 为什么需要FlashAt
阅读更多 >
AscendC介绍
2026-05-23
:: Administrator
#AscendC
Ascend C是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,兼具开发效率和运行性能。基于Ascend C编写的算子程序,通过编译器编译和运行时调度,运行在昇腾AI处理器上。使用Ascend C,开发者可以基于昇腾AI硬件,高效的实现自定义的创新算法。您可以通过Ascend
阅读更多 >