3 Star 0 Fork 0

朝花夕拾 / op-dev

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

op-dev

介绍

算子开发

创建算子工程

~/Ascend/ascend-toolkit/latest/python/site-packages/bin/msopgen gen  -i clip_by_value.json -c ai_core-Ascend910B -lan cpp -out ClipByValue

测试case https://docs.qq.com/sheet/DQ1dXd093Qk91SmRp?tab=BB08J2

阅卷用算子忙碌

编号 算子 状态 备注
1 Addcmul 910B4测试结果:fp16,fp32,int32测试通过,int8未通过,原因不明 需要上板子测试
2 FastGelu 开发完成 待整理
3 FastGeluGrad 开发完成 待整理
4 LessEqual 开发完成 待整理
5 MseLoss 910B4测试完成 需要上板子测试
6 MseLossGrad 910B4测试完成 需要上板子测试
7 ClipByValue 910B4测试完成 需要上板子测试
8 LpNormV2 910B4测试完成 需要上板子测试
9 Spence 开发完成 待整理
10 ScatterSub 开发完成 待整理
11 ScatterMax 未开发 待整理
12 InstanceNorm 未开发 待整理

算子工程目录

编号 算子 目录 算子工程 aclnn 状态
1 Addcmul add_cmul FrameworkLaunch/Addcmul/Addcmul-impl FrameworkLaunch/Addcmul/AclNNInvocation-Ascend 完成
2 FastGelu add_cmul FrameworkLaunch/Addcmul/Addcmul-impl FrameworkLaunch/Addcmul/AclNNInvocation-Ascend 完成
3 FastGeluGrad fast_gelu_grad FrameworkLaunch/FastGeluGrad-impl FrameworkLaunch/AclNNInvocation-Ascend 完成
4 LessEqual less_equal FrameworkLaunch/LessEqual-impl FrameworkLaunch/AclNNInvocation-Ascend 完成
5 MseLoss mse_loss MseLoss aclnn_invoke 调试中
6 MseLossGrad mse_loss_grad MseLossGrad aclnn_invoke 完成
7 ClipByValue clip_by_value ClipByValue aclnn_invoke 完成
8 LpNormV2 lp_norm_v2 LpNormV2 aclnn_invoke 调试中
9 Spence spence FrameworkLaunch/Spence FrameworkLaunch/AclNNInvocation-Ascend 完成
10 ScatterSub scatter_sub ScatterSub aclnn_invoke 未开发
11 ScatterMax scatter_max ScatterMax aclnn_invoke 未开发
12 InstanceNorm instance_norm InstanceNorm aclnn_invoke 未开发

空文件

简介

算子开发 展开 收起
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
C++
1
https://gitee.com/zhxs_1/op-dev.git
git@gitee.com:zhxs_1/op-dev.git
zhxs_1
op-dev
op-dev
master

搜索帮助