代码拉取完成,页面将自动刷新
Teco-AL(Teco-Accelerated Libraries,太初加速库)提供了统一的算子库模型,用户可以基于ual计算层,使用SDAA C编程模型实现灵活多样的算子接口。文档说明可以查阅Teco-AL算子开发指南。
Teco-AL的运行依赖以下组件,可以查阅环境安装手册进行对应工具安装。
Teco-AL仓库采用CMake统一构建,推荐用户使用source env.sh
配置仓库规范,然后使用./build.sh
脚本构建。
以tecoalAddTensor()算子运行为例,编译、运行、测试命令示例如下:
source env.sh
bash build.sh --test on
cd build/bin
./test_add_tensor
出现以下结果,则表示运行成功:
...
C success rate 1.00
出现以下结果,则表示运行失败,需要添加算法分支指定数字,通常为0~6,如./test_hgemm 6
:
...
The executable file parameter is incorrect
Teco-AL仓库为C++代码仓库,采用C++11标准,统一使用谷歌的C++风格,推荐使用仓库下tools/format2google工具进行自动化调整。
Teco-AL仓库通过将不同的组件和功能模块化,让项目的可维护性和可扩展性得到了增强。具体目录如下:
.
├── README.md # 项目的README文件,包含项目介绍、使用方法等
├── build.sh # 构建脚本,用于编译项目
├── CMakeLists.txt # CMake配置文件,指定如何编译项目和链接依赖
├── CPPLINT.cfg # C++代码风格检查的配置文件
├── env.sh # 环境设置脚本,设置编译和运行项目所需的环境变量
├── interface # 接口定义目录
│ ├── common # 存放一些通用的接口定义或工具
│ ├── include # 公共头文件目录
│ └── ops # 存放各算子的接口定义,调用和组合ual层封装好的OP类接口
│ ├── add_tensor.cpp
│ └── other_ops.cpp
├── samples # 存放测试样例代码
│ ├── add_tensor
│ │ └── test_add_tensor.cpp
│ └── other_ops
├── tools # 存放项目相关的工具脚本或程序
└── ual # 实际计算层,将各算子封装为单独的OP对象,在OP中集成分支派发、__global__属性的接口
├── args # 存放各算子需要的参数结构定义
│ ├── add_tensor_args.h
│ └── other_ops.h
├── com # 通用组件或工具
├── ops # 算子实现与分支派发目录
│ ├── add_tensor
│ │ ├── add_tensor.hpp
│ │ ├── find_add_tensor.cpp
│ │ └── find_add_tensor.h
│ └── other_ops
└── kernel # 设备端核心计算逻辑的实现代码
├── add_tensor
│ ├── add_tensor_ft16.scpp
│ └── add_tensor.h
└── other_ops
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。