1、安装昇腾依赖
# CANN发布件地址
https://cmc.rnd.huawei.com/cmcversion/index/releaseView?deltaId=10274626629404288&isSelect=Software&url_data=run
Ascend-cann-toolkit_8.0.T15_linux-aarch64.run
Ascend-cann-nnal_8.0.T15_linux-aarch64.run
Ascend-cann-kernels-910b_8.0.T15_linux.run
# torch_npu (注意版本匹配,torch版本为2.1.0)
https://cmc-szv.clouddragon.huawei.com/cmcversion/index/releaseView?deltaId=10365017745917184&isSelect=Inner
pip install torch_npu-2.1.0.post6.dev20240716-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl
# 下载NLTK data, 参考 https://blog.csdn.net/u010099177/article/details/102900515
# 将nltk_data放到对应conda目录下
2、cann迭代更新非常快,因此查阅时注意版本号的选择
简介-性能分析工具-训练推理开发工具-开发工具-CANN商用版8.0.RC2开发文档-昇腾社区
3、采用优先使用msprof, 但是需要安装Ascend-cann-tookit开发套件包
分包安装: bash Ascend-cann-toolkit_8.0.RC2_linux-aarch64.run --install --install-path=/pathdir
msprof --application="run yourApp" --output=./profile --ascendcl=on --model-execution=on --runtime-api=on --task-time=on --aicpu=on --ai-core=on --aic-mode=task-based --aic-metrics=PipeUtilization --sys-hardware-mem=on
Ascend PyTorch Profiler接口采集-使用PyTorch框架接口采集-其他采集方式介绍-性能分析工具-开发工具-CANN社区版8.0.RC2.alpha001开发文档-昇腾社区 (hiascend.com)
.json文件可以通过chrome://tracing/打开,W-放大,S-缩小,A-向左,D-向右