摘要:RISC-V软件生态正在加速发展, 国际开源社区积极投入RISC-V软件生态, 针对RISC-V主动适配和优化, 积极推动RISC-V软件生态系统向前发展. PyTorch是一个开源的Python机器学习库, 其在性能、开源生态、研究领域都有非常大的优势, 其对x86、ARM、PowerPC以及CUDA等指令集架构都提供了较好的支持. 但是, 在目前的RISC-V架构上, 软件生态移植集中在对RISC-V标准指令集的适配, 尚不能充分利用RISC-V扩展指令集优化软件生态, 距离ARM、x86等成熟软件生态存在较大差距. PyTorch因缺少RISC-V V扩展(RVV)的支持, 使得RISC-V平台的推理性能与同规格ARM平台差距较大. 针对上述问题, 本文提出了一种面向PyTorch RVV 1.0的高效开发方案, 并使用RVV扩展指令集对PyTorch深度卷积算子进行针对性优化, 并在K230开发板上进行了对比分析, 实验结果表明, 相比标量实现, 利用RVV优化的深度卷积算子性能提升约1.35–3.8倍.