摘要:点积函数是BLAS库中的一级基础函数, 其被科学计算等领域广泛调用. 由于浮点计算会引入舍入误差, 现有BLAS库中双精度点积函数不足以满足某些应用领域的精度要求, 因此需要高精度算法来实现更精确可靠的计算. 在本文中, 面向国产申威1621平台, 在现有的BLAS库的基础上, 新增高精度点积函数的实现接口, 来满足应用的高精度需求. 同时, 对于高精度点积算法运用循环展开、访存优化、指令重排等优化策略, 实现汇编级手工优化. 实验结果显示, 文中高精度点积算法的计算结果精度, 近似达到了双精度点积的两倍, 有效提升了原始算法精度. 同时, 在保证精度提升的基础上, 文中优化后的高精度点积函数相比未优化前, 平均性能加速比达到了1.61.