矩阵乘法的并行实现-并行运算大作业
成斌 柯
Unknown
- 0 Collaborators
根据数学知识用三重循环实现矩阵乘法的基础上,改变循环的次序增大cache命中率,以及实现分块矩阵乘法,在这些基础上采用并行算法实现矩阵乘法,矩阵分块乘法 ...learn more
Project status: Published/In Market
Overview / Usage
计算矩阵C = A * B,由于一般工业上矩阵大小很大,用时过长,因此对矩阵乘法优化还是存在必要性的。
本次优化思路有两个,一个是改变循环层次来增大cache访存率,一个是分块矩阵乘法,而且都采用并行运算再次实现。
根据数学知识用三重循环实现矩阵乘法的基础上,改变循环的次序增大cache命中率,以及实现分块矩阵乘法,在这些基础上采用并行算法实现矩阵乘法,矩阵分块乘法
Methodology / Approach
采用并行算法实现矩阵乘法,并与一般矩阵乘法对比
Technologies Used
dpcpp