《表3 不同向量化方法程序执行时间(规模5w*5w)》
向量化后,程序运行时间如表3所示。从表中可以看出,手工向量化在各线程数下均优于自动向量化,这是因为手工向量化能够更灵活地运用Intel提供的Intrinsics接口。同时也说明了Intel编译器还未充分发掘AVX-512的性能,仍有一定的提升空间。
图表编号 | XD00175865600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 尤婷 |
绘制单位 | 衢州学院电气与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |
向量化后,程序运行时间如表3所示。从表中可以看出,手工向量化在各线程数下均优于自动向量化,这是因为手工向量化能够更灵活地运用Intel提供的Intrinsics接口。同时也说明了Intel编译器还未充分发掘AVX-512的性能,仍有一定的提升空间。
图表编号 | XD00175865600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 尤婷 |
绘制单位 | 衢州学院电气与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |