英特尔发布x86SIMDSort 5.0,使用AVX512将C++对象排序速度提高4~5倍

2024年 2月 13日 74.8k 0


从提纲到今天已经将近一年了英特尔AVX-512支持的排序库以提供惊人的快速排序速度。在过去的一年里,1.0版本,V2.0中的新算法,V4.0中的AVX2支持和更多AVX-512优化现在,英特尔推出了x86-simd-sort 5.0,性能得到了更大的改进。

X86-SIMD-Sort 5.0版本引入了一个新的API,用于通过Object_qsort对自定义的C++对象进行排序。这种对定制C++对象的新排序支持可能比在AVX-512系统上使用std::Sort快4~5倍,但最终性能影响将根据定制类的不同而有所不同。

X86-SIMD-Sort 5.0版本还添加了一个新的keyvalue_qsorAPI来对表示键-值对的数组进行排序,并且使用这个新的API要快得多。V5.0版本还添加了对argosrt和argselect方法的AVX2支持。这些增加的AVX2已经落地到NumPy 2.0的上游NumPy中,而该Python库已经成为这个高性能英特尔库的最初采用者之一。

有关英特尔x86-SIMD-SORT 5.0版本的下载和更多详细信息,请访问GitHub.

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论