从提纲到今天已经将近一年了英特尔AVX-512支持的排序库以提供惊人的快速排序速度。在过去的一年里,1.0版本,V2.0中的新算法,V4.0中的AVX2支持和更多AVX-512优化现在,英特尔推出了x86-simd-sort 5.0,性能得到了更大的改进。
X86-SIMD-Sort 5.0版本引入了一个新的API,用于通过Object_qsort对自定义的C++对象进行排序。这种对定制C++对象的新排序支持可能比在AVX-512系统上使用std::Sort快4~5倍,但最终性能影响将根据定制类的不同而有所不同。
X86-SIMD-Sort 5.0版本还添加了一个新的keyvalue_qsorAPI来对表示键-值对的数组进行排序,并且使用这个新的API要快得多。V5.0版本还添加了对argosrt和argselect方法的AVX2支持。这些增加的AVX2已经落地到NumPy 2.0的上游NumPy中,而该Python库已经成为这个高性能英特尔库的最初采用者之一。
有关英特尔x86-SIMD-SORT 5.0版本的下载和更多详细信息,请访问GitHub.