CUDAでの高性能ソート(基数)
GPUがデータをソートできるという本当の証拠(基数アルゴリズム)は、CPUよりも数倍高速です。
バージニア大学シャーロッツビル校のコンピューター工学科のDuane MerrillとAndrew Grimshawは、GTX 480が1秒あたり10億を超える32ビットキーのソート速度を示す
SRTS Radix Sortのソートライセンスを無料ライセンスで公開しています。 Core i7プロセッサーの4倍の速度。
この方法は、あらゆるCUDAデバイスに適しています。 現在のバージョンでは、すべての組み込み数値C / C ++データ型(たとえば、signed char、float、unsigned long long)の並べ替えと、すべてのキーが同じ長さの場合の自動最適化をサポートしています(並べ替えの加速は5倍です)。
Source: https://habr.com/ru/post/J103016/
All Articles