CUDA पर उच्च प्रदर्शन छंटनी (मूलांक)

वास्तविक प्रमाण कि GPU डेटा (रेडिक्स एल्गोरिथ्म) को सीपीयू की तुलना में कई गुना तेज कर सकता है।

चार्लोट्सविले में वर्जीनिया विश्वविद्यालय में कंप्यूटर इंजीनियरिंग विभाग से डुआने मेरिल और एंड्रयू ग्रिम्सहॉव ने अपनी छँटाई विधि एसआरटीएस रेडिक्स सॉर्ट के तहत नि: शुल्क लाइसेंस के तहत प्रकाशित किया, जिसमें जीटीएक्स 480 1 बिलियन से अधिक 32-बिट कुंजी प्रति सेकंड की छंटाई गति दिखाता है: लगभग कोर i7 प्रोसेसर की तुलना में चार गुना तेज।

विधि किसी भी CUDA उपकरण के लिए उपयुक्त है। वर्तमान संस्करण किसी भी अंतर्निहित संख्यात्मक C / C ++ डेटा प्रकार (उदाहरण के लिए, हस्ताक्षर किए गए चार, फ्लोट, अहस्ताक्षरित लंबे समय तक) की छंटाई का समर्थन करता है, साथ ही उन मामलों में स्वचालित अनुकूलन भी होता है जहां सभी कुंजियों की लंबाई समान (पांच गुना तेज छंटाई) होती है।


Source: https://habr.com/ru/post/In103016/


All Articles