/ / आरंभिक प्रदर्शन स्थानीय मेमोरी का उपयोग करके हिट हुआ - opencl

स्थानीय मेमोरी - ओपनक्ल का उपयोग कर प्रारंभिक प्रदर्शन मारा

उपयोग करते समय एक प्रारंभिक प्रदर्शन हिट हैस्थानीय मेमोरी? मैं अपने मौजूदा कर्नेल को परिवर्तित कर रहा था जो वैश्विक मेमोरी का उपयोग करता है और सफल रूपांतरण पर मैंने प्रदर्शन को नीचा देखा। जाहिर है आप सोच सकते हैं कि मैंने इसे सही तरीके से इस्तेमाल नहीं किया होगा और मैं भी सहमत हो सकता हूं और कुछ और अनुकूलन पा सकता हूं। लेकिन यहां यह सवाल नहीं है।

साइड एक्सपेरिमेंट के तौर पर मैंने उसी कर्नेल का इस्तेमाल कियावैश्विक मेमोरी का उपयोग करना, स्थानीय मेमोरी तक पहुंच के साथ नहीं है। और फिर मैंने सभी को स्थानीय मेमोरी के साथ कर्नेल पैरामीटर में पारित किया, कुछ 1024 पूर्णांक। और यहाँ मैंने देखा कि यह कर्नेल निष्पादन लगभग दो बार लिया गया। तो क्या स्थानीय मेमोरी के आवंटन से कुछ प्रारंभिक प्रदर्शन प्रभावित होता है? किसी को भी यह देखा है और शायद एक स्पष्टीकरण है?

[अद्यतन] आपकी टिप्पणियों और उत्तरों के लिए आप सभी का धन्यवाद। मैंने यह देखने के लिए एक अलग परीक्षण कर्नेल लिखने की कोशिश की कि क्या यह व्यवहार दोहराने योग्य था। यह नहीं था "टी। मुझे एक पोस्ट मिली क्या निजी मेमोरी स्थानीय मेमोरी से धीमी है? इसमें निजी मेमोरी के अधिक उपयोग का उल्लेख किया जा सकता हैवैश्विक मेमोरी में परिणाम के रूप में और कर्नेल निष्पादन को धीमा कर सकता है। ऐसा लगता है कि यह एनवीडिया कार्ड के लिए विशिष्ट हो सकता है, मुझे आश्चर्य है कि एएमडी कार्ड पर क्या होता है। क्या यह हो सकता है कि स्थानीय मेमोरी के आवंटन के कारण अचानक निजी मेमोरी को स्थानीय मेमोरी के लिए जगह बनाने के लिए खत्म कर दिया जाए? मैं अब उस कोण से अपने कार्यान्वयन को देख रहा हूं, जब तक कि आप में से कोई भी अन्यथा सुझाव नहीं देता। क्या कोई दस्तावेज या पुस्तक है जिसमें ऐसा उल्लेख है कि आप लोग इसके बारे में जानते होंगे?

एक बार फिर धन्यवाद।

उत्तर:

जवाब के लिए 0 № 1

प्रदर्शन हिट को गैर-इष्टतम आकार के स्थानीय कार्य समूह का उपयोग करके या डब्ल्यूजी के भीतर WI के सिंक्रनाइज़ेशन द्वारा लगाया जा सकता है।

स्थानीय मेमोरी में पढ़ना किसी भी प्रदर्शन को हिट नहीं करता है - इसमें निजी मेमोरी में पढ़ने के समान गति का क्रम है (दोनों चिप पर रखा गया है)।

इसके अलावा, जांचें कि क्या आपका डेटा स्थानीय मेमोरी आकार में फिट बैठता है, क्योंकि यह आमतौर पर छोटा आकार होता है।