उपयोग करते समय एक प्रारंभिक प्रदर्शन हिट हैस्थानीय मेमोरी? मैं अपने मौजूदा कर्नेल को परिवर्तित कर रहा था जो वैश्विक मेमोरी का उपयोग करता है और सफल रूपांतरण पर मैंने प्रदर्शन को नीचा देखा। जाहिर है आप सोच सकते हैं कि मैंने इसे सही तरीके से इस्तेमाल नहीं किया होगा और मैं भी सहमत हो सकता हूं और कुछ और अनुकूलन पा सकता हूं। लेकिन यहां यह सवाल नहीं है।
साइड एक्सपेरिमेंट के तौर पर मैंने उसी कर्नेल का इस्तेमाल कियावैश्विक मेमोरी का उपयोग करना, स्थानीय मेमोरी तक पहुंच के साथ नहीं है। और फिर मैंने सभी को स्थानीय मेमोरी के साथ कर्नेल पैरामीटर में पारित किया, कुछ 1024 पूर्णांक। और यहाँ मैंने देखा कि यह कर्नेल निष्पादन लगभग दो बार लिया गया। तो क्या स्थानीय मेमोरी के आवंटन से कुछ प्रारंभिक प्रदर्शन प्रभावित होता है? किसी को भी यह देखा है और शायद एक स्पष्टीकरण है?
[अद्यतन] आपकी टिप्पणियों और उत्तरों के लिए आप सभी का धन्यवाद। मैंने यह देखने के लिए एक अलग परीक्षण कर्नेल लिखने की कोशिश की कि क्या यह व्यवहार दोहराने योग्य था। यह नहीं था "टी। मुझे एक पोस्ट मिली क्या निजी मेमोरी स्थानीय मेमोरी से धीमी है? इसमें निजी मेमोरी के अधिक उपयोग का उल्लेख किया जा सकता हैवैश्विक मेमोरी में परिणाम के रूप में और कर्नेल निष्पादन को धीमा कर सकता है। ऐसा लगता है कि यह एनवीडिया कार्ड के लिए विशिष्ट हो सकता है, मुझे आश्चर्य है कि एएमडी कार्ड पर क्या होता है। क्या यह हो सकता है कि स्थानीय मेमोरी के आवंटन के कारण अचानक निजी मेमोरी को स्थानीय मेमोरी के लिए जगह बनाने के लिए खत्म कर दिया जाए? मैं अब उस कोण से अपने कार्यान्वयन को देख रहा हूं, जब तक कि आप में से कोई भी अन्यथा सुझाव नहीं देता। क्या कोई दस्तावेज या पुस्तक है जिसमें ऐसा उल्लेख है कि आप लोग इसके बारे में जानते होंगे?
एक बार फिर धन्यवाद।
उत्तर:
जवाब के लिए 0 № 1प्रदर्शन हिट को गैर-इष्टतम आकार के स्थानीय कार्य समूह का उपयोग करके या डब्ल्यूजी के भीतर WI के सिंक्रनाइज़ेशन द्वारा लगाया जा सकता है।
स्थानीय मेमोरी में पढ़ना किसी भी प्रदर्शन को हिट नहीं करता है - इसमें निजी मेमोरी में पढ़ने के समान गति का क्रम है (दोनों चिप पर रखा गया है)।
इसके अलावा, जांचें कि क्या आपका डेटा स्थानीय मेमोरी आकार में फिट बैठता है, क्योंकि यह आमतौर पर छोटा आकार होता है।