/ / Kann NVIDIA Visual Profiler die gleichzeitige Kernel-Ausführung anzeigen? - cuda, nvvp

Kann NVIDIA Visual Profiler die gleichzeitige Ausführung des Kernels anzeigen? - cuda, nvvp

Ich habe in vielen Foren gelesen, dass NVIDIA Visual Profiler das Programm serialisiert, um Timing-Informationen zu sammeln.

Im Visual Profiler, unter dem Kontextregister, finden Sie jedoch Hinweise wie "Es gibt keine zeitliche Überlappung zwischen Speicherkopien und Kernels auf der GPU" oder wenn es Überlappungen mit der Speicher- und Kernel-Ausführung gibt, wird der Zeitpunkt der Überlappung angezeigt. Auch wenn du siehst das folgende Webinar - Folie 6 Sie können eine Ausgabespur überlappender Kernel sehen.

Ich möchte wissen, ob der Profiler anzeigen kannInformationen zur gleichzeitigen Kernel-Ausführung (d. h. wenn wir 3 Kernel parallel mit drei verschiedenen Streams ausführen, kann der Profiler anzeigen, ob dies tatsächlich in der GPU geschieht). Wenn ja, wo kann ich diese Informationen im Visual Profiler finden?

Antworten:

2 für die Antwort № 1

Ja.

Sowohl nvprof als auch Visual Profiler (nvvp) in CUDA Toolkit 5.0 (verfügbar als Vorschauversion für registrierte CUDA-Entwickler) unterstützen die gleichzeitige Ausführung des Kernels.