Pomoc pri programovaní, odpovede na otázky / C / OpenMP optimalizácia s c - c, optimalizácia, správa pamäte, openmp

Optimalizácia OpenMP s c - c, optimalizácia, správa pamäte, openmp

Ja som mal optimalizovať nižšie uvedený kód, aby sabežať aspoň 16x rýchlejšie pomocou openMP a blokovania pamäte. Doteraz môžem len pomyslieť na to, že s mojimi jednoduchými tvrdeniami sa prepadnem o slučky. To robí to beží 3 krát rýchlejšie. Akékoľvek nápady na priblíženie k 16?

int i,j;
#pragma omp parallel for collapse(2)    //my inserted code
for (i = 0; i < MSIZE; i++)
for (j = 0; j < MSIZE; j++)
d[i][j] = c[j][i];

odpovede:

0 pre odpoveď č. 1

Keď deklarujete index vnútornej slučky vo vonkajšom rozsahu, musíte použiť privátnu klauzulu, aby ste každému vláknu poskytli vlastnú kópiu. Kolaps môže rušiť simd vektorizáciu.

Súvisiace otázky

openmp knižnice v Visual Studio 2017 - visual-studio-2017, openmp, intel-fortran

Kompilácia kódu C s openmp pomocou clang-cl - visual-studio-2015, clang

Ako openmp paralelizovať indexovanie - optimalizácia, vektor, paralelné spracovanie, openmp

OpenMP s maticami a vektormi - optimalizácia, openmp, paralelné spracovanie, trapné paralelné

Rôzne výsledky závisia od operačného systému - operačný systém, Fortran, optimalizácia kompilátorov, možnosti kompilátora

openMP rôzne verzie funkcie tabuľka - openmp

Analógové klastra spoločnosti Intel OpenMP - openmp, zdieľaná pamäť, cluster-computing, distribuovaný systém

OpenMP pomocou lock - openmp

Aké optimalizácie je možné dosiahnuť na tradičnom herne s jedným závitom ako je ioquake3 s OpenMP? - multithreading, openmp, herný motor

Čo sú vidlice (a spojené) v paralelnom otvorenom pre smernicu (vlákno alebo proces)? - multithreading, openmp

OpenMP SIMD Vs s viacerými závitmi - multithreading, openmp

Čo je čarovná funkcia v C / C ++ (pokiaľ ide o OpenMP) - c ++, c, gcc, openmp, icc

Komplexná slučka v programe C ++ prenosnom pre OpenMP a MPI? - c ++, cluster-computing, openmp, mpi

Vlastnosti cl.exe jazyka Visual Studio 2008 openmp - c ++, openmp

OpenMP pomalé znižovanie - c ++, openmp

Optimalizujte závislé slučky openmp - c ++, c, optimalizácia, slučky, openmp

Existuje implicitná bariéra na konci #pragma omp paralelne? - c ++, openmp

Ako globálne nastaviť predvolenú klauzulu na žiadnu? - c ++, openmp, zdieľaná pamäť

Porušenie segmentácie kompilátora Intel pri kompilácii pomocou -openmp a -ipo s Cray LibSci na Cray XC30 - kompilácia, Fortran, Openmp, Cray

OpenACC-OpenMP podpora ramena Mali GPU - rameno, gpu, openmp, openacc, mali