You are on page 1of 2

M1 Informatique Introduction au paralllisme e

TD 2 Performance
2.1 Mod`le dAmdhal e

1. La fraction squentielle dune application reprsente 4% du temps dexcution ` 1 processeur. e e e a n processeurs (2 n 7). Quelle est la borne suprieure Calculer lacclration et lecacit ` 2 ee ea e de lacclration ? ee 2. La mesure des acclrations des programmes A et B founit les rsultats suivants. ee e Procs A B 2 1,90 1,94 3 2,73 2,72 4 3,47 3,34 4 4,16 3,82 6 4,8 4,20 7 5,38 4,49 8 5,93 4,72

Calculer la fraction squentielle pour chacune des excutions. Comment peut-on dcrire le come e e portement parall`le des deux programmes ? e

2.2

Dbit asymptotique et demi-performance e

1. Un algorithme est compos dun calcul scalaire et dun calcul vectoriel sur un vecteur de taille e N . Sur 1 processeur, le temps du calcul scalaire est s et le temps du calcul vectoriel est dN , o` N est la taille du vecteur. On paralllise cet algorithme en rpliquant le calcul scalaire et en u e e distribuant le calcul vectoriel. Calculer le dbit asymptotique, la demi-performance et lacclration de lalgorithme sur une e ee machine ` p processeurs. a 2. Un deuxi`me algorithme est compos dune rduction et dun calcul vectoriel. Sur 1 processeur, e e e le temps de la rduction est aN et le temps du calcul vectoriel est dN . Mmes questions. e e

2.3

Iso-ecacit e

1. On consid`re la rduction dun vecteur de taille n sur p processeurs (on suppose toujours n e e multiple de p). Dnir la fonction diso-ecacit. Calculer les valeurs de n ncessaires pour e e e atteindre une ecacit de 0,9 sur 2, 32, 512 et 1024 processeurs. e 2. La relation diso-ecacit sur un syst`me est note n > f (p) ; la mmoire ncessaire pour un e e e e e probl`me de taille n est note M (n). Etablir la hirarchie dextensibilit pour les probl`mes e e e e e suivants : f (p) M (n) Cp n Cp n2 Cp log p n2 C p n2 C p log p n2

2.4

Extensibilit e

On consid`re deux mod`les de performances, qui valuent linteraction entre taille du probl`me, e e e e temps dexcution et paralllisme. e e - Mmoire constante (MC) : lencombrement mmoire par processeur est xe. RMC est le rapport e e e entre le temps dexcution du probl`me trait sur p processeurs et le temps dexcution du probl`me e e e e e initial sur 1 processeur. - Temps de rponse constant (TC) : le temps dexcution est xe. RTC est le rapport entre e e lencombrement mmoire total du probl`me trait sur p processeurs et lencombrement mmoire du e e e e probl`me initial sur 1 processeur. e Produit de matrices Un algorithme squentiel de param`tre caractristique n eectue n3 calculs sur n2 donnes (exemple e e e e produit de matrices). On suppose lalgorithme parfaitement paralllisable. e 1. Sur 1 processeur, on peut traiter un probl`me de param`tre 8 en temps 1. Quel probl`me peute e e on traiter sur 4 processeurs en MC ? Quel est le temps dexcution parall`le ? Quel probl`me e e e peut-on traiter sur 4 processeurs en TC ? Quel est lencombrement mmoire total ? parall`le ? e e 2. Calculer le param`tre caractristique de lalgorithme paralllis sur une machine ` p processeurs e e e e a (not n(p)) dans le mod`le MC et dans le mod`le TC. e e e 3. Calculer RMC et RTC . Tree-codes La complexit squentielle de lalgorithme de Barnes-Hut est O(t1 2 N log N ). Lorsque cet e e algorithme est appliqu ` la simulation de lvolution des galaxies, il prsente trois facteurs dere a e e e reurs : la rsolution spatiale contribue pour 1/ N ; la rsolution temporelle contribue pour t2 et e lapproximation pour 2 . On suppose les erreurs indpendantes, i.e. e 1 E = a + bt2 + c2 . N 1. On multiplie N par k. Par quel facteur faut-il multiplier les autres param`tres pour obtenir une e volution cohrente de lerreur ? Calculer alors la nouvelle complexit squentielle. e e e e 2. On suppose lapplication compl`tement paralllisable. Comparer la rsolution spatiale obtenue e e e par un scaling naif (on ne tient pas compte de linuence de t et sur lerreur) et par un scaling cohrent, dans le mod`le TC. e e 3. En imposant un temps de rponse constant gal ` celui de la conguration 1M, 1 processeur, e e a comparer le nombre de processeurs ncessaires pour multiplier la rsolution spatiale par 16 en e e scaling na et en scaling cohrent. f e

You might also like