J'essaie de trouver une référence pour approximativement du nombre de cycles de la CPU diverses opérations requises. P>
Je n'ai pas besoin de chiffres exacts (comme cela va varier entre les processeurs), mais j'aimerais quelque chose de relativement crédible qui donne des chiffres de Ballpark que je pouvais citer en discussion avec des amis. P>
Par exemple, nous savons tous que la division de points flottants prend plus de cycles de processeur que de faire un bit-bit. p>
Je suppose que la différence est que la Division est d'environ 100 cycles, où un changement est 1, mais je cherche quelque chose à citer pour remonter ça. P>
Quelqu'un peut-il recommander une telle ressource? p>
4 Réponses :
Cela va être dépendant du matériel. La meilleure chose à faire est d'exécuter des points de repère sur le matériel particulier que vous souhaitez tester. P>
Un indice de référence irait à peu près à ceci: p>
Comment éliminer le temps utilisé pour exécuter les cycles 1000000 et l'allocation de registre utilisée pour stocker le nombre de fois, prédiction de la branche, etc.?
J'ai fait une petite application pour tester cela. Une application très approximative à l'aide de Synthmaker Free Edition ... Les lectures dans l'analyseur de cycle varient follement de 50 à 100, généralement célibataire ou double de la quantité attendue, il s'agit de chiffres qui représentent des moyennes, l'analyseur de cycle est un outil très rugueux, mais il donne des résultats équitables, un utilisateur de contournement fait l'exposant codé dans l'ASM qui calcule à la fois l'exp. Le taux audio par exemple est d'environ 800 cycles, donc je dirais que les chiffres ci-dessus sont proches d'au moins 50%. Je pensais que la division était beaucoup plus! Il semble environ deux fois plus. Si vous voulez le fichier que j'ai fabriqué pour courir dans SM Version Free Mappe-moi, j'allais sauver un exe c'est pourquoi je l'ai fait mais vous ne pouvez pas économiser en version gratuite stupide moi! Je ne vais pas le coder de Square One en version 1.17: /
ant.stewart à la place Yahoo Dotty Com. P> P> E code> est pour vide, les numéros sont des cycles très approximatifs
Pourquoi est-ce multilatéral de la même latence que Ajouter? J'ai entendu entier multimaut est généralement 3 fois plus lent que d'ajouter des processeurs modernes. Cependant, le point flottant à MUL peut avoir la même vitesse que le point flottant ajout.
Il y a Recherche fabriquée par AGNER FOG: P>
- Tables d'instruction LI> ol>
Tables d'instruction: Listes de latences d'instructions, débiteurs et Ruptures de micro-opération pour Intel, AMD et VIA CPU. P> blockQuote>
Dernière mise à jour 2021-03-22 P>