benches.JPG (4987 octets)

Logiciel Test réalisé F030 CT2 B
Papyrus 7 Scrolling de la documentation de CENTinel en 16 couleurs. 3'00" 1'07"
Scrolling de la documentation de CENTinel en near true color. 7'12" 2'37
Chemin de fer. 3'07" 33"
Photoline 2.24 Chargement d'une JPEG. 1'44" 17"
Application du filtre bas-relief. 55" 13"
Application du filtre binomial. 1'43" 24"
POV 3 Calcul du script VASE. 8h03'20" 2h06'54"
SANDRINE 4 Numérisation d'une page a4 en 600 dPi, dans le format tiff lzw+delta en 18 bits.
Image de 5088*7008 (106,970,112 octets) compressé en 54,089,576 octets.
28'41" 9'56
Numérisation d'une page a4 en 48 dPi, dans le format tiff lzw+delta en 18 bits.
Image de 416*560 (698,880 octets) compressé en 298,130 octets.
2'10 1'04
GCC 2.7.2 Le make all du P-basic:
Utilise le GNU-MAKE et GCC pour compiler. Il est composé de 13 .C et 12.H pour un total de 360 ko de source.
Le P-basic est le basic du Phénix.
6'19" 1'20"
PURE C Le test PureC consiste en la compilation de la librairie jpeg GNU. Elle est composée de 84 fichiers totalisant 1.8 Mo de source. 5'36" 1'00"
DEVPAC L'assemblage de dolmen utilise aussi GNU make et utilise devpac pour assembler. Il comporte 37 makefiles récursifs pour 382 sources principaux pour un total 6 Mo de sources. 7'04" 1'25"
CUBASE 2.06 Application d'un effet "timestrech" sur une source de 17Mo avec un tempo de 120 dans un nouveau tempo de 160.999 pour un fichier résultant de 13 Mo.
Test réalisé sur un IDE QUANTUM eclipse.
10'39" 3'47"
Five to Five Conversion de fréquence 49kHz->44.1kHz d'un AVR de 25 Mo. 27'40" 8'20"
Maximisation du volume sur un avr de 25 Mo. 8'40" 1'40"
CAB 2.7 Affichage de la page des Benchs 98 de notre site en 256 couleurs. (hors ligne) 2'30" 47"
Affichage de la page compatibilité de O à S en 256 couleurs. (hors ligne) 1'01" 14"
ST-ZIP 2.6 Compression des sources de Dolmen. 12'34" 2'58"
Décompression des sources de Dolmen. 5'26" 1'10"


NOTE: Le Falcon en mode normal est équipé d'une CT2A, donc le FPU (coprocesseur) est en 32 Bits et à 16 MHz au lieu de 16 bits et 16 MHz sur un vrai Falcon d'origine.
Ceci influe beaucoup sur le test de POV !

TEST GEMBENCH 4.03

Les tests de gembenchs ne sont pas sérieux car tous les tests ne sont pas indépendants.
Par exemple : plus le cache du CPU est gros, plus le résultat de l'accès en RAM est important ! Les tests FPU changent en fonction des accès RAM (si on change par exemple de résolution) !

Pour les résultats voir le fichier zip à la fin de la page.

Débit RAM mesuré avec NEMBENCH (TITAN) et DAVEBENCH (CENTEK):

Pour les résultats voir le fichier zip à la fin de la page.

Calcul d'une Fractale MANDELBROT dans FRACTAL.PRG à 400%

Pour les résultats voir le fichier zip à la fin de la page.

Analyse des BENCHs de la CENTurbo II Rev B et de l'AFTERBURNER 040.

La CT2 accélère réellement par 6 (31,2Mo / 5,3Mo), à condition que les programmes soient bien codés (alignement du code sur 32-Bit !)

Le bus FALCON (ST-Ram) est à 25 MHz avec la CT2 et 16 MHz avec l'AB40.
Et ceci se voit sur les tests graphiques qui se passent beaucoup en ST-Ram (c'est là que se trouve la ram vidéo !!)

Le seul test intéressant de GEMBENCH c'est l'Integer Div qui donne 329% pour l'AB40 et 315% pour la CT2. Pourquoi ?
D'un côté, le 040 exécute un DIVU.W en 27 cycles d'horloge et il est cadencé à 32 MHz. Sur le 030 (Falcon d'origine et CT2), le DIVU.W est exécuté en 44 cycles d'horloge (50 MHz sur CT2) !

Pour la CT2, nous avons la régle de trois suivante :

(44/44) 44 cycles pour le 030
x (50/16) 50 MHz pour la CT2 et 16 MHz pour le F030 d'origine.
= 3,125 soit 312 %
  Pour l'AB40, nous avons la régle de trois suivante :

(44/27) 44 cycles pour le 030 et 27 cycles pour le 040
x (32/16) 32 MHz pour l'AB40 et 16 MHz pour le F030 d'origine.
= 3,259 soit 326 %

La théorie et la réalité sont très proches...

Il faut dire que le reste des tests de GEMBENCH n'est pas très sérieux !
En effet, ce logiciel, qui est malheureusement la référence possède des tests qui sont fortement en rapport avec NVDI et exploite donc les avantages de NVDI sans les inconvénients, lesquels sont devenus des avantages pour la VDI de DOLMEN (MEHNIR).

En dehors de la partie graphique, la partie CPU (INTEGER DIV, FPU, RAM et ROM access) vaut son pesant d'absurdité !!

En effet, si vous comparez l'écart entre CT2 et AB40 pour l'accès RAM chez GEMBENCH et celui chez NEMBENCH ou DAVEBENCH, vous pouvez vous poser de grandes questions et comme il n'est jamais trop tard pour comprendre... :

Gembench a des routines de test qui ne tiennent pas compte du temps machine pris pour s'exécuter. Ce qui signifie que plus le processeur a un gros cache et plus le test tourne vite (puisque d'avantage dans le cache !), ce qui N'A RIEN A VOIR avec le pourquoi du test, à savoir la capacité du CPU à accéder à la RAM !!
Par contre NEMBENCH et DAVEBENCH tiennent compte du temps des instructions du programme et utilisent des MOVE pour lire les octets en RAM.

C'est comme le bon vieux problème d'utiliser en labo des appareils de mesure qui n'altèrent pas le phénomène mesuré. Dans notre cas, il faut bien entendu soustraire au résultat le temps d'execution de la routine de test !

Ce que GEMBENCH ne fait pas mais que NEMBENCH ET DAVEBENCH font !
C'est ainsi que le test RAM ACCESS de Gembench donne tant d'avantage pour l'AB40, car le 040 a un cache de 2 x 4 ko contre 2 x 256 octets pour le 030 de la CT2 !! Mais si on fait les tests cache OFF, là, la CT2 domine l'AB40 avec son BUS FAST-RAM à 50 MHz et son CPU à 50 MHz contre le bus 32 MHz et le CPU à 32 MHz de l'AB40 !!

Il est facile de faire les calculs pour prouver cela :

Pour la CT2:


Une ligne de cache (4 LONGS) est lue en BURST à 50 MHz en 5 + 2 + 2 + 2 = 11 cycles 50 MHz avec la ram EDO 60 ns.
De plus l'instruction MOVE.L prend 5 cycles sur le 030.

Lors du BURST, le premier LONG est envoyé de suite dans l'unité d'exécution du processeur et exécuté en même temps que l'arrivée des 3 LONGS suivants (en 2+2+2 cycles !), soit un temps machine de seulement 3 MOVE à compter, soit 5+5+5=15 cycles. C'est là tout l'intérêt d'avoir un CPU à 50 MHz permanant au lieu de DX2 (50 MHz losqu'il ne prend pas le bus et 25 MHz lorsqu'il transfert sur le bus, donc lors du BURST !!!).

Concluons :

Nous avons donc 11 cycles de transfert + 15 cycles d'exécution, soit un total de 26 cycles à 50 MHz.
Ce qui revient à dire que 16 octets sont lus en 26 cycles, soit 16/26 x 50 000 000 = 30.77 Mo / seconde ! C'est pas loin !
  Pour l'AFTERBURNER 040:


Une ligne de cache est lue en BURST à 32 MHz en 3 + 2 + 2 + 2 = 9 cycles 32 MHz (ne gère pas la fonction EDO, sinon on aurait pu avoir du 3 + 1 + 1 + 1 = 6 - dommage !).
L'instruction MOVE.L s'exécute sur le 040 en seulement 2 cycles ! Soit 3 MOVE.L en 6 cycles.

Concluons :

Nous avons donc 9 cycles de transfert + 6 cycles d'exécution, soit un total de 15 cycles à 32 MHz.

Ce qui revient à dire que 16 octets sont lus en 15 cycles, soit 16/15 x 32 000 000 = 34,13 Mo / seconde ! C'est pas loin du tout !

Voilà, vous savez maintenant très simplement calculer la bande passante d'un processeur sur un bus d'unité centrale...

 

GemDemo benchmarks

v1.3 June 24, 1998
tunnel.dmo / direct mode output.

Syntaxe:

Machine Ordinateur/modèle
CPU Modèle/MHz
STRam MHz/Bits
TTRam MHz/Bits
Mode vidéo Résolution/Carte Vidéo
OS Système d'exploitation
1x Images/seconde en mode normal non zoomé
2x Images/seconde en mode zoomé 2 fois
4x Images/seconde en mode zoomé 4 fois

Machine

CPU

STRam

TTRam

Mode Vidéo

OS/VDI 1x FPS 2x FPS 4x
FPS
Apple Powerbook G3-250 PowerPC_750 250 MHz
1mb l2c
83 MHz 64-bit Pas Dispo. 1024*768
RAVE-GFX
MagicMAC NVDI 612 164 41
Apple Powerbook Modèle inconnu PowerPC 750 266 MHz 66 MHz 64-bit Pas Dispo. ATI 3D MagicMAC NVDI 440 220 57
Apple PowerMac 8600 PowerPC 604ex 300 MHz 1mb l2c 50 MHz 64-bit Pas Dispo. 1024*768 ATI 3D MagicMAC NVDI 321 103 29
Hades 68060
60 MHz
30 MHz 32-bit Pas Dispo. 1152*960 ET6000 NAES NVDI 162 130 62
Hades 68040
32 MHz
32 MHz 32-bit Pas Dispo. 1024*768 ET6000 TOS 3.06 NVDI 148 89 58
Hades 68040
32 MHz
32 MHz 32-bit Pas Dispo. 1024*768 ET6000 MinTOS NVDI 108 74 50
Falcon CT2 A 68030
50 MHz
50 MHz 16-bit 50 MHz 32 bit 320*240 Videl VGA TOS 4.04 NVDI 108 70 N/A
Milan 68040
25 MHz
25 MHz 32-bit Pas Dispo. 800*600 S3 TrioDX2 TOS 4.06 MilanVDI 102 89 34
Falcon CT2 A 68030
50 MHz
50 MHz 16-bit 50 MHz 32-bit 640*400 Videl-VGA TOS 4.04 NVDI 86 43 15
Falcon AB040 Nemesis 68040
40 MHz
20 MHz 16-bit 40 MHz 32 bit 640*480 NovaPlus64 TOS 4.04 NVDI 83 37 11
TT030 CaTTamaran 68030
48 MHz
16 MHz 32-bit 16 MHz 32 bit 1024*768 CyRELSunrise M16-1280 TOS 3.06 80 50 40
Falcon AB040 68040
32 MHz
16 MHz 16-bit 32 MHz 32 bit 1024*768 SuperNova 4 Mo VRAM MagiC NVDI 80 37 11
Falcon AB040 Nemesis 68040
40 MHz
20 MHz 16-bit 40 MHz 32-bit 640*480 NovaPlus64 MiNTOS N.AES NVDI 78 36 10
TT030 68030
32 MHz
16 MHz 32-bit 16 MHz 32-bit 640*480 NovaPlus32 MagiC NVDI 70 30 10
Falcon AB040 68040
32-bit
16 MHz 16-bit 32 MHz 32-bit 1024*768 SuperNova TOS 4.04 NVDI 63 24 7.5
Falcon AB040 68040
32 MHz
16 MHz 16-bit 32 MHz 32-bit 1024*768 SuperNova MINTOS N.AES NVDI 62 23 7
Apple Mac Performa 6400 SC PowerPC 603ev
200 MHz
40 MHz 64-bit Pas Dispo. 832*624 MagicMAC 60 33 11
Apple Mac PowerBook 450c 68040
33 MHz
33 MHz 32-bit Pas Dispo. 640*400 MagicMAC NVDI 58 31 9
TT030 68030
32 MHz
16 MHz 32-bit 16 MHz 32-bit 832*620 CrazyDots TOS 3.06 NVDI 55 26 9
Falcon Mighty Sonic 68030
32 MHz
16 MHz 16-bit 32 MHz 32-bit 768*240 Videl-RGB TOS 4.04 NVDI 49 26 N/C
Falcon Nemesis High 68030
24 MHz
24 MHz 16-bit Pas Dispo. 320*240 Videl-VGA TOS 4.04 NVDI 48 32 N/C
Falcon SpeedResCard 68030
40 MHz
20 MHz 16-bit Pas Dispo. 320*240 Videl-VGA TOS 4.04 NVDI 44 27 N/C
TT030 68030
32 MHz
16 MHz 32-bit 16 MHz 32-bit 832*620 CrazyDots MintOS N.AES NVDI 44 22 7.5
Falcon Nemesis-Low 68030
20 MHz
20 MHz 16-bit Pas Dispo. 320*240 Videl-VGA TOS 4.04 NVDI 38 20 N/C
Falcon Magnum-FastRam 68030
16 MHz
16 MHz 16-bit 16 MHz 16-bit 320*480 Videl-VGA TOS 4.04 NVDI 37 26.5 11
Falcon 68030
16 MHz
16 MHz
16-bit
Pas Dispo. 320*200 Videl RGB TOS 4.04 NVDI 37 24 N/C
Falcon 68030
16 MHz
16 MHz 16-bit Pas Dispo. 640*400 Videl RGB TOS 4.04 NVDI 33 21 9

Retour