Kepler (architecture de carte graphique)

L'architecture Kepler a été développée par NVidia pour ses cartes graphiques. Elle est censée doubler les performances par Watt par rapport à Fermi, l'architecture précédente, ce qui permet de l'utiliser dans des cartes graphiques mobiles. La première carte graphique utilisant cette architecture est la GTX 680, utilisant le processeur graphique GK 104.

Historique

  •  : sortie de la GTX 680, première carte graphique à utiliser l'architecture Kepler
  •  : sortie de la GTX 690, première carte graphique utilisant deux puces Kepler
  •  : sortie des Tesla K20 et K20X, premières cartes à utiliser le GK 110
  •  : sortie de la GeForce Titan, première carte graphique grand public à utiliser le GK 110
  •  : Sortie de la Geforce GTX 780
  • : Sortie de la GeForce GTX 780 Ti, première carte grand public à utiliser un GK 110 complet.
  •  : Sortie de la GeForce GTX Titan Black Edition, évolution de la GTX Titan avec toutes ses unités de calculs actives.
  •  : Sortie de la GeForce GTX Titan Z, première carte graphique à utiliser deux GK 110 complets.

Architecture

Elle reprend à peu près l'architecture Fermi, c'est donc une puce divisée en plusieurs GPC ou Graphics Processing Cluster qui sont les équivalents d'un cœur de microprocesseur sauf qu'ils sont dépourvus de mémoire cache, ils sont constitués d'un, deux ou trois SMX et ils contiennent 8 unités de ROP. Pour soutenir les cœurs CUDA, qui sont les unités de calculs, la puce propose deux niveaux de mémoire cache (L1 et L2). La puce est dotée de 512 Ko de mémoire cache L2, avec un débit revu à la hausse par rapport à Fermi[1].

Un SMX, est la grande nouveauté introduite par Kepler, c'est le remplaçant des SM de Fermi. Il peut contenir jusqu'à 192 cœurs CUDA, ou unités de calculs, dans la version la plus évoluée contre 32 cœurs CUDA avec les SM de Fermi. Par contre, le SMX abandonne le système de double cadencement de Fermi qui multipliait par deux la fréquence SM et donc des unités de calculs. Chaque SMX dispose de 64 ko de mémoire partagée et 16 unités de textures[2],[3].

GPU Boost

NVidia profite de Kepler pour introduire le « GPU Boost » qui augmente la fréquence du processeur en fonction de sa consommation et de sa température, qui sont directement mesurées sur la carte. Le gain peut atteindre plusieurs dizaines de MHz. Avec la GeForce Titan, Nvidia utilise le nom « GPU Boost 2.0 », dont le seul changement est que la température remplace la consommation comme facteur limitant[4],[5].

Liste des processeurs et des cartes graphiques utilisant Kepler

L'architecture Kepler est utilisée dans plusieurs GPU :

  • le GK 104, qui est utilisé dans les GTX 680, GTX 690, GTX 670, GTX 660, GTX 660ti, GTX 760, GTX 770 et Tesla K10[6];
  • le GK 106, qui est utilisé dans les GTX 660, il est composé de 5 SMX;
  • le GK 107, qui est utilisé dans les cartes mobiles de NVidia, ainsi que dans les cartes d'entrée de gamme, à partir de la GT 640 ;
  • le GK 110, qui a 15 SMX plus puissants et 1,5 Mo de mémoire cache, il est utilisé dans les Tesla K20, GeForce Titan, GeForce GTX 780 et GeForce GTX 780 Ti

En 2013, les puces Kepler sont toutes gravées en 28 nm.

Sous la marque GeForce

Cette section ne cite pas suffisamment ses sources (mai 2013). 
Pour l'améliorer, ajoutez des références vérifiables [comment faire ?] ou le modèle {{Référence nécessaire}} sur les passages nécessitant une source.

Elles fonctionnent toutes avec DirectX 11.0[7], OpenGL 4.3, OpenCL 1.2, et le PCI-Express 16x 3.0.

ModèlesGeForce GT 640 (A2)GeForce GT 640 (DDR3)GeForce GT 640 (DDR5)GeForce GTX 650GeForce GTX 650TiGeForce GTX 650Ti BoostGeForce GTX 660GeForce GTX 660 OEMGeForce GTX 660TiGeForce GTX 670GeForce GTX 680GeForce GTX 770GeForce GTX 690GeForce GTX 780GeForce GTX Titan[8]GeForce GTX780 Ti
Finesse de gravure des processeurs28nm
Code de la puceGK107GK106GK1042× GK104GK110
Surface de la puce118mm²221mm²294mm²2× 294mm²569mm²
Transistors1,3 G2.54 G3.54 G 3,54 G7,1 G
Fréquence 3D797 MHz900 MHz950 MHz1058 MHz928 MHz980 MHz823 MHz915 MHz1006 MHz1045 MHz915 MHz863 MHz837 MHz875 Mhz
Fréquence TurboNCNCNCNCNC1032 MHz888 MHZ980 MHz1006 MHz1058 MHz1084 MHz1019 MHZ902 MHz876 MHz928 Mhz
Fréquence TDP HeadroomNCNCNCNCNC1110 MHz927 MHz1136 MHz1084 MHz1123 MHz1136 MHz1071 MHz1006 MHz1020 Mhz
Température maximale avec Turbo94°C94°C80°C80°C80°C80°C
Nombre de ROP1624322× 3248
TMU326480961121282× 128192224240
Nombre de cœurs Cuda3847689601152134415362× 1536230426882880
Nombre de FP32320640800912106412162× 1216182413442280
Nombre de FP64---4856642× 6496896120
Nombre de SFU641281601922242562× 256384448480
Nombre de GPC12342× 45
Nombre de SMX2456782× 8121415
Enveloppe thermique50 Watts65 Watts75 Watts65 Watts85 Watts130 Watts140 Watts130 Watts150 Watts170 Watts195 Watts230 Watts300 Watts250 Watts250 Watts250 Watts
Type de mémoireDDR3GDDR5
Capacité possible1/2 Go1 Go1/2 Go1 Go1/2 Go2 Go1,5/3 Go2/3 Go2/4 Go 2/4 Go3 Go6 Go3 Go
Vitesse de la mémoire1782 MHz1250 MHz1350 MHz1500 MHz1450 MHz1500 MHz1750 MHz1500 MHz1750 Mhz
Largeur du bus mémoire128 bits192 bits256 bits 256 bits384 bits
Bande passante mémoire28,5 Go/s80 Go/s86,4 Go/s144,2 Go/s134 Go/s144,2 Go/s192,3 Go/s209 Go/s250 Go/s 192,3 Go/s268 Go/s
Pixels Fillrate12,8 Gpixels/s14,4 Gpixels/s15,2 Gpixels/s16,9 Gpixels/s14,8 Gpixels/s23,5 Gpixels/s19,8 Gpixels/s21,9 Gpixels/s29,3 Gpixels/s32,2 Gpixels/s2× 29,3 Gpixels/s27,6 Gpixels/s33,5 Gpixels/s42,0 Gpixels/s
TurboNCNCNCNCNC26,6 Gpixels/s22,3 Gpixels/s27,3 Gpixels/s34,7 Gpixels/s35,9 Gpixels/s2× 34,3 Gpixels/s40,2 Gpixels/s40,2 Gpixels/s44,54 Gpixels/s
Textures Fillrate25,5 Gtexels/s28,8 Gtexels/s30,4 Gtexels/s33,9 Gtexels/s59,4 Gtexels/s62,7 Gtexels/s78,4 Gtexels/s79 Gtexels/s102,5 Gtexels/s128,8 Gtexels/s2× 117,1 Gtexels/s166 Gtexels/s187,5 Gtexels/s210,0 Gtexels/s
TurboNCNCNCNCNC71 Gpixels/s88,8 Gpixels/s89 Gpixels/s127,2 Gpixels/s121,4 Gpixels/s143,7 Gpixels/s 137,1 Gpixels/s193 Gpixels/s225,3 Gpixels/s222,72 Gtexels/s
Filtrage Géométrique797 Mtriangles/s900 Mtriangles/s950 Mtriangles/s1058 Mtriangles/s1856 Mtriangles/s1960 Mtriangles/s2450 Mtriangles/s2469 Mtriangles/s3203 Mtriangles/s4024 Mtriangles/s2× 3660 Mtriangles/s5178 Mtriangles/s5859 Mtriangles/s5250 Mtriangles/s
TurboNCNCNCNCNC2220 Mtriangles/s2775 Mtriangles/s2781 Mtriangles/s3976 Mtriangles/s3794 Mtriangles/s4492 Mtriangles/s2× 4284 Mtriangles/s6036 Mtriangles/s7042 Mtriangles/s5555 Mtriangles/s
Calcul Simple Précision612,1 Gflo/s691,2 Gflo/s729,6 Gflo/s812,5 Gflo/s1425,4 Gflo/s1505,3 Gflo/s1881,6 Gflo/s1896,2 Gflo/s2459,5 Gflo/s3090,4 Gflo/s2× 2810,9 Gflo/s3977 Gflo/s4500 Gflo/s?
TurboNCNCNCNCNC1704,9 Gflo/s2131,2 Gflo/s2135,8 Gflo/s3053,6 Gflo/s2913,8 Gflo/s3449,9 Gflo/s2× 3290,1 Gflo/s4636 Gflo/s5408,3 Gflo/s5040 Gflo/s
Calcul Double Précision25,7 Gflo/s28,8 Gflop/s30,4 Gflop/s33,9 Gflop/s59,4 Gflop/s62,7 Gflop/s78,4 Gflop/s79 Gflop/s102,5 Gflop/s128,8 Gflop/s2× 117,1 Gflop/s166 Gflo/s1499,9 Gflop/s?
TurboNCNCNCNCNC71 Gflo/s88,8 Gflo/s89 Gflo/s127,2 Gpixels/s121,4 Gpixels/s143,7 Gpixels/s 137,1 Gpixels/s193 Gpixels/s1523 Gpixels/s210 Gflo/s
Prix actuel ()45€ H.T. l'unité pour 1000ex79€99€119€169€179€185€ H.T. l'unité pour 1000ex255€340€450€840€650€980€700€

Sous la marque Quadro

La série QUADRO 'Kx000' est conçue via le même schéma que les TESLA K. Les spécifications des GK104/106/110 sont donc identiques entre les séries TESLA et QUADRO.


ModèlesQuadro 410Quadro K600Quadro K2000Quadro K4000Quadro K5000Quadro K6000Quadro K7000
Gravure28 nm
processeurGK107GK106GK104GK110
Aire du die118mm²221mm²294mm²550mm²
Transistors1.27 G2.54 G3.54 milliards7.10 G
Fréquence GPU706 MHz876 MHz954 MHz811 MHz705 MHz735 MHz
Streams processors192192384768153624962688
Unités TMU163264128208224
Unités ROP81624324048
Nombre de blocs SMX12481415
Nombre de GPC1245
Enveloppe thermique38 Watts41 Watts51 Watts80 Watts122 Watts225 Watts250 Watts
Type de mémoireDDR3GDDR5
Mémoire512 MoGoGoGoGoGoGo
Vitesse mémoire891 MHz1000 MHz1404 MHz1350 MHz1300 MHz1300 MHz
Largeur de bus64 Bits128 Bits192 Bits256 Bits320 Bits384 Bits
Bande passante13,3 Go/s26,5 Go/s59,6 Go/s125,5 Go/s160,9 Go/s193,7 Go/s232,5 Go/s
Filtrage Pixels5,6 Gpixels/s14 Gpixels/s15,3 Gpixels/s19,5 Gpixels/s22,6 Gpixels/s28,2 Gpixels/s35,3 Gpixels/s
Filtrage Textures11,3 Gtexels/s14 Gtexels/s30,5 Gtexels/s51,9 Gtexels/s90,2 Gtexels/s146,6 Gtexels/s164,6 Gtexels/s
Filtrage Géométrique706 Mtriangles/s876 Mtriangles/s954 Mtriangles/s1622 Mtriangles/s2820 Mtriangles/s4935 MTr/s5513 Mtriangles/s
Calcul Simple Précision271,1 Gflo/s336,4 Gflo/s732,7 GFLOP/s1245,7 Gflo/s1082,9 GFLOP/s3519,4 Gflo/s3951,4 Gflo/s
Calcul Double Précision11,3 Gflo/s14 Gflo/s30,5 Gflo/s51,9 Gflo/s90,2 Gflo/s1173,1 Gflo/s1317,1 Gflo/s
Date de sortie-- 2013

Sous la marque Tesla

L'architecture Kepler est présente dans les Tesla K10, K20, K20X, K40 et K80.

Notes et références

Articles connexes

  • Portail de l’électricité et de l’électronique
  • Portail de l’informatique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Sharealike. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.