Spesifikasi Nvidia Tesla V100 150W & 300W


Nvidia resmi mengumumkan dua VGA card generasi selanjutnya dengan arsitektur Volta GV100. Tesla V100 Accelerator akan hadir dengan dua model PCIe yang berbeda, untuk model 150W memiliki single slot dengan ukuran setengah dari 300W yang memiliki memiliki dual slot. Kedua VGA card ini akan menggunakan arsitektur generasi terbaru dari Nvidia yaitu GV100 yang memberikan 5120 CUDA Core dengan 16GB HBM2.

Berikut spesifikasi lengkapnya :

Tesla Product Tesla K40 Tesla M40 Tesla P100 Tesla V100
GPU GK110 (Kepler) GM200 (Maxwell) GP100 (Pascal) GV100 (Volta)
SMs 15 24 56 80
TPCs 15 24 28 40
FP32 Cores / SM 192 128 64 64
FP32 Cores / GPU 2880 3072 3584 5120
FP64 Cores / SM 64 4 32 32
FP64 Cores / GPU 960 96 1792 2560
Tensor Cores / SM NA NA NA 8
Tensor Cores / GPU NA NA NA 640
GPU Boost Clock 810/875 MHz 1114 MHz 1480 MHz 1455 MHz
Peak FP32 TFLOP/s* 5.04 6.8 10.6 15
Peak FP64 TFLOP/s* 1.68 2.1 5.3 7.5
Peak Tensor Core TFLOP/s* NA NA NA 120
Texture Units 240 192 224 320
Memory Interface 384-bit GDDR5 384-bit GDDR5 4096-bit HBM2 4096-bit HBM2
Memory Size Up to 12 GB Up to 24 GB 16 GB 16 GB
L2 Cache Size 1536 KB 3072 KB 4096 KB 6144 KB
Shared Memory Size / SM 16 KB/32 KB/48 KB 96 KB 64 KB Configurable up to 96 KB
Register File Size / SM 256 KB 256 KB 256 KB 256KB
Register File Size / GPU 3840 KB 6144 KB 14336 KB 20480 KB
TDP 235 Watts 250 Watts 300 Watts 300 Watts
Transistors 7.1 billion 8 billion 15.3 billion 21.1 billion
GPU Die Size 551 mm² 601 mm² 610 mm² 815 mm²
Manufacturing Process 28 nm 28 nm 16 nm FinFET+ 12 nm FFN

Nvidia Tesla V100 Accelerator memiliki chip 815mm persegi dengan lebih dari 21 miliar transistor yang dibangun dengan 12nm TSMC yang baru. Dengan boost clock 1455MHz Tesla V100 mampu menghasilkan 15 TFLOPS dengan perhitungan presisi tunggal dan 7,5 TFLOPS dengan perhitungan presisi ganda pada 300W. Yang perlu diketahui adalah GV100 memiliki 5376 CUDA core namun yang berfungsi pada Tesla V100 hanya 5120 saja.

Arsitektur baru yang dibuat oleh Nvidia ini berhasil memberikan kinerja 40% lebih baik dibanding dengan Pascal dan memiliki CUDA core 7% lebih banyak /mm /segi dan kinerja 6% lebih baik /mm /segi, hal ini mampu dihasilkan dati FinFET 12nm yang lebih efisien lebih tinggi dan berkat penyempurnaan arsitektur Pascal.

Nvidia belum memberikan informasi mengenai harga yang akan dibandrol untuk VGA enthusias ini, namun Nvidia pasti memiliki kejutan untuk pasar enthusias dengan mengeluarkannya VGA card dengan generasi terbarunya ini.

Artikel Terkait: