Chip APU Exascale Revolusioner dari AMD Dibedah
Para Engineer dibalik AMD Instinct MI300A APU telah mempublikasikan Research Mereka, dalam membangun masa depan dari “Exascale Heterogeneous Processor”. MI300A adalah Processor di EL Capitan, yang diprediksi akan menjadi Supercomputer tercepat di dunia, saat ini Proyek ini di perkirakan berjalan pada Dua exaFLOPS
Dalam sebuah riset terbaru, 13 ilmuwan AMD bekerja sama untuk menuliskan makalah yang membahas cara untuk mencapai performa exaFLOPS. Thread yang diposting di X (sebelumnya Twitter) oleh salah satu penulis makalah tersebut memberikan gambaran umum yang menarik tentang proses penelitian ini. Meskipun keberadaan MI300A bukanlah berita baru (pertama kali dipublikasikan pada Mei 2023), makalah baru yang dipresentasikan kemarin di ISCA 2024 ini membantu menjelaskan pemikiran AMD di balik keputusan mereka untuk memprioritaskan APU daripada GPU khusus untuk komputasi exascale.
Kelahiran Instinct MI300A diawali dengan pemilihan AMD oleh Departemen Energi Amerika Serikat (DoE) untuk berpartisipasi dalam penelitian supercomputer lebih dari satu dekade lalu. DoE memproyeksikan komputer super yang beroperasi pada kecepatan exaflop, namun dengan akhir Hukum Moore yang sudah terlihat, mereka menyadari dibutuhkan inovasi yang lebih mendasar untuk mencapainya. Meskipun kuat, AMD merasa GPU terpisah akan membutuhkan terlalu banyak ruang dan daya, sehingga kurang skalabel untuk exascale. Oleh karena itu, mereka memulai penelitian pada “Exascale Heterogeneous Processor” (EHP). Berdasarkan konsep menciptakan APU enterprise yang kuat yang dapat disinkronkan dengan banyak salinannya sendiri, proyek EHP pertama kali diwujudkan dalam Frontier, supercomputer pertama di dunia yang mencapai exaFLOPS.
Meskipun Supercomputer Frontier sukses besar sebagai supercomputer tercepat di Bumi saat pertama kali diluncurkan, AMD belum sepenuhnya mewujudkan rencana EHP mereka. Frontier dibangun berdasarkan penelitian EHP, tetapi menggunakan akselerator grafis khusus MI250X alih-alih solusi APU all-in-one yang diharapkan AMD. Pengorbanan ini harus dilakukan agar Frontier dapat dikirimkan tepat waktu, karena teknologi penumpukan V-Cache AMD menjanjikan namun belum siap untuk digunakan secara luas. Revisi ketiga EHP yang direncanakan selama pengembangan Frontier membutuhkan, antara lain tugas yang saat itu mustahil, yaitu menumpuk modul HBM di atas setiap chiplet GPU. Teknologi 3D V-Cache harus dikembangkan lebih lanjut, membuat Frontier diluncurkan dalam kondisi yang belum sempurna namun tetap kuat.
Akhirnya, 3D V-Cache menjadi teknologi revolusioner seperti sekarang, dan EHP siap untuk dorongan terakhir melewati garis finis. APU baru ini lahir berdasarkan arsitektur CPU prosesor EPYC yang ada di dalam Frontier. Dengan bus memori Infinity Fabric terpadu, MI300A pada akhirnya dapat mencapai waktu transfer yang diukur dalam TB/s antara inti grafis dan pemrosesannya.
MI300A, sebagai wujud final dari Proyek EHP, APU ini menampung 24 core CPU Zen 4 x86 dalam tiga chiplet, bersama dengan 228 unit komputasi GPU CDNA 3, dan 128 GB memori HBM3 terpadu yang berjalan pada 5.2 GT/s, semuanya terintegrasi dalam arsitektur Infinity generasi ke-4. Angka pada lembar spesifikasinya terlihat seperti kesalahan ketik, dengan bandwidth memori puncak 5,3 TB/s dan performa AI puncak teoritis 3922 TFLOPS
Performa GPU pada APU MI300A meningkat pesat dibandingkan performa GPU khusus MI250X di Frontier. Ketika diuji dalam serangkaian benchmark sintetis beban kerja HPC, MI300A menghasilkan performa 1,25x hingga 2,75x lebih cepat daripada MI250X. Peningkatan performa rata-rata hingga dua kali lipat ini membuktikan bahwa AMD dan Departemen Energi Amerika Serikat berada di jalur yang tepat dengan mengejar EHP.
Tentu saja, MI300A tidak dirancang untuk bekerja secara mandiri. Ia diciptakan untuk digunakan dalam susunan empat APU. Setiap APU memiliki delapan interface Infinity Fabric 128 GB/s, menghasilkan konektivitas dua arah sebesar 1 TB/s. Dalam konfigurasi empat APU, masing-masing APU dapat berkomunikasi dengan kecepatan tinggi dan semuanya juga memiliki koneksi PCIe Gen5 x16. Skala ini ditingkatkan ke superkomputer, dan El Capitan, mainan terbaru Departemen Energi Amerika Serikat, diperkirakan akan berjalan pada dua exaFLOPS.
El Capitan akan mengungguli superkomputer teratas dunia saat ini. Frontier yang ditenagai AMD masih menjadi superkomputer tercepat di dunia, dengan puncak 1,2 exaFLOPS. Hanya satu komputer lain yang mencapai satu exaFLOPS, sisanya berada di 500 teraFLOPS atau lebih rendah. Hasil yang diharapkan El Capitan akan dengan mudah menempati posisi pertama, menjadikannya superkomputer bertenaga AMD ketiga yang saat ini berada di papan peringkat 10 teratas dunia.