NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72

Altı Yeni Çip, Tek Bir Yapay Zeka Süper Bilgisayarı

NVIDIA Vera Rubin NVL72, NVIDIA’nın en gelişmiş teknolojilerini tek bir platformda bir araya getirir: 72 adet Rubin GPU, 36 adet Vera CPU, ConnectX®-9 SuperNIC™ ağ kartları ve BlueField®-4 DPU’lar. NVIDIA NVLink™ 6 anahtarlama altyapısı sayesinde rack (kabinet) seviyesinde yüksek bant genişlikli ölçeklenebilirlik sunarken; NVIDIA Quantum-X800 InfiniBand ve Spectrum-X™ Ethernet çözümleriyle yatayda genişleyerek yapay zekanın endüstriyel ölçekte yaygınlaşmasını mümkün kılar. NVIDIA Groq 3 LPX rack sistemleriyle birlikte kullanıldığında ise, trilyon parametreli modeller ve milyon token uzunluğundaki bağlamlar için yeni nesil, yüksek performanslı çıkarım (inference) yetenekleri sağlar.

Vera Rubin NVL72, üçüncü nesil NVIDIA MGX™ NVL72 rack mimarisi üzerine inşa edilmiştir ve önceki nesillerden sorunsuz bir geçiş imkânı sunar. NVIDIA Blackwell mimarisiyle karşılaştırıldığında, yapay zeka eğitimini dörtte bir GPU ile gerçekleştirebilirken; çıkarım maliyetlerini milyon token başına onda bire kadar düşürür. Kablo gerektirmeyen modüler tray (tepsi) tasarımı ve 80’den fazla MGX ekosistem ortağının desteği sayesinde, bu rack ölçekli yapay zekâ süper bilgisayarı yüksek performansı hızlı ve kolay kurulum avantajıyla birleştirir.

Yapay Zeka Eğitiminde Verimlilik Artışları

Enerji Verimliliğinin Artırılması

NVIDIA Rubin, mixture-of-experts (MoE) modellerini NVIDIA Blackwell mimarisine kıyasla dörtte bir GPU sayısıyla eğitir.

Çıkarım Maliyetlerini Düşürme

NVIDIA Rubin, yüksek etkileşimli, derin akıl yürütme yeteneğine sahip agentik AI için NVIDIA Blackwell’e kıyasla milyon token başına maliyetin onda birini sunuyor.

NVIDIA Vera Rubin NVL72 Özellikleri

NVIDIA Vera Rubin NVL72 NVIDIA Vera Rubin Superchip NVIDIA Rubin GPU
Konfigürasyon 72 NVIDIA Rubin GPU | 36 NVIDIA Vera CPU 2 NVIDIA Rubin GPU | 1 NVIDIA Vera CPU 1 NVIDIA Rubin GPU
NVFP4 Inference 3,600 PFLOPS 100 PFLOPS 50 PFLOPS
NVFP4 Training² 2,520 PFLOPS 70 PFLOPS 35 PFLOPS
FP8/FP6 Training² 1,260 PFLOPS 35 PFLOPS 17.5 PFLOPS
INT8² 18 POPS 0.5 POPS 0.25 POPS
FP16/BF16² 288 PFLOPS 8 PFLOPS 4 PFLOPS
TF32² 144 PFLOPS 4 PFLOPS 2 PFLOPS
FP32 9,360 TFLOPS 260 TFLOPS 130 TFLOPS
FP64 2,400 TFLOPS 67 TFLOPS 33 TFLOPS
FP32 SGEMM³ 28,800 TFLOPS 800 TFLOPS 400 TFLOPS
FP64 DGEMM³ 14,400 TFLOPS 400 TFLOPS 200 TFLOPS
GPU Belleği | Bant Genişliği 20.7 TB HBM4 | 1,580 TB/s 576 GB HBM4 | 44 TB/s 288 GB HBM4 | 22 TB/s
NVLink Bandwidth 260 TB/s 7.2 TB/s 3.6 TB/s
NVLink-C2C Bandwidth 65 TB/s 1.8 TB/s
CPU Çekirdek Sayısı 3.168 adet özel NVIDIA Olympus çekirdeği (Arm® uyumlu) 88 adet özel NVIDIA Olympus çekirdeği (Arm uyumlu)  –
CPU Belleği 54 TB LPDDR5X 1.5 TB LPDDR5X
Total NVIDIA + HBM4 Chips 1,296 30 12

Yapay Zeka Süper Bilgisayarının İç Yüzü

NVIDIA Rubin GPU

Yeni nesil yapay zeka için tasarlanmış, HBM4 ve 50 PF NVFP4 Transformer Engine’e sahip Rubin GPU’lar.

NVIDIA Vera CPU

Vera CPU’lar, veri aktarımı ve ajan tabanlı (agentic) akıl yürütme için özel olarak tasarlanmıştır; yüksek bant genişliği, enerji verimliliği ve öngörülebilir (deterministik) performans sunar.

NVIDIA NVLink 6 Switch

NVLink 6 anahtarları, GPU başına 3.6 terabayt/saniye (TB/s) seviyesinde tümden-tüme (all-to-all) ölçeklenebilir bant genişliği sunarak, yapay zekâ yükleri için yüksek hızlı GPU’dan GPU’ya iletişimi mümkün kılar.

NVIDIA ConnectX-9 SuperNIC

ConnectX-9 SuperNIC’ler, GPU başına 1.6 terabit/saniye (Tb/s) bant genişliği sunar. Programlanabilir RDMA (uzaktan doğrudan bellek erişimi) desteği sayesinde, düşük gecikmeli ve GPU-direct özellikli ağ iletişimini büyük ölçeklerde mümkün kılar.

NVIDIA BlueField-4 DPU

BlueField-4 DPU’lar; depolama, ağ, siber güvenlik ve esnek ölçekleme alanlarında veri işleme süreçlerini hızlandırarak AI fabrikalarında yüksek verimlilik sağlar.

NVIDIA Spectrum-X Ethernet Co-Packaged Optics

Entegre silikon fotonik teknolojisine sahip Spectrum-X Ethernet ölçeklenebilir (scale-out) switch’leri, takılabilir transceiver kullanan geleneksel çözümlerine kıyasla 5 kat daha iyi enerji verimliliği, 10 kat daha yüksek dayanıklılığı ve 5 kata kadar daha fazla kesintisiz çalışma süresi sunar.

NVIDIA Groq 3 LPU

Bu, NVIDIA Vera Rubin NVL72 için geliştirilmiş bir çıkarım (inference) hızlandırıcısıdır ve ajan tabanlı sistemlerin düşük gecikme ve geniş bağlam gereksinimlerini karşılamak üzere tasarlanmıştır. NVIDIA Groq 3 LPX rack, 128 GB SRAM’e sahip 256 LPU, 40 PB/s bellek bant genişliği ve rack başına 640 TB/s ölçeklenebilir bant genişliği sunar. Vera Rubin NVL72 ile birlikte tasarlanan bu sistem, Blackwell’e kıyasla watt başına 35 kat daha yüksek çıkarım performansı ve trilyon parametreli modeller için 10 kata kadar daha fazla gelir potansiyeli sağlar.

Detaylı Bilgi Almak İster misiniz?