Altı Yeni Çip, Tek Bir Yapay Zeka Süper Bilgisayarı
NVIDIA Vera Rubin NVL72, NVIDIA’nın en gelişmiş teknolojilerini tek bir platformda bir araya getirir: 72 adet Rubin GPU, 36 adet Vera CPU, ConnectX®-9 SuperNIC™ ağ kartları ve BlueField®-4 DPU’lar. NVIDIA NVLink™ 6 anahtarlama altyapısı sayesinde rack (kabinet) seviyesinde yüksek bant genişlikli ölçeklenebilirlik sunarken; NVIDIA Quantum-X800 InfiniBand ve Spectrum-X™ Ethernet çözümleriyle yatayda genişleyerek yapay zekanın endüstriyel ölçekte yaygınlaşmasını mümkün kılar. NVIDIA Groq 3 LPX rack sistemleriyle birlikte kullanıldığında ise, trilyon parametreli modeller ve milyon token uzunluğundaki bağlamlar için yeni nesil, yüksek performanslı çıkarım (inference) yetenekleri sağlar.
Vera Rubin NVL72, üçüncü nesil NVIDIA MGX™ NVL72 rack mimarisi üzerine inşa edilmiştir ve önceki nesillerden sorunsuz bir geçiş imkânı sunar. NVIDIA Blackwell mimarisiyle karşılaştırıldığında, yapay zeka eğitimini dörtte bir GPU ile gerçekleştirebilirken; çıkarım maliyetlerini milyon token başına onda bire kadar düşürür. Kablo gerektirmeyen modüler tray (tepsi) tasarımı ve 80’den fazla MGX ekosistem ortağının desteği sayesinde, bu rack ölçekli yapay zekâ süper bilgisayarı yüksek performansı hızlı ve kolay kurulum avantajıyla birleştirir.
Yapay Zeka Eğitiminde Verimlilik Artışları
Enerji Verimliliğinin Artırılması
NVIDIA Rubin, mixture-of-experts (MoE) modellerini NVIDIA Blackwell mimarisine kıyasla dörtte bir GPU sayısıyla eğitir.


Çıkarım Maliyetlerini Düşürme
NVIDIA Rubin, yüksek etkileşimli, derin akıl yürütme yeteneğine sahip agentik AI için NVIDIA Blackwell’e kıyasla milyon token başına maliyetin onda birini sunuyor.
NVIDIA Vera Rubin NVL72 Özellikleri
| NVIDIA Vera Rubin NVL72 | NVIDIA Vera Rubin Superchip | NVIDIA Rubin GPU | |
|---|---|---|---|
| Konfigürasyon | 72 NVIDIA Rubin GPU | 36 NVIDIA Vera CPU | 2 NVIDIA Rubin GPU | 1 NVIDIA Vera CPU | 1 NVIDIA Rubin GPU |
| NVFP4 Inference | 3,600 PFLOPS | 100 PFLOPS | 50 PFLOPS |
| NVFP4 Training² | 2,520 PFLOPS | 70 PFLOPS | 35 PFLOPS |
| FP8/FP6 Training² | 1,260 PFLOPS | 35 PFLOPS | 17.5 PFLOPS |
| INT8² | 18 POPS | 0.5 POPS | 0.25 POPS |
| FP16/BF16² | 288 PFLOPS | 8 PFLOPS | 4 PFLOPS |
| TF32² | 144 PFLOPS | 4 PFLOPS | 2 PFLOPS |
| FP32 | 9,360 TFLOPS | 260 TFLOPS | 130 TFLOPS |
| FP64 | 2,400 TFLOPS | 67 TFLOPS | 33 TFLOPS |
| FP32 SGEMM³ | 28,800 TFLOPS | 800 TFLOPS | 400 TFLOPS |
| FP64 DGEMM³ | 14,400 TFLOPS | 400 TFLOPS | 200 TFLOPS |
| GPU Belleği | Bant Genişliği | 20.7 TB HBM4 | 1,580 TB/s | 576 GB HBM4 | 44 TB/s | 288 GB HBM4 | 22 TB/s |
| NVLink Bandwidth | 260 TB/s | 7.2 TB/s | 3.6 TB/s |
| NVLink-C2C Bandwidth | 65 TB/s | 1.8 TB/s | – |
| CPU Çekirdek Sayısı | 3.168 adet özel NVIDIA Olympus çekirdeği (Arm® uyumlu) | 88 adet özel NVIDIA Olympus çekirdeği (Arm uyumlu) | – |
| CPU Belleği | 54 TB LPDDR5X | 1.5 TB LPDDR5X | – |
| Total NVIDIA + HBM4 Chips | 1,296 | 30 | 12 |
Yapay Zeka Süper Bilgisayarının İç Yüzü


NVIDIA Rubin GPU
Yeni nesil yapay zeka için tasarlanmış, HBM4 ve 50 PF NVFP4 Transformer Engine’e sahip Rubin GPU’lar.

NVIDIA Vera CPU
Vera CPU’lar, veri aktarımı ve ajan tabanlı (agentic) akıl yürütme için özel olarak tasarlanmıştır; yüksek bant genişliği, enerji verimliliği ve öngörülebilir (deterministik) performans sunar.

NVIDIA NVLink 6 Switch
NVLink 6 anahtarları, GPU başına 3.6 terabayt/saniye (TB/s) seviyesinde tümden-tüme (all-to-all) ölçeklenebilir bant genişliği sunarak, yapay zekâ iş yükleri için yüksek hızlı GPU’dan GPU’ya iletişimi mümkün kılar.

NVIDIA ConnectX-9 SuperNIC
ConnectX-9 SuperNIC’ler, GPU başına 1.6 terabit/saniye (Tb/s) bant genişliği sunar. Programlanabilir RDMA (uzaktan doğrudan bellek erişimi) desteği sayesinde, düşük gecikmeli ve GPU-direct özellikli ağ iletişimini büyük ölçeklerde mümkün kılar.

NVIDIA BlueField-4 DPU
BlueField-4 DPU’lar; depolama, ağ, siber güvenlik ve esnek ölçekleme alanlarında veri işleme süreçlerini hızlandırarak AI fabrikalarında yüksek verimlilik sağlar.

NVIDIA Spectrum-X Ethernet Co-Packaged Optics
Entegre silikon fotonik teknolojisine sahip Spectrum-X Ethernet ölçeklenebilir (scale-out) switch’leri, takılabilir transceiver kullanan geleneksel ağ çözümlerine kıyasla 5 kat daha iyi enerji verimliliği, 10 kat daha yüksek ağ dayanıklılığı ve 5 kata kadar daha fazla kesintisiz çalışma süresi sunar.

NVIDIA Groq 3 LPU
Bu, NVIDIA Vera Rubin NVL72 için geliştirilmiş bir çıkarım (inference) hızlandırıcısıdır ve ajan tabanlı sistemlerin düşük gecikme ve geniş bağlam gereksinimlerini karşılamak üzere tasarlanmıştır. NVIDIA Groq 3 LPX rack, 128 GB SRAM’e sahip 256 LPU, 40 PB/s bellek bant genişliği ve rack başına 640 TB/s ölçeklenebilir bant genişliği sunar. Vera Rubin NVL72 ile birlikte tasarlanan bu sistem, Blackwell’e kıyasla watt başına 35 kat daha yüksek çıkarım performansı ve trilyon parametreli modeller için 10 kata kadar daha fazla gelir potansiyeli sağlar.



