NVIDIA Vera Rubin NVL72

Altı Yeni Çip, Tek Bir Yapay Zeka Süper Bilgisayarı

NVIDIA Vera Rubin NVL72, NVIDIA’nın en gelişmiş teknolojilerini tek bir platformda bir araya getirir: 72 adet Rubin GPU, 36 adet Vera CPU, ConnectX®-9 SuperNIC™ ağ kartları ve BlueField®-4 DPU’lar. NVIDIA NVLink™ 6 anahtarlama altyapısı sayesinde rack (kabinet) seviyesinde yüksek bant genişlikli ölçeklenebilirlik sunarken; NVIDIA Quantum-X800 InfiniBand ve Spectrum-X™ Ethernet çözümleriyle yatayda genişleyerek yapay zekanın endüstriyel ölçekte yaygınlaşmasını mümkün kılar. NVIDIA Groq 3 LPX rack sistemleriyle birlikte kullanıldığında ise, trilyon parametreli modeller ve milyon token uzunluğundaki bağlamlar için yeni nesil, yüksek performanslı çıkarım (inference) yetenekleri sağlar.

Vera Rubin NVL72, üçüncü nesil NVIDIA MGX™ NVL72 rack mimarisi üzerine inşa edilmiştir ve önceki nesillerden sorunsuz bir geçiş imkânı sunar. NVIDIA Blackwell mimarisiyle karşılaştırıldığında, yapay zeka eğitimini dörtte bir GPU ile gerçekleştirebilirken; çıkarım maliyetlerini milyon token başına onda bire kadar düşürür. Kablo gerektirmeyen modüler tray (tepsi) tasarımı ve 80’den fazla MGX ekosistem ortağının desteği sayesinde, bu rack ölçekli yapay zekâ süper bilgisayarı yüksek performansı hızlı ve kolay kurulum avantajıyla birleştirir.

Yapay Zeka Eğitiminde Verimlilik Artışları

Enerji Verimliliğinin Artırılması

NVIDIA Rubin, mixture-of-experts (MoE) modellerini NVIDIA Blackwell mimarisine kıyasla dörtte bir GPU sayısıyla eğitir.

Çıkarım Maliyetlerini Düşürme

NVIDIA Rubin, yüksek etkileşimli, derin akıl yürütme yeteneğine sahip agentik AI için NVIDIA Blackwell’e kıyasla milyon token başına maliyetin onda birini sunuyor.

NVIDIA Vera Rubin NVL72 Özellikleri

	NVIDIA Vera Rubin NVL72	NVIDIA Vera Rubin Superchip	NVIDIA Rubin GPU
Konfigürasyon	72 NVIDIA Rubin GPU \| 36 NVIDIA Vera CPU	2 NVIDIA Rubin GPU \| 1 NVIDIA Vera CPU	1 NVIDIA Rubin GPU
NVFP4 Inference	3,600 PFLOPS	100 PFLOPS	50 PFLOPS
NVFP4 Training²	2,520 PFLOPS	70 PFLOPS	35 PFLOPS
FP8/FP6 Training²	1,260 PFLOPS	35 PFLOPS	17.5 PFLOPS
INT8²	18 POPS	0.5 POPS	0.25 POPS
FP16/BF16²	288 PFLOPS	8 PFLOPS	4 PFLOPS
TF32²	144 PFLOPS	4 PFLOPS	2 PFLOPS
FP32	9,360 TFLOPS	260 TFLOPS	130 TFLOPS
FP64	2,400 TFLOPS	67 TFLOPS	33 TFLOPS
FP32 SGEMM³	28,800 TFLOPS	800 TFLOPS	400 TFLOPS
FP64 DGEMM³	14,400 TFLOPS	400 TFLOPS	200 TFLOPS
GPU Belleği \| Bant Genişliği	20.7 TB HBM4 \| 1,580 TB/s	576 GB HBM4 \| 44 TB/s	288 GB HBM4 \| 22 TB/s
NVLink Bandwidth	260 TB/s	7.2 TB/s	3.6 TB/s
NVLink-C2C Bandwidth	65 TB/s	1.8 TB/s	–
CPU Çekirdek Sayısı	3.168 adet özel NVIDIA Olympus çekirdeği (Arm® uyumlu)	88 adet özel NVIDIA Olympus çekirdeği (Arm uyumlu)	–
CPU Belleği	54 TB LPDDR5X	1.5 TB LPDDR5X	–
Total NVIDIA + HBM4 Chips	1,296	30	12

Yapay Zeka Süper Bilgisayarının İç Yüzü

NVIDIA Rubin GPU

Yeni nesil yapay zeka için tasarlanmış, HBM4 ve 50 PF NVFP4 Transformer Engine’e sahip Rubin GPU’lar.

NVIDIA Vera CPU

Vera CPU’lar, veri aktarımı ve ajan tabanlı (agentic) akıl yürütme için özel olarak tasarlanmıştır; yüksek bant genişliği, enerji verimliliği ve öngörülebilir (deterministik) performans sunar.

NVIDIA NVLink 6 Switch

NVLink 6 anahtarları, GPU başına 3.6 terabayt/saniye (TB/s) seviyesinde tümden-tüme (all-to-all) ölçeklenebilir bant genişliği sunarak, yapay zekâ iş yükleri için yüksek hızlı GPU’dan GPU’ya iletişimi mümkün kılar.

NVIDIA ConnectX-9 SuperNIC

ConnectX-9 SuperNIC’ler, GPU başına 1.6 terabit/saniye (Tb/s) bant genişliği sunar. Programlanabilir RDMA (uzaktan doğrudan bellek erişimi) desteği sayesinde, düşük gecikmeli ve GPU-direct özellikli ağ iletişimini büyük ölçeklerde mümkün kılar.

NVIDIA BlueField-4 DPU

BlueField-4 DPU’lar; depolama, ağ, siber güvenlik ve esnek ölçekleme alanlarında veri işleme süreçlerini hızlandırarak AI fabrikalarında yüksek verimlilik sağlar.

spectrum-x-ethernet-co-packaged-optics-1920-1080

NVIDIA Spectrum-X Ethernet Co-Packaged Optics

Entegre silikon fotonik teknolojisine sahip Spectrum-X Ethernet ölçeklenebilir (scale-out) switch’leri, takılabilir transceiver kullanan geleneksel ağ çözümlerine kıyasla 5 kat daha iyi enerji verimliliği, 10 kat daha yüksek ağ dayanıklılığı ve 5 kata kadar daha fazla kesintisiz çalışma süresi sunar.

NVIDIA Groq 3 LPU

Bu, NVIDIA Vera Rubin NVL72 için geliştirilmiş bir çıkarım (inference) hızlandırıcısıdır ve ajan tabanlı sistemlerin düşük gecikme ve geniş bağlam gereksinimlerini karşılamak üzere tasarlanmıştır. NVIDIA Groq 3 LPX rack, 128 GB SRAM’e sahip 256 LPU, 40 PB/s bellek bant genişliği ve rack başına 640 TB/s ölçeklenebilir bant genişliği sunar. Vera Rubin NVL72 ile birlikte tasarlanan bu sistem, Blackwell’e kıyasla watt başına 35 kat daha yüksek çıkarım performansı ve trilyon parametreli modeller için 10 kata kadar daha fazla gelir potansiyeli sağlar.

Detaylı Bilgi Almak İster misiniz?

İletişime Geç

Jetson

AGX Thor

AGX Orin

Orin NX

Orin Nano

AGX Xavier

Xavier NX

TX2

Nano

Sunucular

DGX

HGX

IGX

DGX H200

DGX B300

DGX B200

DGX BasePOD

DGX SuperPOD

İş İstasyonları

Ekran Kartları

Masaüstü Ekran Kartları

Sunucu Ekran Kartları

Ağ

Ethernet

InfiniBand

DPU

Interconnect

Yazılım

Cordatus

Omniverse