NVIDIA Blackwell Mimarisi

NVIDIA Blackwell Mimarisi

NVIDIA Blackwell Mimarisi

Hızlandırılmış Hesaplama ve Üretken Yapay Zeka Alanında Çığır Açan Gelişmeleri Keşfedin

NVIDIA Blackwell mimarisinin üretken yapay zeka ve hızlandırılmış hesaplama alanlarına getirdiği devrim niteliğindeki ilerlemeleri inceleyin. NVIDIA teknolojilerinin nesiller üzerindeki birikimine dayanarak, Blackwell, eşsiz performans, verimlilik ve ölçek ile üretken yapay zeka alanında yeni bir dönemi tanımlıyor.

DEVRİM YARATAN YENİLİKLER

Yeni Sınıf Yapay Zeka Çipi

Blackwell mimarisi GPU’ları 208 milyar transistör içerir ve özel olarak oluşturulan bir TSMC 4NP işlemi kullanılarak üretilir. Tüm Blackwell ürünleri, birleşik tek bir GPU içinde 10 terabayt/saniye (TB/s) yonga arası bağlantı ile bağlanmış iki reticle sınırlı yongaya sahiptir.

İkinci Nesil Dönüştürücü Motor

İkinci nesil Dönüştürücü Motor, özel Blackwell Tensor Core teknolojisi ile birleştirilmiş NVIDIA® TensorRT™-LLM ve NeMo™ Framework yeniliklerini kullanarak büyük dil modelleri (LLM’ler) ve Uzmanlar Karışımı (MoE) modelleri için çıkarım ve eğitimi hızlandırmak için tasarlanmıştır.

MoE modellerinin çıkarımını hızlandırmak için, Blackwell Tensor Core’lar, yüksek doğruluk ve daha büyük hassasiyetler için kolayca değiştirilebilir yeni topluluk tanımlı mikro ölçekli formatlar da dahil olmak üzere yeni hassasiyetler ekler. Blackwell Dönüştürücü Motoru, performansı ve doğruluğu optimize etmek için mikro-tensor ölçekleme adı verilen ince ölçekleme tekniklerini kullanır ve 4-bit kayan nokta (FP4) yapay zeka işlemine olanak tanır. Bu, belleğin destekleyebileceği sonraki nesil modellerin performansını ve boyutunu ikiye katlarken yüksek doğruluğu korur.

Güvenli Yapay Zeka

Blackwell, hassas verileri ve yapay zeka modellerini yetkisiz erişimden güçlü donanım tabanlı güvenlik ile koruyan NVIDIA Gizli Hesaplama özelliğini içerir. Blackwell, endüstrideki ilk TEE-I/O yetenekli GPU olmasının yanı sıra, TEE-I/O yetenekli ana bilgisayarlar ve NVIDIA® NVLink® üzerinde inline koruma ile en performanslı gizli hesaplama çözümünü sunar. Blackwell Gizli Hesaplama, şifrelenmemiş modlara kıyasla neredeyse aynı veri akışı performansı sunar. Kuruluşlar artık en büyük modelleri bile performanslı bir şekilde güvence altına alabilirler, bunun yanı sıra yapay zeka fikri mülkiyetini (IP) korur ve güvenli bir şekilde gizli yapay zeka eğitimi, çıkarım ve birleşik öğrenmeyi(federatif learning) etkinleştirirler.

NVLink ve NVLink Anahtarı

Exascale hesaplamanın tam potansiyelini ve trilyon-parametreli yapay zeka modellerini açığa çıkarmak, bir sunucu kümesindeki her GPU arasında hızlı ve sorunsuz iletişim ihtiyacına dayanmaktadır. Beşinci nesil NVIDIA® NVLink® bağlantısı, trilyon ve çok trilyon parametreli yapay zeka modelleri için hızlandırılmış performansı serbest bırakmak için 576 GPU’ya kadar ölçeklenebilir.

NVIDIA NVLink Anahtarı Çipi, bir NVLink etki alanında (NVL72) 130TB/s GPU bant genişliği sağlar ve NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8 desteği ile 4 kat bant genişliği verimliliği sunar. NVIDIA NVLink Anahtarı Çipi, tek bir sunucudan öteye uzanan kümelere destek sağlar ve aynı etkileyici 1.8TB/s bağlantı iletişimini sürdürür. NVLink ile çoklu sunucu kümeleri, artan hesaplama gücüyle dengeli bir şekilde GPU iletişimini ölçeklendirir, böylece NVL72, tek bir sekiz-GPU sistemine kıyasla 9 kat daha fazla GPU veri akışını destekleyebilir.

Sıkıştırma Motoru

Veri analitiği ve veritabanı iş akışları geleneksel olarak hesaplama için CPU’lara güvenmiştir. Hızlandırılmış veri bilimi, uçtan uca analitik performansını dramatik olarak artırabilir, bu da maliyeti azaltırken değer oluşturmayı hızlandırır. Veri analitiği için, Apache Spark dahil olmak üzere veritabanları, büyük veri hacimlerini işleme, işleme ve analiz etme konularında kritik roller oynar.

Blackwell’un Sıkıştırma Motoru ve yüksek hızlı bir bağlantı üzerinden NVIDIA Grace™ CPU’da büyük miktarda belleğe erişim yeteneği – iki yönlü 900 gigabayt/saniye (GB/s) bant genişliği – en son sıkıştırma formatları olan LZ4, Snappy ve Deflate gibi en yeni sıkıştırma formatlarını destekleyerek veritabanı sorgularının tam iş akışını hızlandırır, bu da veri analitiği ve veri bilimi alanında en yüksek performansı sağlar.

Güvenilirlik, Erişilebilirlik ve Hizmetlenebilirlik (RAS) Motoru

Blackwell, kesinti süresini en aza indirmek için erken aşamalarda oluşabilecek potansiyel hataları belirlemek için özel bir Güvenilirlik, Erişilebilirlik ve Hizmetlenebilirlik (RAS) Motoru ile akıllı bir dayanıklılık ekler. NVIDIA’nın yapay zeka destekli öngörülü yönetim yetenekleri, genel sağlık için donanım ve yazılımdaki binlerce veri noktasını sürekli olarak izler ve kesinti ve verimsizlik kaynaklarını öngörüp engeller. Bu, zaman, enerji ve hesaplama maliyetlerinden tasarruf sağlayan akıllı bir dayanıklılık oluşturur.

NVIDIA’nın RAS Motoru, bakım planlaması için endişe verici alanları belirleyebilen ayrıntılı teşhis bilgileri sağlar. RAS motoru, sorun kaynağını hızlı bir şekilde yerelleştirerek dönüş süresini azaltır ve etkili çözümlemeyi kolaylaştırarak kesinti süresini en aza indirir.