Пориньте в архітектури графічних процесорів @nvidia 🐰 Hopper і ⚙️ Blackwell – послідовні стрибки в обчислювальній потужності та з'єднаннях для ваших робочих навантажень зі штучним інтелектом👇
🐰 Hopper (H100 і H200) представив тензорні ядра 4-го покоління + трансформаторний двигун FP8, що забезпечує до 9× швидшого навчання та на 30× швидшого висновку порівняно з A100. ⚙️ Blackwell (B200) — постачання наприкінці 2024 року — з'єднує два кристали на NV-HBI зі швидкістю 10 ТБ/с, додає FP4 і використовує NVLink-5 для виведення до 30× кластера.
🐰 @nvidia Технічні характеристики бункера Тензорні ядра: змішані FP8/FP16/TF32 Пам'ять: - H100 → 80 ГБ HBM3 @ 3.35 ТБ/с - H200 → 141 ГБ HBM3e @ 4.8 ТБ/с NVLink: до 900 ГБ/с на графічний процесор
🐰 @nvidia Бункер в дії Бенчмарки показують, що H200 живить Llama-2 70B на 45–100% швидше порівняно з H100. ⚠️ Обидва зіткнулися з кризою поставок у 2023–25 роках. 💻 На хмарі Hyperbolic: H100 віртуальні машини та кластери з Ethernet + InfiniBand за ціною від $1,49/год. H200 і B200 через миттєве котирування.
⚙️ @nvidia Інновації Blackwell - Конструкція чиплета (TSMC 4NP, транзистори 208 Б, 10 ТБ/с NV-HBI) - Трансформаторний двигун 2-го покоління: FP4 + покращений FP8 - NVLink-5: 18 посилань @ всього 1,8 ТБ/с - Декомпресійний двигун: 800 Гбіт/с CPU↔GPU - Повна RAS і конфіденційні обчислення
📊 Порівняння продуктивності H100 SXM: 80 ГБ @ 3.35 ТБ/с, 3.96 PFLOPS (FP8), 1.98 PFLOPS (FP16), 67 TFLOPS (FP32), NVLink 900 ГБ/с, 700 Вт H200 SXM: 141 ГБ @ 4.8 ТБ/с, той самий обчислювальний PFLOPS/TFLOPS, NVLink 900 ГБ/с, 700 Вт HGX B200: 180 ГБ @ 7,7 ТБ/с, 9 ПФЛОПС (FP8), 4,5 ПФЛОПС (FP16), 75 ТФЛОПС (FP32), NVLink 1,8 ТБ/с, 1000 Вт
❓ @nvidia Що таке флоп? 1 операція з плаваючою комою (add/mul) 1 ТФЛОП = 10¹² оп/с 1 PFLOP = 10¹⁵ ops/s = 1000× TFLOP Ці показники показують, наскільки швидко графічні процесори обробляють масивну математику, що лежить в основі навчання штучного інтелекту та HPC.
🔚 @nvidia Підбиття підсумків: 🐰 Hopper встановив планку за допомогою трубопроводів змішаної точності та асинхронності FP8. ⚙️ Blackwell просуває наступне покоління з FP4, більшим обсягом пам'яті, NVLink-5. H100 залишається робочою конячкою — оренда за 1,49 долара за годину. H200 і B200 доступні за запитом через
@nvidia Повний текст статті читайте за посиланням:
4,47K