Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Пориньте в архітектури графічних процесорів @nvidia 🐰 Hopper і ⚙️ Blackwell – послідовні стрибки в обчислювальній потужності та з'єднаннях для ваших робочих навантажень зі штучним інтелектом👇

🐰 Hopper (H100 і H200) представив тензорні ядра 4-го покоління + трансформаторний двигун FP8, що забезпечує до 9× швидшого навчання та на 30× швидшого висновку порівняно з A100.
⚙️ Blackwell (B200) — постачання наприкінці 2024 року — з'єднує два кристали на NV-HBI зі швидкістю 10 ТБ/с, додає FP4 і використовує NVLink-5 для виведення до 30× кластера.


🐰 @nvidia Технічні характеристики бункера
Тензорні ядра: змішані FP8/FP16/TF32
Пам'ять:
- H100 → 80 ГБ HBM3 @ 3.35 ТБ/с
- H200 → 141 ГБ HBM3e @ 4.8 ТБ/с
NVLink: до 900 ГБ/с на графічний процесор
🐰 @nvidia Бункер в дії
Бенчмарки показують, що H200 живить Llama-2 70B на 45–100% швидше порівняно з H100.
⚠️ Обидва зіткнулися з кризою поставок у 2023–25 роках.
💻 На хмарі Hyperbolic: H100 віртуальні машини та кластери з Ethernet + InfiniBand за ціною від $1,49/год. H200 і B200 через миттєве котирування.

⚙️ @nvidia Інновації Blackwell
- Конструкція чиплета (TSMC 4NP, транзистори 208 Б, 10 ТБ/с NV-HBI)
- Трансформаторний двигун 2-го покоління: FP4 + покращений FP8
- NVLink-5: 18 посилань @ всього 1,8 ТБ/с
- Декомпресійний двигун: 800 Гбіт/с CPU↔GPU
- Повна RAS і конфіденційні обчислення
📊 Порівняння продуктивності
H100 SXM: 80 ГБ @ 3.35 ТБ/с, 3.96 PFLOPS (FP8), 1.98 PFLOPS (FP16), 67 TFLOPS (FP32), NVLink 900 ГБ/с, 700 Вт
H200 SXM: 141 ГБ @ 4.8 ТБ/с, той самий обчислювальний PFLOPS/TFLOPS, NVLink 900 ГБ/с, 700 Вт
HGX B200: 180 ГБ @ 7,7 ТБ/с, 9 ПФЛОПС (FP8), 4,5 ПФЛОПС (FP16), 75 ТФЛОПС (FP32), NVLink 1,8 ТБ/с, 1000 Вт
❓ @nvidia Що таке флоп?
1 операція з плаваючою комою (add/mul)
1 ТФЛОП = 10¹² оп/с
1 PFLOP = 10¹⁵ ops/s = 1000× TFLOP
Ці показники показують, наскільки швидко графічні процесори обробляють масивну математику, що лежить в основі навчання штучного інтелекту та HPC.
🔚 @nvidia Підбиття підсумків:
🐰 Hopper встановив планку за допомогою трубопроводів змішаної точності та асинхронності FP8.
⚙️ Blackwell просуває наступне покоління з FP4, більшим обсягом пам'яті, NVLink-5.
H100 залишається робочою конячкою — оренда за 1,49 долара за годину.
H200 і B200 доступні за запитом через
@nvidia Повний текст статті читайте за посиланням:
4,47K
Найкращі
Рейтинг
Вибране