Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Byl bych rád, kdyby se to také stalo. V praxi si ale nejsem jistý, jak něco takového implementovat.
Dotuje vláda Fedu jednoduše náklady na to, aby si otevřené laboratoře tento hardware pořídily? Jednalo by se o průběžnou dotaci (nyní potřebujete nový hardware často) a jak vybrat, které laboratoře dotaci dostanou? Ubrousková matematika pro 10K H200 je pravděpodobně severně od 300 milionů dolarů, pokud použijeme jednoduchý předpoklad ~30 tisíc dolarů za H200. A to je jen pořízení hardwaru GPU. Potřebujete je někde, kde je budete provozovat spolu s provozními náklady, abyste je udrželi.
Pokud donutíte stávající vlastníky počítačů, aby si vyčlenili určitou část svých zásob a poskytli je těmto laboratořím, budou také potřebovat nějakou formu dotace. Většina z těchto společností říká, že jsou nyní také omezeny dodávkami.
V každém případě se zdá, že směřujeme k vytvoření nového výpočetního paradigmatu. Paradigma se dosud točilo kolem škálování společně umístěných výpočtů. Není pochyb o tom, že v USA i jinde bude stále docházet k výstavbě datových center o velikosti Manhattanu. Budou zde však také menší výpočetní ostrovy různé velikosti, které jsou propojeny vlákny atd. Až se budou jednat o nová/standardní omezení a zásadní omezení, posune to širší výzkumnou komunitu AI do nových, neprozkoumaných směrů.
Následný dopad by mohl znamenat velkou a rostoucí divergenci mezi výzkumem, modelovými architekturami, ekonomikou atd. produkovanými mezi největšími, uzavřenými laboratořemi umělé inteligence (těmi, které pracují s efektivně masivními jednotlivými datovými centry) a těmi (pravděpodobně akademiky a decentralizovanými společnostmi zabývajícími se umělou inteligencí), které používají více distribuované výpočetní clustery (tj. malé, ale četné výpočetní ostrovy). Není jasné, jak to dopadne pro obě strany (a nakonec i pro spotřebitele modelů, které každá z nich vyrábí), ale zdá se, že se věci ubírají směrem.
Dalo by se dokonce namítnout, že záblesky toho už jsme viděli. Čínské laboratoře mají zásadně odlišná výpočetní omezení než například laboratoře OpenAI. Tyto čínské laboratoře kvůli tomu musely inovovat techniky trénování/odvozování. Není to dokonalá analogie, ale možná může pomoci objasnit, jak vypadají "malé krůčky" směrem k novému paradigmatu, a v průběhu času se tyto malé krůčky skládají a vytvářejí něco, co vypadá/funguje zcela jinak než to, co produkuje druhá cesta.

4. 8. 22:08
Aby se tento problém vyřešil, je klíčovou prahovou hodnotou zdrojů mít více otevřených laboratoří, z nichž každá má 10000+ GPU.
Více laboratoří to umožňuje, abychom nebyli zavázáni přízni velkých technologických společností, abychom chtěli vydávat modely. Tyto instituce zvyšují inovace + snižují rizika této klíčové technologie.
627
Top
Hodnocení
Oblíbené