Strojové učení | AMD | Servery

AMD Radeon Instinct: nové grafické akcelerátory pro strojové učení

  • AMD představilo budoucnost v oblasti hardwaru a softwaru pro serverové nasazení
  • Společným jmenovatelem je strojové učení a neuronové sítě
  • Nové grafické akcelerátory budou konkurovat například i Tesla P100 od Nvidie

V oblasti akceleraci strojového učení, hlubokých neuronových sítí, big data nebo umělé inteligence obecně si Nvidia v posledních letech vybudovala velmi silnou pozici i s vlastním frameworkem CUDA a dalšími nástroji.

V segmentu serverů má tak AMD po stránce grafických akcelerátorů mnohem slabší pozici, ale to by se mohlo změnit s novými generacemi jak grafických akcelerátorů, tak i softwaru a kompletní řešení i s procesory Zen.

Radeon Instinct: kombinace hardwaru a softwaru

AMD pod označením Radeon Instinct zahrnuje dvě části – hardware v podobě nových grafických akcelerátorů a také otevřenou softwarovou platformu s označením ROCm (Radeon Open Compute Platform).

Klepněte pro větší obrázek
Stavení bloky Radeon Instinct

Výhodou je, že tato platforma už je na trhu přes rok, takže již existuje podpora řady nástrojů, knihoven a frameworků. Přehled můžete vidět na obrázku, je mezi nimi například Caffe nebo třeba i TensorFlow od Googlu.

Klepněte pro větší obrázek
Softwarová platforma ROCm

Oproti Nvidii, která staví na více uzavřené platformě, se tak AMD snaží vybudovat otevřenou variantu. Jak už jsme ale zmínili, Nvidia si za poslední roky vybudovala obří komunitu a v oblasti serverů a datacenter jsou akcelerátory Nvidia jedním z důvodů masivního růstu příjmů v posledních čtvrtletích. AMD tak z tohoto pohledu nic jiného, než otevřenost nezbývá, protože uzavřené řešení by nemohlo s Nvidií konkurovat.

Pasivně chlazení akcelerátory

AMD představilo tři modely grafických akcelerátorů Radeon Instinct. Jedná se o modely Instinct MI6, MI8 a MI25. Nejslabším modelem je Instinct MI6, který je postaven na moderním 14nm čipu s architekturou Polaris a v rámci TDP 150 W poskytuje výpočetní výkon 5,7 TFLOPS (SP, ve stylu Radeonu RX 480)). Karta je v tomto případě vybavená 16 GB paměti GDDR5 s propustností 224 GB/s.

Klepněte pro větší obrázek
Přehled akcelerátorů Radeon Instinct

Výkonnější model Instinct MI8 má zcela odlišnou konfiguraci, protože využívá ještě staršího 28nm čipu s architekturou Fiji, ale zároveň s 4 GB rychlé paměti HBM. Díky tomu je paměťová propustnost 512 GB/s. Celkový výpočetní výkon je 8,2 TFLOPS (SP) s TDP 175 W (podobně jako starší Radeon R9 Nano řady 300).

Klepněte pro větší obrázek

Nejvýkonnějším modelem bude Radeon Instinct MI25, který už bude mít čip založený na architektuře Vega. V rámci TDP 300 W poskytne výkon 12,5 TFLOPS (SP, při FP16 pak 25 TFLOPS). Další informace o tomto modelu zatím AMD bohužel neprozradilo. Tento model by měl ale přímo konkurovat nejvyššímu modelu od Nvidie – Tesla P100. Podle grafů je Radeon Instinct MI25 v testu DeepBench GEMM téměř dvakrát výkonnější, než nejnovější Titan X s architekturou Pascal od Nvidie.

Klepněte pro větší obrázekKlepněte pro větší obrázek

Ve všech případech jsou karty vybavené pouze pasivním chlazením, takže nemají žádné ventilátory. Generované teplo je ale pochopitelné nutné odvádět aktivním chlazením v rámci samotného serverového racku.

Kompletní řešení nejdříve v polovině příštího roku

I když nové výpočetní karty vypadají nadějně, AMD se potýká s problémem, který už trvá poměrně dlouho – dostupnost. Zatímco Nvidia už nové modely prodává, AMD by mělo možná stihnout první polovinu roku 2017, kdy už zase Nvidia může představit nejen nové modely, ale také klidně snižovat ceny a ještě více tak poškodit AMD.

Klepněte pro větší obrázek
Jeden procesor Zen dokáže díky podpoře 64 linek obsloužit čtyři karty napojené na PCI Express x16

AMD má ale oproti Nvidii šanci vytvořit kompletní serverovou platformu Naples na bázi čipů Zen, která by mohla cenově a výkonově konkurovat právě kombinaci Intel + Nvidia. Bude moci nabídnout celkem 64 linek PCI Express x16 v rámci jednoho procesoru, což znamená možnost připojit čtyři karty bez zpomalení propustnosti na sběrnici.

Klepněte pro větší obrázek

Ve výsledku tak může být kompletní řešení od AMD levnější, i když nelze předpokládat, že v oblasti procesoru bude výkonnější než Intel. Procesor je ale pro trénování hlubokých neuronových sítí a zpracování big data oproti výpočetním kartám stejně velmi neefektivní, takže v tomto případě záleží hlavně na výkonu akcelerátorů a celkové ceně a spotřebě platformy.

Váš názor Další článek: Google s chytrými automobily nekončí. Bude je vyvíjet startup Waymo, který spadá pod Alphabet

Témata článku: Umělá inteligence, Strojové učení, AMD, Grafické karty, Čipy, AMD Zen, Servery, TensorFlow, Datacentra, AMD Radeon RX Vega, Tesla Model S, Tesla Model X, Fiji, AMD Radeon, Trénování paměti, Polaris, Radeon, Nejslabší model, Neefektivní inteligence, Masivní růst, Tesla Model 3, AMD Vega, Aktivní chlazení, Pascal, Gemma


Určitě si přečtěte

Tohle tak jednou zažít: Nová vzducholoď Airlander 10 s prosklenou podlahou

Tohle tak jednou zažít: Nová vzducholoď Airlander 10 s prosklenou podlahou

** Airlander 10 nabídne plavby vzduchem v interiéru s prosklenou podlahou ** Luxusní vzducholoď byla původně vyvíjena pro vojenské účely ** Počítá se s třídenními „kochacími“ výlety za poznáním

Karel Kilián | 7

The Pirate Bay má vážné problémy. Možná se opravdu blíží její konec

The Pirate Bay má vážné problémy. Možná se opravdu blíží její konec

** Kdysi nezničitelný pirátský web se potýká s problémy ** Z mnoha míst je už měsíce nedostupný ** Další krize dorazila v neděli

Jakub Čížek | 70

Vyzkoušeli jsme eObčanku a přihlásili se s ní na weby úřadů. Vážně to funguje!

Vyzkoušeli jsme eObčanku a přihlásili se s ní na weby úřadů. Vážně to funguje!

** Máme eObčanku, máme čtečku, vyzkoušeli jsme přihlášení na weby úřadů. ** Objevily se drobné problémy, podařilo se nám je vyřešit. ** Používání eObčanky pro online identifikaci je velmi pohodlné.

Marek Lutonský | 37

Tipy pro Google: Umí mnohem víc než jen vyhledávat, zkuste některé fígle

Tipy pro Google: Umí mnohem víc než jen vyhledávat, zkuste některé fígle

** Google není jen vyhledávací pole se dvěma tlačítky ** Můžete ho ovládnout pomocí parametrů a příkazů ** Kromě výsledků vyhledávání nabízí také další funkce

Karel Kilián | 15