Xeon Phi: 72jádrový čip pro výkonné desktopy

Karel Javůrek 18. listopadu 2015

Další
článek Chytré ledničky by mohly mít i vlastní čich SDÍLET NA FACEBOOKU TWEETNOUT

Intel Xeon Phi míří ze superpočítačů i na desktopy
Intel bude dodávat 72jádrovou verzi už příští rok
Výpočetní výkon jedné karty s jedním čipem je 3 TFLOPS

Cesta k Intelu k výkonnému paralelnímu čipu byla dlouhá a zrádná. Pokud patříte mezi „pamětníky“, jistě si vzpomenete na Larrabee a postupný odklon od výkonné grafiky k výpočetní kartě. V rámci grafických čipů se Intelu soustředil na integrované modely v procesorech a výkonné vícejádrové čipy pro rychlé zpracování paralelních dál zastoupil Xeon Phi, který už je v druhé generaci.

Xeon Phi: pro superpočítače i pracovní stanice

Výpočetní karta Xeon Phi od Intelu je synonymem paralelního výkonu, je totiž základem nejvýkonnějšího superpočítače dneška – Tianhe-2, který se pyšní výkonem 33,86 PFLOPS.

Knights Landing má 72 jader s architekturou jako 14nm Atomy

Nejnovější generace s označením Knights Landing už má 14nm čip, který má celkem 72 jader s instrukční sadou x86. Jedná se o architekturu Airmont, čímž se dá obecně říci, že jde o „72jádrový Atom“ s podporou zpracování až 288 vláken současně. Čip má tak jasnou výhodu oproti specializovaným grafickým čipům, na které musí vývojáři programovat aplikace jinak, než pro klasické procesory.

Podobně jako třeba nové grafické čipy Fiji (Radeon R9 Fury) od AMD, i Knights Landing obsahuje přímo na čipu rozmístěné rychlé složené paměti, v tomto případě ale nejde o standard HBM, ale o MCDRAM (Mutli-Channel DRAM) s kapacitou 16 GB na jeden čip, respektive kartu Xeon Phi. Podle informací jde o technologii podobnou HMC (Hybrid Memory Cube).

Oproti novým operačním pamětem DDR4 nabízí až pětkrát vyšší propustnost, pětkrát lepší efektivitu než paměti GDDR5 a zároveň třikrát vyšší kapacitu při stejné velikosti.

Použité paměti MCDRAM jsou přímo na čipu, podobně jako u nových grafických karet Fury od AMD

Celkový výkon jednoho čipu činí 3 TFLOPS (DP), přičemž vývojáři mají k dispozici i pokročilé instrukce jako AVX-512 a další. Pokud to srovnáme s nejnovějším kartou Radeon R9 Fury X od AMD - výkon v DP je „pouze“ 537 GFLOPS, tedy přibližně šestkrát nižší.

Omni-Path: bez rychlého spojení to nejde

Pro využití Xeon Phi ve velkých serverech i superpočítačích, má Intel i pokročilou architekturu Omni-Path, která zjišťuje rychlé spojení pro přenos dat a lepší efektivitu.

Intel se chlubí propustností 100 Gb/s a oproti Infiniband EDR má o 17 % nižší odezvu a umožňuje o 26 % více clusterů zapojených v systému. Hlavní předností je ale výrazně nižší spotřeba, která je až o 60 % menší než s Infiniband EDR. Lze také použít stávající software OpenFarbrics Alliance (OFA) a Intel OPA.

V prodeji příští rok

Zatímco Xeon Phi v superpočítačích byl stále v rámci testovacíh vzorků, nyní nastává doba, kdy se dočkáme finálních produktů zaměřených jak na superpočítače, tak i na výkonné pracovní stanice. První zákazníci dostanou vzorky ještě do konce tohoto roku, velký prodej bude zahájen během prvního čtvrtletí roku 2016.

Intel nabízí kompletní řešení pro stavbu výkonných systémů

A co nás čeká v další fázi? Třetí generace Intel Xeon Phi s označením Knights Hill bude postavena na 10nm čipech a druhé generaci architektury Omni-Path. Poprvé se s třetí generací dočkáme nejspíše u superpočítače Aurora, který by měl mít výkon 180 PFLOPS, respektive teoreticky až 450 PFLOPS. Více jsme o tomto superpočítači psali v samostatném článku, takže lze jen dodat, že by v provozu měl být kolem roku 2018.