Základní myšlenkou CUDA i Streamu je přenést výpočty z centrálního procesoru na ten grafický, který dokáže zpracovávat náročné operace rychleji a efektivněji. Díky architektuře zvládne grafika operace s plovoucí desetinnou čárkou několikrát rychleji než klasický procesor. Pokud vás zajímá, jak obstojí nová technologie od ATI ve srovnání s nVidií, čtěte dále.
Základní myšlenka
Výhodou programovatelných shaderů grafického procesoru je jejich velké množství, díky tomu zvládnou GPU zpracovávat paralelně více procesů než CPU. Core i7 jich na čtyřech jádrech dokáže až osm najednou, ale grafická karta třeba 480. K využití této pokrokové technologie je zapotřebí mít ve výbavě software, který je pro ni napsán, klasické aplikace to nedokážou.
V době, kdy byl Stream představen koncem minulého roku, uměl pouze enkódování videa do formátů MPEG-2 a H.264. zatímco akcelerace byla v pořádku, horší to už bylo s kvalitou. Květnová aktualizace ovladačů Catalyst na verzi 9.5 tyto chyby odstranila a přidala možnost změny rozlišení při práci s videem.
Počátky Streamu
Uvedení ovladačů Catalyst 8.12 v prosinci minulého roku přineslo Stream široké veřejnosti. Kvůli jeho rozšíření AMD upravilo svůj Avivo Video Converter tak, aby byl se Streamem kompatibilní. Byl to velký krok, nabídnout technologi komukoliv, kdo oni měl zájem, bohužel v tuto chvíli ještě nebyl software zcela dokončený. Prvotní kladné ohlasy ohledně výkonu však brzy utichly kvůli špatné kvalitě výstupu a tak o novou technologii na další půlrok nebyl zájem.
Mezi prvními vývojáři softwaru, kteří podporují ATI Stream, patří CyberLink se svým PowerDirector 7 a MediaShow Espresso, stejně jako ArcSoft se SimHD doplňkem do přehrávače TotalMedia Thetre 3. LoiLo, se kterým jsme se mohli setkat na listopadové prezentaci, stále nedokončilo vývoj editoru videa s optimalizací pro Stream. Ukázka z LoiLoScope využívala od ledna UVD akceleraci, což ale není akcelerace s využitím Streamu. Podobně je tomu taky u PowerDirector 7, od něhož se odklonila pozornost směrem k MediaShow Espresso kvůli tomu, že CyberLink stále neaktualizoval engine PowerDirectoru. Program stále využívá původní akceleraci přes starý ovladač Catalyst. Pro plnohodnotnou podporu Stremu tedy potřebujete Expresso od CyberLinku, to je zatím jediná dostupná aplikace. „MediaShow Espresso využívá naplno výhod Streamu při převádění z nebo do formátů MPEG-2 nebo AVC,“ tvrdí Tom Vaughan, ředitel obchodního rozvoje společnosti CyberLink.

ATI Avivo Video Converter
Zajímavé je, že Avivo Video Converterje nyní pouze volitelně ke stažení a není součástí standardního ovladače Catalyst. ATI se o programu nezmiňuje ani na konci své prezentace v seznamu programů kompatibilních aplikací. Jakožto nástroj pro každodenní užívání je program neintuitivní a není ani svým designem přitažlivý. Uživatelské rozhraní odpovídá tomu, které známe z Catalyst Control Center, dostupné jedním ze dvou až tří průvodců, které najdeme v nabídce. Vyberete si původní soubor, změníte cílovou složku, pokud potřebujete, a z roletového menu vyberete jeden z přednastavených neupravitelných profilů, jako je iPod nebo H.264 720p. Není to složité, ale velmi omezené.
Proč svůj program AMD tutlá v době, kdy není mnoho aplikací s podporou Streamu? AMD stojí před otázkou, zda vyvíjet vlastní program nebo podporovat software jiných výrobců. nVidia taky nemá vlastní program pro práci s videem využívající technologii CUDA, tak je pravděpodobné, že se stejnou cestou vydá i AMD, nicméně právě mít vlastní konverter by bylo v konkurenčním boji výhodou.

Vyvážená platforma
Koncept vyvážené platformy od AMD se snaží rovnoměrně využívat klíčové komponenty počítače při zachování stejné doby zpracování, ale s ponecháním dostatku místa pro využití ostatním aplikacím. To je zajisté skvělý nápad, ale jak funguje v reálu?
Dokonalé ukázky vyvážení v praxi si můžeme všimnout v prvním testu programem Espresso, ve kterém je převáděno YouTube video s rozlišením 1280×720 v MPEG-4 do menšího rozlišení 640×360 pro iPhone se zachováním H.264 MPEG-4. Na obrázcích můžete vidět výkon s grafickou kartou Radeon HD 4890, nalevo bez GPU akcelerace, napravo s aktivním Streamem. Jak vidíte, bez Streamu jede procesor naplno se všemi jádry, grafická karta je využita minimálně. Po zapnutí funkce se zvýšila aktivita na GPU, zatímco tři jádra procesoru jela na zhruba padesát procent a jedno na devadesát.

Určitě vás zajímá, jak zda se u nVidie s technologií CUDA dosáhne podobných výsledků. Jak můžete vidět na levém screenu bez CUDA, procesor jede naplno. Po zapnutí se do činnosti uvede i grafická karta, ale procesor nezpomalí a pořád je využíván na více jak devadesát procent. To může negativně ovlivnit chod některých aplikací, které provozujete současně při práci.

A jak dopadá srovnání CUDA vs Stream? nVidia vkládá do výpočtů všechno, což má za následek snížení konečného času pro zpracování o 35 procent. Zajímavější už je, že ačkoliv karty ATI i nVidia v režimu CPU dokázaly práci zvládnout za zhruba stejný čas, po zapnutí Streamu se výkon s kartou ATI zvednul o 108 procent a to s procesorem využitým o 40 procent méně než v případě CUDA.
Testy
Všechny testy probíhaly na sestavě s procesorem AMD Phenom II X4 955 s výchozí frekvencí 3,2 GHz na základní desce MSI DKA790GX, doplněné o dva DDR3 paměťové moduly Corsair s celkovou kapacitou 2 GB. Jako grafická karta pro demonstraci technologie Stream byla použita ATI Radeon HD 4890 s ovladačem Catalyst 9.5, pro CUDA od nVidie GeForce GTX 280 s ovladačem ForceWare 185.85.

V prvním testu se převádělo 22MB YouTube video do nižšího rozlišení. Jak můžete vidět v grafu, režimu práce samotného procesoru je výkon stejný, ale po zapojení technologií CUDA a Stream je na tom AMD o třetinu lépe než nVidia. Připomínám, že Stream nevyužívá procesor naplno, jako je tomu u CUDA.

Ve druhém testu došlo ke zvětšení vzorku pro převod na 191 MB, výsledkem bylo video s o něco vyšším rozlišením 720×480. Jako v předešlém případě, i zde vítězí AMD, i když náskok není tak značný jako v předešlém případě. Ten činí 142 peocent proti nVidii, která zrychlila s použitím CUDA jen o 91 procent nad převodem s využitím procesoru. Vytížení procesorů bez výpočtu na grafice bylo v obou případech kolem 90 procent, po zapojení GPU s ATI kartou kleslo na zhruba 40 procent.

Při kódování videa z MPEG-4 do WMA pro Xbox a s nižším rozlišením se dalo čekat, že CUDA ani Stream tento proces příliš neurychlí. Jak se ukázalo, je tomu tak. Zlepšení se Streamem bylo pouhých 11 sekund, v případě CUDA nešlo pro práci grafickou kartu vůbec využít, protože zcela chyběla volba pro použití grafické karty.

U testování převodu ze starého formátu MPEG-1 do MPEG-4 se zase potvrdilo, že se samotným procesorem vyjde práce nastejno s oběma grafickými kartami. Při akceleraci na GPU dochází k mírnému zlepšení ve prospěch nVidie, která si v tomto testu polepšila o 34 procent, zatímco AMD jen o 10. Celkový rozdíl činí pouze pár sekund.

DivX trailer k Pirátům z Karibiku 2 o velikosti 71 MB se převáděl do formátu pro Play Station 3 s rozlišením 720×480. Práce samotných procesorů vyšla nepatrně hůř v kombinaci s grafikou nVidia, o to lepšího výsledku bylo v této konfiguraci dosaženo s využitím CUDA. V obou případech ale šlo o drobné rozdíly pod 10 procent.

Poslední a jeden z nejdůležitějších testů, který ukazuje převod 114MB VOB souboru – trailer k filmu Mr. And Mrs. Smith do H.264. Stream od AMD si udržuje odstup ve výši 108 procent od práce samotného procesoru, zatímco nVidia CUDA jen 35 procent. Vzhledem k menšímu vytížení procesoru s grafickou kartou ATI jde odstup skutečně výrazný a dokazuje, že Stream má při práci s videem skutečně co nabídnout.
Závěr
Půl roku po prezentaci nové technologie Stream lze prohlásit, že jí skutečně patří budoucnost. Již nyní dosahuje perfektních výkonnostních výsledků a po aktualizaci ovladačů už nedochází k problémům s kvalitou na výstupu. Jedinou slabinou v současné době je nedostatek programů, jež dokážou Stream využít naplno, v tom má nVidia náskok, což je dáno dřívějším nástupem CUDA.
Už teď se ale můžeme bavit o více než silné konkurenci. S plynoucím časem se dá očekávat podpora AMD od dalších významných výrobců programů pro práci s videem a tedy i masivním rozšiřování přenosu výpočtů na grafický procesor. nVidia už není sama, kdo nabízí něco víc než výkon ve hrách, konkurenční souboj na ostří nože může začít!