APU Trinity – AMD wraca do gry
Jeśli chodzi o platformy mobilne to AMD nigdy nie udało się stworzyć choćby namiastki konkurencji dla rozwiązań Intela. Kilkukrotne próby kończyły się zwyczajnie porażkami. Rozwiązania „zielonych” były mniej wydajne, bardziej się grzały i działały krócej na baterii. Sytuacja nieco się tylko zmieniła gdy AMD pokazało platformę Brazos i Sabine. Można by rzec, że tylko ta pierwsza odniosła umiarkowany sukces. Choć celowała ona w segment netbooków to pokazała, że AMD jest w stanie namieszać na rynku. Druga platforma mobilna nie została praktycznie zauważona, ani przez nabywców ani też przez producentów. Niestety w dużych notebookach stagnacja trwała w najlepsze. Do czasu. Wraz z pojawieniem się platformy Trinity, AMD podjęło rękawicę i w mojej ocenie może w kolejnym segmencie wstrzelić się z wydajnym produktem w przystępnej cenie. Przyjrzyjmy się bliżej, co też przygotowali dla nas inżynierowie z Sunnyvale. Testujemy inżynieryjnego laptopa na mobilnej platformie ze zintegrowanym w procesorze układem graficznym (APU) pod nazwą AMD Trinity.
Poprawiony Buldożer w wersji mobilnej
Zacznijmy od serca Trinity czyli CPU. Chip został oparty o nieco zmodyfikowaną architekturę Bulldozer znaną dotychczas z procesorów desktopowych AMD FX. W zeszłym roku, kiedy miały premierę, po szumnych zapowiedziach okazało się, że nie były one ani tak wydajne jak byśmy tego oczekiwali ani energooszczędne. Jednak w miarę dobra wydajność (według AMD :)) posłużyła jako punkt wyjścia do stworzenia wersji mobilnej tego układu. Trzeba było jednak zmierzyć się z nie lada problemem jakim w tym przypadku była prądożerność jednostek desktopowych. W rozwiązaniach mobilnych niski pobór energii jest kluczowy dla powodzenia całego przedsięwzięcia. Tak narodził się pomysł na Bulldozera 2.0, który znalazł swoje miejsce we wnętrzu APU Trinity w postaci architektury Piledriver. Inżynierowie z AMD razem firmą Cyclos zastosowali w nowym układzie nowatorską metodę dystrybucji sygnału zegarowego, co przełożyło się na obniżenie poboru prądu średnio o 10 %. Niby niewiele. Jednak wraz ze wzrostem częstotliwości pracy oszczędność energetyczna rosła, co przełożyło się na kolejne 25-30 %. W ten sposób powstały trzy warianty układu o zmiennym TDP. Standardowo jest to 35 W a dla niskonapięciowych modeli 25 i 17 W.
Piledriver to modułowa architektura, całkowicie inna niż stosowane klasyczne rdzenie w Llano. Moduł taki odpowiada dwóm rdzeniom klasycznym. Jednak część zasobów modułów jest dostępna pojedynczo (dekoder, FPU, pamięć podręczna) a tylko rdzenie x86 są dostępne w ilości dwóch. Taka budowa przekłada się na jakieś 80 % wydajności typowego procesora dwurdzeniowego. Nie jest to wartość stała w związku z czym w różnych zastosowaniach mogą występować znaczne różnice.
APU zostało wykonane w procesie technologicznym 32 nm. Na powierzchni 246 mm kwadratowych upchnięto 1393 mld tranzystorów. W każdej takiej jednostce znalazło się miejsce dla 1 lub 2 modułów (2 lub 4 rdzenie), maksymalnie do 4 MB pamięci cache drugiego poziomu, GPU ze 192, 256 lub 384 jednostkach ALU z obsługą DirectX 11. Nie zabrakło też UVD3 (Unified Video Decoder 3) i AVC (Accelerated Video Converter) oraz dwukanałowego kontrolera pamięci DDR3 1600 low voltage i DDR3 1333 ultral low voltage.
Popatrzmy jak zmienił się układ graficzny zintegrowany z procesorem. Wydaj się, że droga którą poszło AMD jest nieco odmienna od Intela. U „zielonych” średnio wydajny procesor połączono z bardzo wydajnym układem graficznym. Natomiast „niebiescy” dotychczas stosowali bardzo wydajne procesory z dużo mniej wydajnymi układami graficznymi. Przyjrzyjmy się bliżej GPU, które znajdziemy w Trinity. Po pierwsze, wysłużoną serię HD 5000 (Evergreen) zastąpiono dużo nowszą architekturą VLIW4, którą można znaleźć w kartach graficznych dla desktopów z serii HD 6900 (Norhern Islads). W najbardziej rozbudowanej wersji karty (Radeon HD 7660G – taką wersję mieliśmy okazję testować) znalazło się 384 jednostki ALU, 24 TMU i 8 jednostek ROP. Zegar układu graficznego może pracować z maksymalną częstotliwością 686 MHz. W stosunku do poprzednika znacznie ulepszono teselator co przełożyło się na znaczne poprawienie wydajności. Niestety GPU nie posiada dedykowanej sobie pamięci a mało tego, nie może też korzystać z pamięci cache procesora. Niezbędna do pracy pamięć jest alokowana z pamięci RAM, która, jak wiadomo jest dużo wolniejsza.
Układ graficzny generuje obraz na wyjściach HDMI, DVI, DisplayPort 1.2 i dodatkowo jest zgodny z technologią AMD Eyefinity, która umożliwia generowanie jednego obrazu na czterech monitorach. Trzy monitory podłączymy bezpośrednio do zintegrowanych wyjść video, jeśli zechcemy podłączyć czwarty monitor niezbędne okaże się użycie rozdzielacza DisplayPort. Nie zapomniano też o funkcji Dual Graphics. Niestety dobór kart zewnętrznych został dość mocno ograniczony. Użytkownicy, którzy będą chcieli skorzystać z tej funkcjonalności mogą przebierać wśród modeli o takich symbolach jak: Radeon HD 7670M, HD 7650M, HD 7550M, HD 7540M i HD 7450M. Trzeba pamiętać, że mówimy tu o konfiguracji w notebooku! Na jaki wzrost wydajności w grach możemy liczyć? Według AMD nawet o blisko 90 %. Dla mnie bomba.
Wsparcie programowe
Wiadomo nie od dziś, że sam sprzęt to nie wszystko. Dopiero z odpowiednim oprogramowaniem całość jest w pełni funkcjonalna i potrafi zadziwić niejednego wyjadacza komputerowego. AMD wzięło lekcję historii i już na etapie projektowania APU mocno wsparło też producentów oprogramowania. Mówimy tu o takich gigantach jak Adobe, WinZip, Microsoft i jeszcze przynajmniej kilka dziesiątek innych firm.
Dzięki coraz większej popularyzacji OpenCL i DirectCompute przekłada się to na lepszą wydajność w wielu aplikacjach i to praktycznie w dniu premiery nowego APU. Z czasem lista aplikacji jeszcze się powiększy. Na tym oczywiście nie koniec. W Trinity pojawił się HD Media Accelerator. To nic innego jak dekoder UVD w wersji 3, sprzętowo przyspieszający dekodowanie strumieni wideo (takich jak H.264, VC-1, MPEG 2, MVC, DivX, WMV) wspierany przez koder AVC (Accelerated Video Converter), który usprawni proces konwersji różnych formatów multimediów. Rozwiązanie to można porównać do Intel Quick Sync Video, który podczas transkodowania pobiera znacznie mniej energii, natomiast w rozwiązaniu AMD postawiono na znaczne przyspieszenie całego procesu co w rezultacie przekłada się też na oszczędność energetyczną poprzez skrócenie czasu działania.
W nowym APU znajdziemy jeszcze dwie ciekawe funkcje. Mianowicie Quick Stream i Steady Video. Pierwsza z nich nadaje wyższy priorytet strumieniowej transmisji wideo. Dzięki temu podczas odtwarzania materiału z Internetu nie powinna się zdarzyć sytuacja, że odtwarzany klip stanie w miejscu a w tym czasie będą doczytywane dane. Drugie rozwiązanie też jest wielce pomocne. Funkcja Steady Video stabilizuje obraz, który normalnie po nagraniu drży i jest poruszony. Funkcja ta jest o tyle ciekawa, że nie używa się jej w czasie obróbki filmu ale już na opublikowanym materiale np. na youtubie. Nie ma jednak róży bez kolców. W tym przypadku może dojść do niepożądanego efektu ubocznego. Stabilizowany materiał może miejscami być nieostry. Jednak w ogólnym rozrachunku jest i tak lepiej niż bez tej funkcji. Zresztą popatrzcie sami.
WydajnośćJak już wspominałem producent postawił sobie za cel wyciśnięcie maksymalnych osiągów przy zmniejszonym o połowę zapotrzebowaniu na zasilanie w stosunku do poprzedniego rozwiązania (Llano). Czy mu się udało? Na to pytanie powinien dać odpowiedź akapit, który właśnie czytacie.
Zacznijmy od popularnej aplikacji jaką niewątpliwie jest 3DMark Vantage. Test odbywał się w rozdzielczości 1280x1024 i w niej to platforma AMD Trinity uzyskała ogólny wynik 4621 punktów. Na niego złożyły się dwa wyniki cząstkowe: GPU: 4250 i CPU: 6282. Do porównania posłużył już wiele razy wymieniany w recenzjach mój Lenovo W 510 z procesorem Intel i7, kartą graficzną NVIDIA Quadro FX 880 i 6 GB pamięci RAM. Po specyfikacji widać, że rozwiązanie AMD nie powinno mieć żadnych szans. Nic bardziej mylnego. W tym samym teście i w tej samej rozdzielczości moje Lenovo uzyskało ogólny wynik 2629 punktów. W tym GPU uzyskało tylko 2113 punktów! Honor uratował procesor uzyskując 9819 punktów. Zaskoczeni?
W teście PCMark 7 sytuacja jest podoba. To znaczy, że Trinity osiąga większą ilość punktów (3273) niż moje Lenovo W 510 (2019). Tutaj jednak stanę w obronie mojego Lenovo, gdyż wyniki tej aplikacji w dużej mierze opierają się o wydajność dysku twardego a laptop z Trinity akurat korzystał z dysku SSD.
W popularnym teście Cinebench 11.50 CPU szału nie robi i uzyskuje wynik 2,09 to nieco lepiej niż procesor Intel i3 2310, ale dużo mniej niż i7. Wrażenie natomiast robi wynik GPU. 31,39 fps to wynik praktycznie identyczny z kartą GeForce GTX 280M i nieco tylko gorszy od karty Radeon HD 4850! Widać że optymalizacja pod OpenGL w najnowszej odsłonie APU działa wyśmienicie. GPU dorównuje kartom, które jeszcze nie tak dawno były obiektami westchnień niejednego gracza!
Na prośbę jednego z naszych czytelników przeprowadziliśmy testy w aplikacji SPECviewperf 11. To bardzo ciekawy benchmark symulujący wydajność karty graficznej w środowisku CAD. Wśród poszczególnych testów znajdziemy min. Catia test, Maya, LightWave czy SolidWorks. Jak w tak dość specyficznym środowisku sprawuje się rozwiązanie AMD? Powiem tak, trzeba zdać sobie sprawę, że zintegrowana karta graficzna nie nadaje się do tego typu zastosowań. Tylko zdeklarowany masochista czerpał by przyjemność z męczarni jakie przechodziło APU w tym teście. Różnice między NVIDIA Quadro FX-880 są kolosalne. W końcu do tego rodzina kart Quadro została stworzona. Nie ma sensu pokazywać masy cyferek, różnica jest ogromna. Miałem okazję sprawdzić inne konkurencyjne rozwiązanie od Intela, i w tym porównaniu AMD jest zdecydowanie górą.
Kolejny test to x264 HD Benchamrk. Tu można było się przekonać jak w rzeczywistości działa HD Media Accelerator. Ponownie porównywałem z Lenovo W510 i kolejny raz otrzymałem dość zaskakujące wyniki. Otóż AMD w pierwszym przebiegu testu wygenerowało większą średnią ilość klatek niż Intel. Dokładnie 68,69 fps do 62,67 fps w Lenovo. Niewielka różnica, ale ponownie AMD górą i to nad procesorem ze zdecydowanie wyższej półki.
Nie mogło zabraknąć testów w aplikacjach, które wspierają OpenCL. Na początek poszedł WinZip 16.5. Wersja, która w ustawieniach ma możliwość włączenia optymalizacji dla OpenCL. Za próbkę posłużyły małe pliki w ilości 2969 i pojemności początkowej 1 GB. Pakowanie bez włączonej optymalizacji zajęło programowi dokładnie 73 sekundy. Po włączeniu optymalizacji i na bazie tej samej próbki ta sama operacja zajęła 48 sekund. Przyznać trzeba, że wzrost jest znaczący. Następną aplikacją był Adobe Photoshop CS6. Nałożenie filtra na fotografię o dużej rozdzielczości trwało zaledwie kilka sekund zamiast kilkudziesięciu!
No dobrze, testy syntetyczne w pewnym sensie obrazują w jakim miejscu wylądowało AMD ze swoim Trinity. Jednak nie można zapominać o typowych zastosowaniach komputera jakimi niewątpliwie są gry. Tu większość z Was zakrzyknęłaby, że granie na integrze to profanacja. I trudno się z tym nie zgodzić. Jest jednak jedno małe ale. Jak wspominałem wcześniej, zintegrowane GPU to zmodyfikowany Radeon HD 6900. Czyli nawet w tej chwili całkiem solidna średnia półka wśród niezależnych kart graficznych. Oto jakie miałem wrażenia podczas uruchamiania coraz to bardziej wymagających gier.
Zacząłem spokojnie od starszego tytułu jakim jest nieśmiertelny Half Life 2. Ustawiona rozdzielczość to 1280x1024, detale wysokie i gramy. Nie mierzyłem fps-ów, opisuję tylko swoje doznania. Było płynnie i szybko, bez przycinek, po prostu tak jak powinno być. Grało się przyjemnie bez jakichkolwiek zgrzytów. Kolejny tytuł to F.E.A.R. 2, młodsza i przy tym bardziej wymagająca. Jak to się przekłada na doznania z gry? Ustawienia identyczne jak w poprzedniej produkcji. Gramy. Czuć pewne spowolnienie, jednak nijak nie wpływa ono na jakość rozgrywki. Nadal płynność jest wyśmienita i frajda z gry dosłownie bezcenna :). Kolejny tytuł to Metro 2033, wiadomo wymagający i obciążający niejeden mocny sprzęt. Tu niestety pierwsze zgrzyty. Z detalami ustawionymi na High grać się nie da. Po zmniejszeniu na średnie jest dużo lepiej choć zdarzają się momentami przycinki. Grać ogólnie się da lecz nie nazwałbym tego komfortowym. W StarCraft 2 identyczna sytuacja. Przy wysokich detalach gra nie jest dynamiczna i widać gołym okiem że nie jest płynna. Po zmianie na średnie detale gra staje się o wiele przyjemniejsza w odbiorze i można czerpać przyjemność z rozgrywki. Bardzo pozytywnie zaskoczyła mnie Fifa 12. W tym tytule można się świetnie bawić nawet przy ultra ustawieniach.
Znalazło się też kilka tytułów w które praktycznie nie pogramy na Trinity. Nie wiedzieć czemu, gry te chodziły wyjątkowo opornie i granie w nie nawet przy podstawowych ustawieniach było po prostu męczące. Takimi perełkami są np.: S.T.A.L.K.E.R.: Call to Pripyat, nasz rodzimy Wiedźmin 2: Zabójcy Królów czy nawet leciwa już produkcja ArmA 2.
Na osłodę dodam, że uruchomiłem Diablo III. Choć nie spodziewałem się rewelacji to zostałem miło zaskoczony. W rozdzielczości 1280x1024 grałem na wysokich detalach, a gra była na tyle przyjemna, że spędziłem z nią jeden cały upojny weekend :) praktycznie tylko z przerwami na podstawowe czynności niezbędne do przeżycia i kilka godzin snu. Uruchomiłem ją też na już wielokrotnie przytaczanym Lenovo i mam nieodparte wrażenie, że przy tych samych ustawieniach grało mi się mniej komfortowo.
Na koniec chciałbym zaprezentować pewną ciekawostkę, którą udało mi się uchwycić podczas zabawy z Trinity. Otóż przy jednoczesnym uruchomieniu aplikacji CPU-Z i GPU-Z, ta druga aplikacja przestawała reagować natomiast CPU-Z wskazywał zawrotną prędkość ponad 8 GHz. Przyznacie chyba, że w tym APU drzemią ogromne moce :)
Co dalej?
Widać że firma z Sunnyvale odwaliła kawał dobrej roboty. Co prawda obcowałem tylko z samplem inżynieryjnym, który w takiej postaci do sprzedaży nie trafi. Jednak widać po nim, że przed Trinity świetlana przyszłość. Wsparcie ze strony producentów oprogramowania jest a producenci notebooków już zapowiedzieli modele oparte o nową platformę. Choć wydajność samego CPU nie powala to w połączeniu z genialnym GPU możemy spodziewać się naprawdę wydajnego sprzętu. Dodatkowymi atutami platformy będzie tych kilka unikatowych funkcji, które opisałem powyżej.
Samo AMD podaje, że najtańsze konfiguracje z Trinity nie powinny kosztować więcej niż 2,4 tyś złotych (w momencie publikacji już pojawiły się oferty w cenach nawet 2,1 tyś złotych), bardziej rozbudowane konfiguracje (dysk SSD, dodatkowa karta VGA) mogą osiągnąć ceny gdzieś w okolicach 3 do 3,5 tyś złotych. Jestem przekonany, że w tym segmencie cenowym może zawrzeć co oczywiście przełoży się na niższe ceny dla nas konsumentów. Wszak nic tak dobrze nie robi na rynek jak zdrowa konkurencja:). Jak wiecie konkurencja już jest i tylko czeka aby zdetronizować było nie było lidera w integracji CPU z GPU.
AMD nie poprzestaje na tym co już pokazało i ma całkiem ciekawe plany na przyszłość. Wiadomo już, że światło dzienne ujrzą jednostki desktopowe na architekturze Piledriver. Producent też nie zamierza odpuścić programistom. Na niedawno zakończonym AFDSie, o którym więcej pisał Docent na swoim blogu pokazano narzędzie deweloperskie o nazwie Code XL. Pozwala ono tworzyć profile dla APU, gdzie odpowiednio będą zarządzane CPU i GPU oraz pomoże wychwycić błędy podczas programowania (debbuger). Jak widać otwarte biblioteki OpenCL znalazły kolejny przyczółek, na którym mogą pokazać możliwości i wydajność układów heterogenicznych. Pakiet Code XL pojawi się jako dodatek do Microsoft Visual Studio 2010, również jako osobna aplikacja dla systemów Windows oraz jako program dla systemów Linux.