Nowy AMD Opteron z serii Shanghai
Podczas spotkania analityków w kalifornijskim Sunnyvale wcześniej, niż pierwotnie oczekiwano, koncern AMD ogłosił wprowadzenie "ulepszonych procesorów Opteron trzeciej generacji", szerzej znanych pod nazwą kodową Shanghai.
Nowe Opterony to pierwsze procesory AMD wykonane w technice 45-nanometrowej. Występują one w wersji dla serwerów liczących sobie zarówno dwa, jak i cztery albo osiem procesorów o częstotliwościach taktowania od 2,3 do 2,7 GHz i wykorzystują przy tym ten sam typ gniazda F1207 co ich poprzednik o nazwie Barcelona (AMD64/K10) z czterema rdzeniami oraz starsze wersje Dual Core. Najważniejszą innowacją jest pamięć cache L3 powiększona do 6 MB. Przy takiej pojemności pamięci podręcznej można teraz, podobnie jak w Itanium 2 (technologia Pellston polegająca na naprawie błędów powstających w buforze), "wygaszać" pojedyncze linie cache. Poza tym Shanghai oferuje ulepszone zarządzanie energią i przyspieszone funkcje wirtualizacji. Firma Strato zademonstrowała potencjał wydajności dziewięciu procesorów do celów hostingu usług internetowych. Przy częstotliwościach taktowania na poziomie 2,6 GHz Shanghai (Opteron 2382) zużywał jedynie trochę więcej energii niż specjalna, energooszczędna, 65-nanometrowa wersja Opteron 2347 HE z 1,9 GHz, ale pod względem wydajności przetwarzania kodu HTML był on prawie dwa razy szybszy.
Redakcja "c't" otrzymała wcześniej dwa serwery wyposażone w procesory Shanghai z płytami firmy Supermicro do celów testowych. Podczas gdy 4-procesorowy system działał bez zarzutu, 2-procesorowy serwer w wydaniu przedseryjnym miał problemy z pamięciami DDR2-800 (PC2-6400R). Dlatego też wyniki benchmarków CPU2006 bazują częściowo na mniejszej liczbie przebiegów niż jest to wymagane i w związku z tym je oszacowano. Do testów redakcja "c't" używała nowego kompilatora Intela w wersji 11 (obecnie jeszcze jako wersja beta) działającego na 64-bitowym systemie Windows 2008 Server, a do tego z kompatybilną konfiguracją SSE3, tak aby na systemach Intela i AMD działał ten sam kod binarny - bez specjalnych optymalizacji i bibliotek. Wartości wypadły więc nieco poniżej tych prezentowanych na spec.org.
Przy takich założeniach Opteron 2384 z 2,7 GHz w porównaniu z wybraną do testów kością Harpertown Xeon (3,33 GHz, FSB1333) wygrywa, osiągając wynik (szacunkowo) 109:104, aczkolwiek w grę wchodzi tutaj kod 64-bitowy. Przy zastosowaniu kodu 32-bitowego szala przechyla się na korzyść procesora Harpertown (112:104). W teście wydajności w obliczeniach zmiennoprzecinkowych, znanym też jako SPECfp_rate_base2006 (32 bity), przewaga procesora Shanghai jest znacznie bardziej wyraźna: 81,6:65,4. Trzeba jednak zauważyć, że nowe procesory Intela i7 965 (nazwa kodowa Bloomfield, generacja Nehalem) już jako [6306 pojedyncze] procesory oferują bardzo wysoką wydajność, ale na razie nie ma jeszcze serwerów dwuprocesorowych, w których byłyby one wykorzystane. Przewidziane do tych zastosowań procesory Nehalem-EP (Gainestown) mają ukazać się w marcu przyszłego roku. Krążą jednak pogłoski, że być może teraz Intel przyspieszy ich premierę.
Czteroprocesorowemu systemowi z czterema Opteronami 8384 (2,7 GHz) przeciwstawiono nowy procesor Hexa Core Xeon X7460 (Dunnington), który w benchmarku SPECint_rate_base2006 osiąga nieco lepsze wyniki - 199:181. W teście SPECfp_rate_base2006 rezultat był remisowy - 129:129).
Warto dodać, że na spec.org pojawiły się już pierwsze rezultaty testów w CPU2006; serwer z dwoma Opteronami 2384 uzyskał wskaźnik int_base_rate_2006 na poziomie 113 punktów, a maszyna z czterema jednostkami (Opteron 8384) uzyskała 202 punkty. W benchmarku SPECfp_rate_base_2006 systemy uzyskały odpowiednio 105 i 188 punktów, ale pod Linuksem (SUSE Linux Enterprise Server, SLES 10 SP 1) i z kompilatorami PathScale (3.2) oraz PGI (7.2). Swoje wyniki testów z zastosowaniem tych jednostek Shanghai opublikował także Dell.
W benchmarku Java Business SPECjbb2005 według pomiarówPDF firmy IBM nowy Opteron 8384 w module LS42-Blade z 721 843 operacjami biznesowymi według standardu SPECjbb2005 jest lepszy o 42 procent od systemów z procesorem Dunnington. Z kolei HP opublikował wyniki testów serwera DL785 G5 wyposażonego w osiem procesorów Shanghai pod kątem wydajności SAP: 7010 użytkowników SD (1,88s, 35 400 SAPS). W tej dyscyplinie na prowadzenie wysuwa się jednak serwer IBM System x3950 wyposażony w procesory Intel Xeon X7460: 9200 użytkowników SD (1,95 s, 46 170 SAPS)
System Shanghai z pamięcią typu Registered DDR2 jest za to bardziej energooszczędny niż Dunnington ze złączami FB-DIMM (platforma Caneland): wyniki SPECPower_ssj2008 nie są jeszcze w tej chwili znane. Warto także dodać, że cena 2149 dolarów za Opterona 8384 jest znacznie bardziej przystępna w porównaniu do 2729 dolarów za Xeona X7460. MP-Xeony z rdzeniem Nehalem (Nehalem-EX) są spodziewane nie wcześniej niż w trzecim kwartale 2009 roku, a więc AMD ma jeszcze sporo czasu do chwili, kiedy konkurencja będzie mogła dać odpór nowym modelom.
Producent płyt głównych i serwerów Tyan według podawanych przez siebie informacji ma w swojej ofercie już 24 modele, które obsługują nowe 45-nanometrowe Opterony. Poza tym niektóre warianty starszych płyt są również dostosowane do dostarczania napięcia oddzielnie zasilającego rdzenie procesora i obszar Uncore składający się z kontrolera pamięci, pamięci cache L3 i interfejsu HyperTransport. AMD nazywa ten układ Dual Dynamic Power Management (DDPM). Według firmy Tyan czteroprocesorowa płyta Thunder n6650EX (S4992) może już obsługiwać HyperTransport 3.0, a więc procesory mogą się komunikować między sobą za pomocą cHT 3.0 zamiast HT 1.1. AMD zamierza opracować chipset serwerowy SR5690 obsługujący HT 3.0 dopiero w przyszłym roku.