Nvidia złożyła swój najnowszy i najpotężniejszy superkomputer w zaledwie miesiąc [FILM]

Długo? Raczej błyskawicznie, bo chociaż przeciętny użytkownik komputera jest w stanie złożyć swoją platformę w kilka godzin, to superkomputery buduje się często miesiącami i przy użyciu armii inżynierów.

Nvidia złożyła swój najnowszy i najpotężniejszy superkomputer w zaledwie miesiąc [FILM]
Nvidia złożyła swój najnowszy i najpotężniejszy superkomputer w zaledwie miesiąc [FILM]Geekweek

Nvidia podzieliła się właśnie z nami informacjami na temat procesu składania siódmego najszybszego superkomputera na świecie, a mianowicie swojego Selene, który dołączył do grona potężnych kolegów w czerwcu tego roku. Jak łatwo się domyślić, proces składania komputera był utrudniony przez pandemię koronawirusa, ale jak się okazuje nadzwyczajna sytuacja była okazją do sprawdzenia swoich możliwości i wprowadzenia innowacji, dlatego też… Selene została złożona w 3 i pół tygodnia przez zaledwie 6 osób utrzymujących dystans społeczny i przydatnego robota o imieniu Trip.

Warto tu zaznaczyć, że Selene jest dość unikatowym superkomputerem, bo Nvidia postawiła tu na komercyjnie dostępną akcelerowaną przez GPU architekturę DGX SuperPOD zamiast designu skupionego na CPU, podobnego do innych konstrukcji z Top500. Pozwoliło to na 7 miejsce na tej liście najpotężniejszych superkomputerów świata i jednocześnie drugie na liście Green500, czyli najbardziej efektywnych energetycznie superkomputerów. Jeśli zaś chodzi o konkretne liczby, to Selene korzysta z 560 procesorów AMD Epyc 7742 (każdy po 64 rdzenie) i 2240 grafik Nvidia A100, osiągając przy tym maksymalną wydajność na poziomie 35 tysięcy teraflopsów.

Wracając do samego procesu montażu, poprzednie superkomputery od Nvidii wymagały długich miesięcy i były ekstremalnie trudne w utrzymaniu i aktualizowaniu. Dlatego też w przypadku Selene firma postanowiła przetestować coś prostszego i modułowego, co będzie można na bieżąco upgrade’ować. W związku z tym superkomputer zbudowany jest z 280 modułów, z których każdy zawiera osiem grafik Nvidia A100 oraz dwa procesory AMD Epyc - te są montowane jeden na drugim, a następnie grupowane po 16, tworząc supermoduły. To właśnie taka budowa znacznie uprościła proces składania komputera, bo wystarczyło dosłownie dostarczyć moduły w odpowiednie miejsca, podłączyć i sprawdzić, czy wszystko działa jak należy. Proces kontroli superkomputera też jest ułatwiony, a do tego przeprowadza go głównie wspomniany robot o imieniu Trip, który może być kontrolowany zdalnie - do tego naukowcy mogą liczyć na automatyczne komunikaty, kiedy podzespoły nie pracują odpowiednio albo jest jakiś problem z okablowaniem. Mówiąc krótko, to jeden z najprostszych w obsłudze superkomputerów na świecie, który obecnie skupia większość swoich wysiłków na ok. 1000 zadań zorientowanych na rozwój AI i trening sieci neuronowych, a w wolnych chwilach wspiera badania nad koronawirusem.

Źródło: GeekWeek.pl/Nvidia

Geekweek
Masz sugestie, uwagi albo widzisz błąd?
Dołącz do nas