UnifabriX CXL służy do poprawy wydajności HPC

Abstrakcyjne tło świecących drutów i cząstek

CXL obiecuje na nowo zdefiniować sposób projektowania systemów komputerowych. Działa na PCIe i może rozszerzyć pamięć na poszczególnych procesorach, ale jego największą obietnicą jest zapewnienie pul pamięci zarządzanych przez sieć, które mogą przydzielić trochę pamięci o wyższych opóźnieniach zgodnie z wymaganiami dla procesorów lub maszyn wirtualnych zdefiniowanych programowo. Produkty oparte na CXL zaczną pojawiać się na rynku w 2023 roku.

CXL chce odtworzyć centra danych, ale zalety pamięci o wyższych opóźnieniach do użytku w aplikacjach obliczeniowych o wysokiej wydajności (HPC) nie były jasne, przynajmniej do czasu, gdy UnifabriX zademonstrował zalety przepustowości i pojemności dzięki inteligentnemu węzłowi pamięci opartemu na CXL w Konferencja Super Computing 2022 (SC22). ). tam Właśnie udostępniono wideo Zapoznaj się z ofertą UnifabriX dla pamięci i pamięci masowych HPC, przedstawiającą zalety HPC.

UnifabriX twierdzi, że produkt jest oparty na jednostkach przetwarzania zasobów (RPU). RPU jest zintegrowany z inteligentnym węzłem pamięci CXL, jak pokazano poniżej. Jest to 2-jednostkowy serwer do montażu w stojaku z obsługiwanymi gniazdami na nośniki EDSFF E3. Produkt ma pojemność do 64 TB w pamięci DDR5 / DDR4 i dyskach SSD NVMe.

Inteligentny węzeł pamięci UnifabriX CXL

Odprawa UnifabriX

Firma twierdzi, że produkt jest zgodny z CXL 1.1 i 2.0 i działa na PCIe Gen5. Mówią też, że jest gotowy na CXL 3.0 i obsługuje rozszerzenia PCIe Gen5 i CXL. Obsługuje również dostęp do NVMe SSD przez CXL (SSD CXL over Memory). Produkt jest przeznaczony do użytku w zwirtualizowanych i zwirtualizowanych środowiskach dla szerokiego zakresu aplikacji, w tym HPC, AI i baz danych.

Podobnie jak w przypadku innych produktów CXL, węzeł pamięci zapewnia rozszerzoną pamięć, ale może również zapewniać wyższą wydajność. W szczególności na konferencji Supercomputer Conference 2022 (SC22) węzeł pamięci został użyty do przeprowadzenia testu porównawczego wydajności HPCG w porównaniu z testem porównawczym bez pomocy węzła pamięci. Wyniki są przedstawione poniżej.

Porównanie HPCG z węzłem pamięci UnifabriX i bez niego

Odprawa UnifabriX

W przypadku tradycyjnego testu porównawczego HPCG wraz ze wzrostem liczby rdzeni procesora przetwarzających test porównawczy wydajność początkowo rośnie prawie liniowo wraz z liczbą rdzeni procesora. Jednak przy około 50 rdzeniach procesora wydajność spada bez żadnej poprawy wydajności wraz ze wzrostem liczby rdzeni. Do czasu uzyskania 100 dostępnych rdzeni używanych jest tylko 50 rdzeni. Dzieje się tak, ponieważ nie ma dostępnej dodatkowej przepustowości pamięci.

Jeśli zostanie dodany węzeł pamięci w celu zapewnienia dodatkowej pamięci CXL oprócz pamięci bezpośrednio podłączonej do rdzeni procesora, zobaczymy, że skalowanie wydajności przy użyciu rdzeni może być kontynuowane. Węzeł pamięci poprawia ogólną wydajność HPCG, przenosząc dane o niskim priorytecie z procesora w pobliżu pamięci do odległej pamięci CXL. Zapobiega to nasyceniu pobliskiej pamięci i umożliwia ciągłe skalowanie wydajności za pomocą dodatkowych rdzeni procesora. Jak pokazano powyżej, węzeł pamięci poprawił wydajność standardowego testu HPCG o ponad 26%.

Firma ściśle współpracowała z firmą Intel nad rozwiązaniem CXL, a firma Intel zgłasza te wyniki wraz z trzema innymi^{Badania i rozwój} Tester imprezowy na ich niedawnej odprawie produktowej na temat jednostek przetwarzania infrastruktury (IPU) (akceleratory Intel Agilex FPGA zapewniają poprawę TCO, wydajności i elastyczności nawet do 4^y ogólne platformy Intel Xeon).

Oprócz zwiększania pojemności pamięci i przepustowości węzeł pamięci może również zapewniać dostęp do dysków SSD NVMe za pośrednictwem CXL. Firma twierdzi, że jej plany obejmują pamięć, pamięć masową i łączność sieciową za pośrednictwem interfejsu CXL/PCIe, stąd nazwa unifabriX. Dzięki dołączonym siatkom ich pudełka mogą zastąpić rozwiązania Top Rack (TOR), a także zapewnić dostęp do pamięci i przechowywania.

Węzeł pamięci UnifabriX, który wykorzystuje firmową jednostkę przetwarzania zasobów, umożliwia pokonanie bezpośrednich ograniczeń przepustowości DRAM w aplikacjach HPC wykorzystujących współdzieloną pamięć CXL.

UnifabriX CXL służy do poprawy wydajności HPC

Halsey Andrews

Rekomendowane artykuły

Rozwój „Stalkera 2” „odszedł na margines” podczas rosyjskiej inwazji

WhatsApp pozwala teraz ukryć zdjęcie profilowe i status „ostatnio widziano” przed określonymi osobami – TechCrunch

Ogłoszono Sports Story 1.0.3, oto czego się spodziewać

Dodaj komentarz Anuluj pisanie odpowiedzi