AMD zmniejsza zapotrzebowanie na moc obliczeniową dzięki podwójnemu gniazdu Radeon Pro W7900 do wnioskowania AI

AMD zmniejsza zapotrzebowanie na moc obliczeniową dzięki podwójnemu gniazdu Radeon Pro W7900 do wnioskowania AI

Choć większość oferty AMD Computex obejmuje procesory i gamę dedykowanych akceleratorów AI Instinct, firma przygotowała także małą aktualizację produktu dla profesjonalistów zajmujących się grafiką i stacjami roboczymi AI. Firma AMD wprowadza na rynek dwuslotową wersję wysokiej klasy karty Radeon Pro W7900 – zwaną W7900 Dual Slot – z myślą o zwiększeniu gęstości obliczeniowej na stacjach roboczych poprzez umożliwienie zainstalowania maksymalnie 4 kart w jednej obudowie.

Wypuszczenie dwugniazdowej wersji karty nastąpiło po tym, jak oryginalny Radeon Pro W7900 po raz pierwszy AMD zastosował większą, trzygniazdową obudowę w swojej flagowej karcie do stacji roboczych. Ponieważ generacja W7000 przyniosła ogólny wzrost zużycia energii, zwiększając moc W7900 do 295 W, AMD pierwotnie zdecydowało się wypuścić większą kartę, aby poprawić akustykę. Odbyło się to jednak kosztem gęstości obliczeniowej, ponieważ w większości systemów można było zmieścić tylko dwie grubsze karty. W rezultacie firma AMD zdecydowała się wypuścić również wersję sprzętu z dwoma gniazdami, aby zaoferować bardziej konkurencyjny produkt dla systemów stacji roboczych o dużej gęstości – zwłaszcza tych, które korzystają z lokalnego wnioskowania AI.




















Porównaj specyfikacje AMD Radeon Pro
AMD Radeon Pro W7900DS AMD Radeon Pro W7900 AMD Radeon Pro W7800 AMD Radeon Pro W6800
ALU 12288
(96 jednostek monetarnych)
8960
(70 jednostek pieniężnych)
3840
(60 jednostek pieniężnych)
Królewska policja w Omanie 192 128 96
Zwiększ zegar 2,495 GHz 2,495 GHz 2,32 Hz
Szczytowa produktywność (FP32) 61,3 FLOPY 45,2 FLOPY 17,8 FLOPY
Taktowanie pamięci 18 Gb/s GDDR6 18 Gb/s GDDR6 16 Gb/s GDDR6
Wyświetl magistralę pamięci 384-bitowy 256 bitów 256 bitów
Mniejsza przepustowość 864 GB/s 576 GB/s 512 GB/s
VRAM 48 GB 32 GB 32 GB
ECC Tak
(dirham)
Tak
(dirham)
Tak
(dirham)
Pamięć podręczna nieskończoności 96 MB 64 MB 128MB
Całkowita wytrzymałość płyty 295 watów 260 watów 250 watów
Proces produkcji GCD: TSMC 5nm
MCD: TSMC 6 nm
GCD: TSMC 5nm
MCD: TSMC 6 nm
TSMC 7nm
budynek kwas dezoksyrybonukleinowy 3 kwas dezoksyrybonukleinowy 3 kwas dezoksyrybonukleinowy2
GPU Nefi 31 Nefi 31 Nefi 21
Współczynnik kształtu Dmuchawa z podwójnym otworem Dmuchawa trzyotworowa Dmuchawa z podwójnym otworem Dmuchawa z podwójnym otworem
Data lunchu 06.2024 Drugi kwartał 2023 r Drugi kwartał 2023 r 06.2021
Cena wprowadzenia (sugerowana cena detaliczna) 3499 dolarów 3999 dolarów 2499 dolarów 2249 dolarów

Poza węższą chłodnicą, Radeon Pro W7900DS jest pod każdym względem identyczny z oryginalnym W7900, z tym samym procesorem graficznym Navi 31 pracującym z tymi samymi częstotliwościami zegara, a cała płyta jest zasilana przez tę samą całkowitą moc płyty 295 (TBP) ) ograniczenie. Jest to połączone z tą samą pamięcią GDDR6 18 Gb/s, co poprzednio, co daje karcie 48 GB pamięci VRAM.

Oficjalnie AMD nie ma specyfikacji hałasu dla tych kart. Można się jednak spodziewać, że W7900DS będzie głośniejszy niż jego odpowiednik z trzema gniazdami. Wszystko wskazuje na to, że AMD używa wyłącznie chłodnicy z modelu W7800, który od początku był kartą dwuslotową, więc chłodnica ma za zadanie wytworzyć kolejne 35 W ciepła.

Ponieważ W7800 była także najszybszą jak dotąd kartą AMD z dwoma gniazdami, jest to wygodny punkt odniesienia pod względem gęstości obliczeniowej. Dzięki pełnotłustemu procesorowi graficznemu Navi 31 model W7900DS zapewni o około 36% większą przepustowość obliczeniową/piksel w porównaniu do swojego rodzeństwa/poprzednika. Jest to więc niemała poprawa dla bardzo specyficznego segmentu, jaki AMD planuje w przypadku tej karty.

Podobnie jak wiele innych rzeczy ogłoszonych w tym roku na targach Computex, tą niszą jest sztuczna inteligencja. Chociaż AMD oferuje wersje PCIe swoich akceleratorów Instinct MI210, karty te są przeznaczone dla serwerów i wyposażone w w pełni pasywne chłodnice. Zatem przetwarzanie na poziomie stacji roboczej jest w dużej mierze przechwytywane przez karty AMD Radeon Pro do stacji roboczych, które są przeznaczone do montażu w tradycyjnej obudowie komputera PC i wykorzystują aktywne chłodzenie (dmuchawy). W tym przypadku AMD koncentruje się w szczególności na lokalnych obciążeniach wnioskowania, ponieważ to odpowiada sprzętowi Radeon i jego krytycznej puli VRAM.

Radeon Pro W7900 Dual Slot zadebiutuje 19 czerwcay. Warto zauważyć, że AMD oferuje tę kartę po nieco niższej cenie niż oryginalny W7900 wprowadzony na rynek w zeszłym roku, przy czym W7900DS trafi na półki sklepowe za 3499 dolarów, czyli mniej niż cena oryginalnego W7900 wynosząca 3999 dolarów.

Nadchodzi także ROCm 6.1 dla Radeonów

Wraz z wydaniem W7900DS, AMD promuje także nadchodzącą wersję ROCm 6.1 firmy Radeon, pakietu oprogramowania do obliczeń GPU. Chociaż podstawowa wersja ROCm 6.1 została wprowadzona w kwietniu, wersja stosu oprogramowania AMD dla systemu Windows jest wciąż późną (i ograniczoną w funkcjach) wersją. Dlatego 19 czerwca zaplanowano ostateczne uaktualnienie do wersji ROCm 6.1ytego samego dnia, co premiera W7900DS.

ROCm 6.1 dla Radeonów wprowadzi kilka poważnych zmian/ulepszeń do stosu, szczególnie jeśli chodzi o poszerzenie zakresu dostępnych funkcji. Warto zauważyć, że AMD w końcu udostępni wsparcie dla podsystemu Windows dla systemu Linux 2 (WSL2), aczkolwiek na poziomie beta, umożliwiając użytkownikom systemu Windows dostęp do bogatszego zestawu funkcji i ekosystemu oprogramowania ROCm pod Linuksem. To wydanie obejmie także ulepszoną obsługę konfiguracji wielu procesorów graficznych, idealnie zbiegając się z premierą Radeona Pro W7900DS.

Wreszcie w ROCm 6.1 TensorFlow jest zintegrowany ze stosem oprogramowania ROCm jako obywatel pierwszej klasy. Chociaż problem ten jest bardziej złożony, niż można podsumować w prostym newsie, natywna obsługa TensorFlow w systemie Windows była wcześniej blokowana z powodu braku wersji biblioteki uczenia maszynowego AMD MIOpen dla systemu Windows. Oprócz obsługi WSL2 programiści będą odtąd mieli dwa sposoby uzyskiwania dostępu do TensorFlow w systemach Windows.

READ  Naukowcy wprowadzają algorytm oparty na uczeniu maszynowym, aby skutecznie przybliżać wielokrotności macierzy

Halsey Andrews

„Lekarz gier. Fanatyk zombie. Studio muzyczne. Kawiarni ninja. Miłośnik telewizji. Miły fanatyk alkoholik.

Rekomendowane artykuły

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *