AMD RDNA2 arkitektoniske forbedringer forklaret
Den 28. oktoberth, 2020 AMDs Radeon-division annoncerede deres meget forventede RX 6000-serie af grafikkort baseret på den helt nye RDNA 2-arkitektur. Disse nye grafikkort tager den allerede etablerede RDNA 1-arkitektur og forbedrer den massivt til det punkt, at vi forventer, at AMDs nye grafikkort endelig vil være konkurrencedygtige med de bedste tilbud fra Nvidia. AMD viste nogle af deres nye funktioner i en præsentation den 28. oktoberth som indeholder nogle interessante teknologiske forbedringer. I dette indholdsstykke vil vi se nærmere på, hvad AMD har forbedret med hensyn til arkitektur og design af RDNA 2-grafikkort.
Det er ingen overraskelse, at AMD kommer ind i denne generation som en underdog med mere eller mindre intet at tabe. AMDs RDNA 1-tilbud var konkurrencedygtige og satte virksomheden på den rigtige vej, men de var stadig ikke direkte en trussel mod de bedste tilbud fra Nvidia. Det hurtigste AMD-kort baseret på RDNA 1-arkitekturen var Radeon RX 5700 XT, som konkurrerede direkte med RTX 2060 Super med hensyn til prisfastsættelse, men det slog langt over sin vægt, når det kom til ydeevne. På grund af driveroptimeringer og en generelt bedre GPU konkurrerer RX 5700 XT nu direkte med RTX 2070 Super og slår den faktisk i mange moderne titler, samtidig med at den er 100 $ billigere. Dette betød, at den RDNA 1-baserede GPU var et oplagt valg for mange værdiorienterede spillere. RDNA 2 håber at forbedre den formel og konkurrere direkte med de bedste tilbud fra Nvidia på det tidspunkt; RTX 3000-serien af GPU'er.
Konkurrence med Nvidia
Nvidia annoncerede tre nye grafikkort baseret på den helt nye Ampere-arkitektur, der fik massiv hype og opmærksomhed i år. GeForce RTX 3090, RTX 3080 og RTX 3070 leverer alle ekstremt solid ydeevne til prisen sammenlignet med Turing-generationen. AMDs grafikkort håber denne gang direkte at konkurrere med det absolut bedste, Nvidia har at tilbyde, noget der ikke er sket i nogen tid. Ifølge AMDs førsteparts benchmarks konkurrerer RX 6900XT direkte med RTX 3090, mens den er 500 $ billigere. Desuden konkurrerer RX 6800XT direkte med RTX 3080, samtidig med at den er 50 $ billigere, og RX 6800 leverer noget bedre ydelse end RTX 3070, mens den er 80 $ dyrere. Lad os se, hvordan AMD har formået at levere så massive præstationsgevinster over bare en generation.
RDNA 2-procesknude
AMDs RDNA 2-arkitektur er stadig baseret på TSMC's 7nm-proces ligesom RDNA 1. Dette er ikke nødvendigvis en dårlig ting, da RDNA 1 gav massiv effektivitetsgevinst i forhold til deres ældre 12nm Vega-arkitektur og har også plads til forbedringer. RDNA 2 håber at drage fordel af dette rum til forbedring og lover op til 1,8 gange ydeevne pr. Watt forbedring i forhold til RDNA 1 på den samme procesknude. Dette oversætter til omtrent at fordoble ydeevnen inden for det samme effektmål som den sidste generation, hvilket er en prisværdig forbedring i forhold til den oprindelige RDNA-arkitektur.
Infinity-cache
En af de definerende nye funktioner, der har fået pc-entusiasterne ret begejstrede, er introduktionen af et helt nyt caching-system kendt som Infinity-cache. I det væsentlige har AMD introduceret en hurtig cache, der supplerer GDDR6-hukommelsen for effektivt at øge båndbredden på den indbyggede VRAM. Denne uendelige cache formodes at bygge bro over kløften mellem GDDR6-hukommelsen, som AMD bruger, og GDDR6X-hukommelsen, der findes i RTX 3080 og RTX 3090 fra Nvidia. Den nye G6X-hukommelse formodes at have dobbelt båndbredden til standard G6-hukommelsen.
I et andet overraskende træk holder AMD fast med en 256-bit bred bus og er i stedet regner med denne uendelige cache for at kompensere for faldet i båndbredde. AMD har hævdet, at dens “revolutionerende” infinity-cache-teknologi effektivt kan levere 2X båndbredden som den normale 256-bit bus med GDDR6-hukommelse og dermed kan være en ideel løsning til forskellen i kapacitet mellem de to mærker. Dette betyder, at hvis AMDs krav er sande, ville G6-hukommelsen på 256-bit-bus kombineret med uendelig cache være betydeligt hurtigere end G6-hukommelse på en 384-bit-bus. AMD siger også, at uendelig cache skal hjælpe med at minimere DRAM-flaskehalse, latensproblemer og strømforbrug, samtidig med at det hjælper med båndbredde.
Rage Mode
Omvendt branding til side, AMDs nye Rage Mode-funktion kan faktisk være meget nyttigt med at øge ydeevnen på de nye RX 6000-serie grafikkort. Rage mode er dybest set et trin under automatisk overclocking, der er indbygget i Radeon Software (tidligere Wattman) til disse nye grafikkort. Rage Mode forsøger ikke at "overklokke" selve det specielle kort, snarere øger det faktisk strømgrænsen til den maksimale værdi, der er mulig. Dette kan være ganske nyttigt for folk, der ikke er villige til at overarbejde sig selv, men ikke har noget imod en gratis bump i ydeevne.
Maksimering af effektgrænsen er ikke en ny funktion i sig selv, men det er første gang, at en producent medtager den i deres første parts benchmarks for ydeevne, så dette skal tælles som en væsentlig funktion. Normalt er forøgelse af strømskyderen normalt det første skridt i manuel overclocking, og brugere kan stadig gøre det i deres valgte software med RX 6000-serien, men AMDs implementering vil helt sikkert modtage opdateringer og optimeringer for perfekt at udnytte det magthovedrum, der er findes i disse kort.
Generelt øges power-skyderen til dets maksimale net omkring 50-100 MHz forøgelse af det maksimale vedvarende boost-ur (kaldet "spilur" af AMD), så det kan oversættes til ca. 1-2% stigning i ydeevne under normale forhold . AMD advarer om, at forbedringerne vil være meget afhængige af selve spillet, så det er også noget at huske på. Rage mode vil også øge blæserkurvens aggressivitet for at holde de højere temperaturer i skak.
Smart Access-hukommelse
Sandsynligvis den mest interessante og samtidigt polariserende funktion i RX 6000-serien af grafikkort er Smart Access Memory eller SAM-funktionen. Denne funktion ville kun være tilgængelig for brugere med en Ryzen 5000-serie CPU, et 500-serie bundkort og et Radeon RX 6000-serie grafikkort. Smart Access Memory giver i det væsentlige CPU'en adgang til den fulde mængde GDDR6-hukommelse, der findes på RX 6000-serien af grafikkort. Normalt har CPU kun adgang til VRAM er 256 MB blokke. GDDR-hukommelsen er traditionelt meget hurtigere end den almindelige DDR-hukommelse, der normalt bruges af CPU'er. Ryzen 5000-serien af processorer kan få adgang til denne hurtigere hukommelse og kan dermed levere yderligere ydelsesniveauer. AMD præsenterede et dias, der viser, at SAM kan bidrage til en stigning i ydeevne i gennemsnit fra 2% -8% med nogle spil, der leverer op til 12% mere ydeevne med både SAM og Rage Mode slået TIL.
Dette er første gang, at et firma frigiver en funktion, der låser op for yderligere ydelse afhængigt af den medfølgende hardware, som brugeren besidder. Denne beslutning blev mødt med et blandet svar fra samfundet, hvor halvdelen af folk virkelig var begejstrede for den ekstra ydeevne, der nu kan udnyttes med en All-AMD-build, og halvdelen af de mennesker, der er skuffede over, at AMD låser den ekstra ydelse til CPU'er af kun 5000-serien. Hverken Intel CPU eller ældre Ryzen CPU kan udnytte den ekstra ydelse, som kan komme som en skuffelse for brugerne af disse platforme, der ønsker at købe en RX 6000-serie GPU.
Nvidia var hurtig til at springe ind i situationen med en meddelelse om, at den i øjeblikket arbejder på en lignende funktion til Smart Access Memory til deres RTX 3000-serie af grafikkort, og den frigives snart i en driveropdatering til disse kort. Nvidia hævder, at teknologien bag SAM-funktionen er en standardinddragelse i PCIe-specifikationen, og at Nvidias alternativ også fungerer på både Intel- og AMD-CPU'er med et bredere udvalg af bundkort. Nvidia hævdede også, at deres interne test viser lignende ydelse som AMDs påståede ydeevne ved hjælp af SAM.
Ray-acceleratorer
En af de mest forventede funktioner i RX 6000-serien er inkluderingen af realtids-raytracing-understøttelse. AMD er en generation bag Nvidia i implementeringen af denne funktion, da Nvidia introducerede sin RTX-serie af kort tilbage i 2018 med fuld hardware-raytracing-kapacitet, men det er endelig her med RX 6000-serien af GPU'er. Den tilgang, AMD tager, er dog lidt anderledes. Mens Nvidia bruger dedikeret hardware Raytracing-kerner til at håndtere ray-tracking i realtid, bruger AMD Microsofts DXR-implementering på sin egen måde. Dedikerede "RT-acceleratorer" er til stede i hver beregningsenhed, men der er kun ringe eller ingen information, der er offentligt tilgængelig om nævnte RT-acceleratorer, og hvad de faktisk er.
AMDs nuværende tilgang til Raytracing understøtter alt, hvad der er dækket via Microsofts DXR 1.0- og 1.1-versioner, men alt, hvad der er brugerdefineret eller beskyttet af Nvidia RTX, understøttes ikke på AMDs version af raytracing. Dette er en slags vild vest tilgang til raytracing, da det nu introducerer en yderligere faktor i spørgsmålet "Understøtter dette spil Raytracing?" som nu er vi nødt til at vide, hvilken version af raytracing, spillet faktisk fungerer bedst med. Flere og flere spil skal dog fungere godt med AMDs tilgang, da RDNA 2 GPU'er inde i konsollerne også bruger en lignende form for raytracing som AMDs desktop-grafikkort.
DLSS-konkurrent
DLSS eller Deep Learning Super Sampling er en af de bedste funktioner, der kom med frigivelsen af RTX-grafikkortene i 2018. Denne funktion opskalerer smart et billede, der er gengivet i en lavere opløsning for at give meget bedre ydelse med lidt eller intet tab i visuel kvalitet. Vi har allerede forklaret ind og ud af DLSS i denne artikel, men det lange og korte er, det er en fantastisk funktion for spillere, der leverer mere FPS med omtrent den samme visuelle kvalitet.
AMD har i øjeblikket intet alternativ til DLSS (som er Nvidias proprietære teknologi), men planlægger dog snart at frigive et alternativ. AMD hævder, at dets alternativ fungerer på samme måde som DLSS, men det ville være interessant at teste, for i modsætning til Nvidia har AMD ingen hardwaretensor- eller Deep Learning-kerner til at beregne al den opskaleringsinformation. Nvidia bruger også en supercomputer til at håndtere de fleste beregninger vedrørende DLSS, som den derefter kommunikerer til grafikkortet og muliggør opskaleringsfunktioner. Det ser ikke ud til, at AMD vil gå den rute på dette tidspunkt.
Konkurrer med de allerbedste
Uanset om AMD vinder eller taber mod Nvidia, er det klart, at de faktiske vindere i denne generation faktisk er spillerne. AMD konkurrerer endelig i den meget avancerede med Nvidia. Det er svært selv at huske sidste gang, at de havde den mest effektive GPU på markedet. Nvidia har været ret dominerende i denne afdeling, og i modsætning til Intel har de heller ikke været selvtilfredse. AMD giver streng konkurrence til Nvidia for denne generation, og det fører til flere valg og muligheder for spillerne. Hvis AMD formår at optimere sin Raytracing-ydeevne og levere en solid DLSS-konkurrent, kan de muligvis endda give en mere overbevisende mulighed for spillere end Nvidias bedste tilbud. I mellemtiden vil spillere på ældre AMD-kort som RX 400- eller 500-serien eller RX Vega-kort nyde et massivt spring i ydeevne og livskvalitetsfunktioner, hvis de vælger at opgradere til de RDNA 2-baserede kort.
Afsluttende ord
AMDs RDNA 2-arkitektur tog den eksisterende solide baseline, der blev indstillet af RDNA-arkitekturen, og forbedrede den markant og tilføjede kvalitetsfunktioner som Raytracing-support, Rage-tilstand og Smart Access Memory undervejs. Disse funktioner gør RX 6000-kortserierne til en yderst konkurrencedygtig mulighed for Nvidias bedste tilbud, og med en vis yderligere optimering i raytracing-afdelingen kan AMD måske endda tage den samlede føring inden for ren spilydelse. Samlet set er denne generation en sejr for spillerne, da denne konkurrence mellem Nvidia og AMD fører til frigivelsen af ekstremt solide produkter fra begge sider til konkurrencedygtige priser.