Radeon Open Compute “ROCm” Stack v3.1 frigivet med RAS til Vega 7nm, SLURM Support til bedre ressourcehåndtering, men Navi mangler stadig
Radeon Open Compute eller "ROCm" stak ny version er nu tilgængelig til download. Radeon Open Compute v3.1 bringer en hel del funktioner med sig, men underligt mangler support til AMD Navi såvel som GFX10 stadig.
ROCm, den mest accepterede universelle platform til GPU-accelereret computing, findes nu på version 3.1. Den seneste opdatering til den modulære platform, der giver hardwareleverandører mulighed for at opbygge drivere, der understøtter ROCm-rammen, inkluderer nogle meget forventede funktioner som RAS-understøttelse til 7 nm Vega og SLURM-understøttelse af AMD GPU'er. Af endnu ukendte årsager har ROCm dog stadig ikke fuldstændig understøttelse af den næste generation af AMD Navi Architecture.
Hvad er nyt i Radeon ROCm v3.1:
Den største og mest åbenlyse ændring i den nye installation af Radeon ROCm v3.1 er i ROCm Installation Directory Structure. En ny installation af ROCm-værktøjssættet installerer pakkerne i/ opt / rocm-
Den nye version af ROCm har forbedret understøttelse af pålidelighed, tilgængelighed og servicering (RAS) til Vega 7nm GPU'er. Dette 7 nm Vega-arbejde er sandsynligvis stadig under mikroskopet til Vegabaseret “Arcturus” beregningsaccelerator, der kommer i år. Support inkluderer:
- UMC RAS - HBM ECC (ukorrekt fejlinjektion), side pensionering, RAS opsving via GPU (BACO) nulstillet
- GFX RAS - GFX, MMHUB ECC (ukorrekt fejlinjektion), RAS-genopretning via GPU (BACO) nulstillet
- PCIE RAS - PCIE_BIF ECC (ukorrekt fejlinjektion), RAS-gendannelse via GPU (BACO) nulstillet
Radeon ROCm v3.1 får også SLURM-understøttelse af AMD GPU'er. SLURM eller Simple Linux Utility for Resource Management er et af de meget foretrukne og let anvendte klyngestyrings- og jobplanlægningssystem til Linux-klynger. SLURM foretrækkes på grund af at den er open source, fejltolerant og meget skalerbar.
Dette system kan nu interagere godt med AMD GPU'er. Den seneste version 20.02.0 af SLURM inkluderer AMD-plugins, der gør det muligt for SLURM at registrere og konfigurere AMD GPU'er automatisk. Den indsamler og rapporterer også energiforbruget til grafikchips. SLURM-understøttelsen er en nyttig tilføjelse i betragtning af det stigende antal supercomputerinstallationer, der bruger Radeon GPU'er og andre større AMD GPU-klynger.
På trods af inkluderingen af flere funktioner er der stadig ingen tegn på GFX10 / Navi-support i ROCm. GitHub-siden til ROCm er blevet opdateret for at afspejle alle ændringer, installationsnoter og kendte problemer.