Arm Mali-G77 GPU - pilnīgi un droši

Autors: Randy Alexander
Radīšanas Datums: 3 Aprīlis 2021
Atjaunināšanas Datums: 1 Jūlijs 2024
Anonim
Arm Mali-G77 GPU - pilnīgi un droši - Tehnoloģijas
Arm Mali-G77 GPU - pilnīgi un droši - Tehnoloģijas

Saturs


Līdzās savam jaunajam Cortex-A77 CPU kodolam Arm ir atklājis nākamās paaudzes GPU, kas paredzēts nākamās paaudzes viedtālruņu SoC. Mali-G77, ko nedrīkst sajaukt ar jauno Mali-D77 displeja procesoru, iezīmē Arm’s Bifrost arhitektūras aiziešanu un pāreju uz Valhall.

Pēc brīža mēs iedziļināsimies smalkās jaunās arhitektūras detaļās. Pirmkārt, mēs pārdomāsim to, kas lietotājiem būtu jāgaida, ņemot vērā veiktspējas uzlabojumus.

Mali-G77 darbības pārskats

Arm var lepoties ar 40 procentu lielu grafikas veiktspējas palielinājumu ar nākamā paaudzes Mali-G77 ierīcēm, salīdzinot ar mūsdienu Mali-G76 modeļiem. Šis skaitlis ņem vērā procesu, kā arī arhitektūras uzlabojumus. Mali-G77 ir konfigurējams no 7 līdz 16 ēnojuma serdeņiem, un katrs kodols ir gandrīz tieši tāda paša izmēra kā G76 kodols. Tas nozīmē, ka augstākās klases viedtālruņi, iespējams, tiks piegādāti ar līdzīgu GPU kodolu skaitu kā šodien - kaut kur pusaudžiem. Tas ļauj mums veikt dažus spekulatīvus veiktspējas novērtējumus, salīdzinot ar esošajām mikroshēmām.


Aplūkojot populāro Manhetenas GFXBench etalonu, veiktspējas palielinājums par 40 procentiem paver ievērojamu pārsvaru pret pašreizējās paaudzes aparatūru. Qualcomm nākamās paaudzes Adreno mikroshēmai būs nepieciešams savs ievērojams veiktspējas uzlabojums, lai saglabātu konkurences apstākļus. Šķiet, ka tabulas pagriežas Arm labā.

Arhitektūras ziņā spēļu veiktspēja palielinās par 20 līdz 40%, savukārt mašīnmācīšanās nopelna 60%

Balstoties uz šo diezgan rupjo bumbiņu veidošanu, 10 kodolu Mali-G77 (konfigurācija, kuru mēs bieži redzam no Huawei) izskatās gandrīz pilnībā izcēlis šīs paaudzes mobilo sakaru grafikas aparatūru. 12 kodolu konfigurācija, kas parasti ir redzama Samsung Exynos, nodrošina Arm jaunāko GPU. Protams, reālie etaloni būs atkarīgi no citiem faktoriem, tostarp procesa mezgla, GPU kešatmiņas atmiņas, LPDDR atmiņas konfigurācijas un pārbaudāmās lietojumprogrammas veida. Tāpēc ņemiet iepriekš minēto diagrammu ar dūšīgu sāls devu.

Runājot tikai par jauno arhitektūru, Arm apgalvo, ka Mali-G77 piedāvā vidēji par 30 procentiem uzlabot energoefektivitāti un veiktspējas blīvumu. Pateicoties INT8 dot produktu atbalstam, mašīnmācīšanās lietojumprogrammām ir milzīgs palielinājums par 60 procentiem. Spēļu veiktspējas cerības tiek noteiktas no 20 līdz 40 procentiem, atkarībā no nosaukuma un piedāvātā grafikas darba veida.


Lai precīzi saprastu, kā Arms ir sasniedzis šo izrādes pacilājumu, padziļināsimies arhitektūrā.

Iepazīstieties ar Valhall, Bifrost pēcteci

Vahall ir Arm otrās paaudzes skalārā GPU arhitektūra. Tas ir 16 platu šķēru izpildes dzinējs, kas būtībā nozīmē, ka GPU paralēli izpilda 16 instrukcijas ciklā, vienā apstrādes vienībā un kodolā. Tas ir, sākot no 4 un 8, Bifrostā.

Citas jaunās arhitektūras funkcijas ietver dinamisku instrukciju plānošanu, kas pilnībā tiek pārvaldīta aparatūrā, un pilnīgi jaunu instrukciju kopu, kas saglabā darbības ekvivalentu Bifrost. Citi ietver Arm's AFBC1.3 saspiešanas formāta atbalstu, FP16 renderēšanas mērķus, slāņveida renderēšanu un virsotņu shader izvadus.

Mali-G77 veic par 33% vairāk matemātikas paralēli nekā G76.

Galveno arhitektūras izmaiņu izpratnes atslēgas tiek atrastas, pārbaudot izpildes vienību kodolā. Šī GPU daļa ir atbildīga par numuru kraukšķēšanu.

Izpildes dzinēja iekšpusē

Bifrost katrā GPU kodolā bija trīs izpildes dzinēji vai divi dažu zemākas klases Mali-G52 dizainu gadījumā. Katrā dzinējā ir i-kešatmiņa, reģistra fails un velku vadības bloks. Mali-G72 katrs motors apstrādā 4 instrukcijas vienā ciklā, kas pagājušā gada Mali-G76 pieauga līdz 8. Izkliedējot pa šiem trim kodoliem, vienā ciklā var iegūt 12 un 24 32 bitu peldošā komata (FP32) sapludinātās reizināšanas-uzkrāšanas (FMA) instrukcijas.

Izmantojot Valhall un Mali-G77, katrā GPU kodolā ir tikai viens izpildes dzinējs. Tāpat kā iepriekš, šajā motorā ir šķēru vadības bloks, reģistrs un ledus kaite, kas tagad tiek dalīta divās apstrādes vienībās. Katrā apstrādes vienībā vienā ciklā tiek apstrādāti 16 šķēru norādījumi, kopējai caurlaidei 32 FP32 FMA instrukcijas vienā kodolā. Tas ir par 33 procentiem lielāks mācību caurlaides spēja Mali-G76.

Apbruņojums ir mainījies no trim uz vienu izpildes vienību vienā GPU kodolā, bet tagad G77 kodolā ir divas apstrādes vienības.

Turklāt katrs no šiem apstrādes blokiem satur divus jaunus matemātisko funkciju blokus. Jaunajā konvertēšanas vienībā (CVT) tiek apstrādāti veseli skaitļi, loģika, filiāle un konvertēšanas instrukcijas. Īpašo funkciju vienība (SFU) paātrina skaitļu reizināšanu, dalīšanu, kvadrātsakni, logaritmus un citas sarežģītas skaitļu funkcijas.

Standarta FMA bloks ir redzējis dažus uzlabojumus, atbalstot 16 FP32 instrukcijas ciklā, 32 FP16 vai 64 INT8 dot produktu instrukcijas. Šīs optimizācijas rada 60 procentus lielākas veiktspējas mašīnmācības lietojumprogrammās.

Kvadru tekstūru kartētājs

Otrās galvenās izmaiņas Mali-G77 ir četras struktūras kartēšanas shēmas ieviešana, salīdzinot ar divkāršās tekstūras kartētāju iepriekšējā paaudzē. Tekstūras kartētājs ir atbildīgs par ainas 3D daudzstūru kartēšanu 2D attēlojumā, ko redzat uz ekrāna. Tas ir atbildīgs par paraugu ņemšanu, interpolāciju un filtrēšanu, lai izlīdzinātu leņķisko un kustīgo saturu, lai izvairītos no skarbām, zemas kvalitātes malām.

Lai palīdzētu uzlabot attēla kvalitāti, joprojām tiek nodrošināta zemu izmaksu pretializēšana, taču šeit lielākais ieguvums ir tekstūras veiktspējas divkāršošana. Tekstūras vienība tagad apstrādā 4 bilineāros tekstilmateriālus vienā pulkstenī, salīdzinot ar diviem iepriekšējiem, 2 trilineāros tekstilizstrādājumus vienā pulkstenī, un apstrādā ātrāk FP16 un FP32 filtrēšanu.

Kvadrātveida tekstūras kartētājs ir sadalīts divos ceļos, nodrošinot īsāku cauruļvadu pavedieniem, kas satur saturu kešatmiņā. Trūkstošajam ceļam, kas apstrādā formāta konvertēšanu un tekstūras dekompresiju, ir plašāka L2 kešatmiņas saskarne. Tas ir noderīgi arī mašīnmācīšanās darba slodzēm, kurām, iespējams, bieži vajadzēs ievilkt jaunus datus no atmiņas.

Visu apvienojot Mali-G77

Arm ir izdarījis vairākus citus Mali-G77 pielāgojumus, lai tie sakristu ar galvenajām izmaiņām Valhall arhitektūrā. Kontroles bloks ir vienkāršots, pateicoties vienas izpildes vienības konstrukcijai, savukārt iekšējais dinamiskais plānotājs faktiski ļauj elastīgākus norādījumus izdot katrā kodolā. Ar lielāku caurlaides spēju katrā kodolā, datu ceļš ir arī īsāks un zemāks latentuma līmenis - līdz 4 cikliem no 8 iepriekšējiem.

Jaunais dizains ir arī labāk saskaņots ar Vulkan API, vienkāršojot draiveru aprakstus, lai pazeminātu vadītāja galvu, lai uzlabotu veiktspēju “līdz metālam”.

Rezumējot, Mali-G72 un Valhall no Bifrost veic svarīgas izmaiņas, kas sola ievērojamu veiktspējas uzlabojumu spēļu un mašīnmācīšanās lietojumprogrammās. Svarīgi ir tas, ka dizains ietilpst tajos pašos enerģijas un platības budžetos kā Bifrost, nodrošinot, ka mobilās ierīces spēs piedāvāt augstāku veiktspēju, neuztraucoties par siltuma, enerģijas un silīcija izmaksām. Balstoties uz veiktspējas prognozēm, Mali-G77 vajadzētu spēt dot Qualcomm nākamā paaudža Adreno labu naudu.

2. E-veikal nav draudzīg lietotnēm. Jum ta bū jādara veikt meklēšanu.3. Ieraktiet Hulu meklēšana laukā, izmantojot avu Joy-Con vai Pro kontrolieri....

1. Ritiniet pa kreii uz lente, lai piekļūtu Playtation tore.2. Ritiniet uz leju līdz Lietotne kotēšana Veikalu izvēlne. 3. Ritiniet pa labi, lai izvērtu izvēlni laīšanai Izpētīt....

Asv Ieteicams