Arm Cortex-A77 - viss, kas jums jāzina

Autors: Randy Alexander
Radīšanas Datums: 2 Aprīlis 2021
Atjaunināšanas Datums: 1 Jūlijs 2024
Anonim
Arm Cortex-A77 - viss, kas jums jāzina - Tehnoloģijas
Arm Cortex-A77 - viss, kas jums jāzina - Tehnoloģijas

Saturs


Kopā ar jauno Mali-G77 grafikas procesoru un Mali-D77 displeja procesoru, Arm ir atklājis savu jaunāko augstas veiktspējas CPU dizainu - Cortex-A77. Tāpat kā pagājušā gada Cortex-A76, arī Cortex-A77 ir paredzēts augstākās pakāpes lietojumprogrammām, kas prasa Arm parakstu ar mazu enerģijas patēriņu. Viss, sākot no viedtālruņiem un beidzot ar klēpjdatoriem un, visdrīzāk, arī ārpus tā.

Izmantojot Cortex-A77, Arm ir izvēlējies maksimālo instrukciju ciklā / pulkstenī (IPC) veiktspējas palielināšanu, ko tas varētu pārvaldīt, izmantojot Cortex-A76. Pulksteņu frekvences, enerģijas patēriņš un laukums ir veidoti tā, lai aptuveni paliktu vienā un tajā pašā lodīšu parkā, bet jaunais kodols var satriekties, veicot vairākas instrukcijas vienlaikus. Lai to izdarītu, Arm ir izveidojis vēl plašāku kodolu nekā pagājušajā gadā un ir veicis vairākus uzlabojumus, lai CPU kodols būtu piebarots ar darāmajām lietām. Bet, pirms mēs nonākam pie tā, padomāsim par augsta līmeņa pārskatu un veiktspējas skaitļiem.


Rezultātu mērķu sasniegšana

Atpakaļ 2018. gada augustā Arm neraksturīgi dalījās ar CPU ceļvedi līdz 2020. gadam. Sākot no 2016. gada Cortex-A73 līdz 2020. gada “Hercules” dizainam, uzņēmums sola 2.5x palielināt skaitļošanas veiktspēju. Taisnīga šīs milzīgās projekcijas daļa tika panākta ar lielu mikroarhitektūras maiņu ar Cortex-A76, lielāku mūsdienu pulksteņa ātrumu un pāreju no 16 uz 10 un tagad 7nm ražošanu ar 5nm, kas seko. Apmēram 1,8x no ceļveža ieguvumiem jau tika sasniegti pagājušajā gadā, un Cortex-A77 nodrošina vēl aptuveni 20 procentus IPC pieaugumu. Tas ļauj mums labi sasniegt Arm 2,5x mērķi, kaut arī mobilās ierīces ar ierobežotu enerģijas un siltuma patēriņu negaida, ka mēs redzēsim visus šos ieguvumus.

Salīdzinājumam - pagājušā gada Cortex-A76 nodrošināja apmēram 30–35 procentu palielinājumu, salīdzinot ar Cortex-A75. Šogad mēs skatāmies uz klusāku, tomēr joprojām nozīmīgu 20 procentu IPK ieguvumu starp A77 un A76. Šīs ir labas ziņas, jo tas nozīmē lielāku veiktspēju, vienlaikus ievērojot līdzīgus siltuma un enerģijas ierobežojumus kā iepriekš. Kompromiss ir tāds, ka A77 ir par aptuveni 17 procentiem lielāks nekā A76, tāpēc silīcija laukuma ziņā tas maksās nedaudz vairāk. Ja vēlaties salīdzināt ar galddatoru līderiem, AMD pārvaldīja 15 procentu IPC palielinājumu starp Zen2 un Zen +, savukārt Intel IPC gadiem ilgi palika praktiski nemainīgs.Protams, mēs šeit runājam par dažādiem tirgus segmentiem, taču tas parāda, kā Arm CPU dizaina komanda pēdējās paaudzēs ir guvusi iespaidīgus ieguvumus.


Nākamā paaudzes Cortex-A77 bāzes SoC piedāvā 20% veiktspējas palielinājumu

Šeit jāņem vērā tas, ka A76 iezīmēja nozīmīgu mikroarhitektūras maiņu ar milzīgu veiktspējas pieaugumu, kamēr mēs atgriežamies pie A77 optimizācijas līmeņa uzlabojumiem. Neatkarīgi no tā, padomājiet par to, kas ir jauns arm Cortex-A77.

Cortex-A77 balstās uz A76 mikroarhitektūru

Cortex-A77 un A76 atšķirības izpratnes atslēga ir saprast, kas ir domāts ar “plašāku” pamata dizainu. Būtībā mēs runājam par iespēju izpildīt vairāk norādījumu par katru pulksteņa ciklu, kas palielina galvenā caurlaidspēju. Šīm tiesībām ir divas svarīgas sastāvdaļas - palielinot apstrādes vienību skaitu, lai veiktu apstrādi, un nodrošinot, ka šīs vienības tiek labi barotas ar datiem. Sāksim ar otro daļu un koncentrēsimies uz SoC nosūtīšanas, kešatmiņas un filiāļu pareģotāju.

Cortex-A77 50% palielina nosūtīšanas platumu - līdz sešām instrukcijām vienā ciklā no četrām ar A76. Tas nozīmē, ka lielākam snieguma potenciālam ir vairāk instrukciju, kas virzās uz izpildes kodolu katram pulksteņa ciklam. Rezultātā ir lielāks arī ārpus pasūtījuma izpildes logs, palielinoties līdz 160 ierakstiem, lai parādītu lielāku paralēlismu. Tur ir pazīstama 64K instrukciju kešatmiņa, savukārt filiāles mērķa buferis (BTB), kurā atrodas filiāles pareģotāja adreses, ir par 33 procentiem lielāks nekā iepriekš, lai paralēlās instrukcijās apstrādātu pieaugumu. Nekas neparasts šeit, tā būtībā ir pagājušā gada dizaina plašāka versija.

Interesantāks priekšdaļas papildinājums ir pilnīgi jaunais 1,5K MOP kešatmiņa, kurā tiek saglabāti makro-Ops (MOP), kas tiek padoti atpakaļ no dekodēšanas vienības. Arm's CPU arhitektūra dekodē lietotāja lietojumprogrammas instrukcijas mazākās makro operācijās un pēc tam sīkāk operācijās, kuras saprot izpildes kodols. To var redzēt diagrammā, kas atrodas iepriekš atšifrēšanas sadaļā. MOP kešatmiņu izmanto, lai samazinātu soda naudu par nokavētajiem zariem un atlūzām, jo ​​jūs turaties makro-opus, nevis tos atkal dekodējat, un tas palielina kodola kopējo caurlaidspēju. Ielādes no MOP, nevis i-cache, apiet dekodēšanas posmu, ietaupot vienu ciklu. Arm apgalvo, ka MOP kešatmiņa var sasniegt 85 procentus vai vairāk trāpījumu līmeni dažādās slodzēs, padarot to par ļoti noderīgu papildinājumu standarta i-kešatmiņai.

Pārejot uz CPU izpildes galveno daļu, ņemiet vērā ceturtās ALU un otrās filiāles vienības pievienošanu. Šis ceturtais ALU palielina procesora kopējo numuru, samazinot joslas platumu par 50 procentiem. Šis papildu ALU spēj veikt pamata viena cikla instrukcijas (piemēram, ADD un SUB) plus divu ciklu veseli skaitļi, piemēram reizināšana. Divas citas ALU var apstrādāt tikai viena cikla pamata instrukcijas, savukārt galīgajai vienībai tiek uzlādētas sarežģītākas matemātiskās operācijas, piemēram, dalīšana, reizināšana-uzkrāšana utt. Otrā atzarojuma vienība izpildes kodolā divkāršo vienlaicīgo atzarojumu skaitu. serde var tikt apstrādāta, kas ir noderīga gadījumos, kad divi no sešiem nosūtītajiem norādījumiem ir atzarojumi. Tas izklausās nedaudz dīvaini, bet iekšējā pārbaude Arm atklāja ieguvumus veiktspējai, pieņemot šo otro vienību.

Cortex-A77 piedāvā uzlabotu paralēlismu un jaunu sākotnējās ielādēšanas kešatmiņu

Citi CPU kodola uzlabojumi ietver otra AES šifrēšanas cauruļvada pievienošanu. Datu krātuves cauruļvadiem tagad ir īpaši izdalīšanas porti, lai dubultotu atmiņas izdošanas joslas platumu. Šīs ostas iepriekš tika dalītas ar ALU, kas dažkārt varēja kļūt par sašaurinājumu. Ir arī nākamās paaudzes datu pilnveidotājs, lai uzlabotu enerģijas efektivitāti, vienlaikus palielinot arī sistēmas DRAM joslas platumu.

Daļai šīs sistēmas Cortex-A77 sistēmā ir arī pilnīgi jauna priekšspēles sistēma, kas “zina sistēmu”. Tas uzlabo atmiņas veiktspēju, pamatojoties uz plašo CPU kodolu skaitu, kešatmiņas ietilpību un latentumu, kā arī atmiņas apakšsistēmas konfigurācijām gala ierīcēs. Specializētā aparatūra sarunām ar dinamisko plānošanas vienību (DSU) kā daļu no DynamIQ CPU klastera, kas uzrauga koplietotās L3 kešatmiņas izmantošanu. Kodols raksturo dinamisku attālumu un agresivitātes līmeni, lai samazinātu kešatmiņas izmantošanu situācijās, kad L3 joslas platumu ierobežo citi CPU kodoli. Augstākas veiktspējas serdeņi, piemēram, Cortex-A77, visticamāk, piesātina DSU piekļuvi atmiņai, savukārt mazāka jaudas serdeņi, piemēram, A55, visticamāk, to nedarīs.

Saliekot to visu kopā

Cortex-A77 ir daudz mazu izmaiņu, kas rada dažas būtiskas atšķirības no tā priekšgājēja. Īsumā - jaunā A77s MOP kešatmiņa apvienojumā ar plašāku un garāku instrukciju logu palīdz noturēt piepildīto ALU, filiāli un atmiņas vienības aizņemtas ar darāmām lietām. Powerhouse Cortex-A76 dizains ir paplašināts, lai vēl vairāk uzlabotu tā caurlaidspēju ar A77, nepaļaujoties uz lielāku pulksteņa ātrumu.

Lielākais Cortex-A77 veiktspējas uzlabojums ir vesela skaitļa un peldošā komata formā. To apstiprina Arm iekšējie etaloni, kas parāda 20 līdz 35 procentu veiktspējas pieaugumu attiecīgi SPEC veselā skaitļa un peldošā komata etalonos. Atmiņas joslas platuma uzlabojumi ir no 15 līdz 20 procentiem, vēlreiz uzsverot, ka lielākais ieguvums ir skaitļu kraukšķēšana. Kopumā šie uzlabojumi dod A77 vidējo pieaugumu par 20 procentiem salīdzinājumā ar iepriekšējo paaudzi. Iespējams, ka šī gada vēlāk vai 2020. gada sākumā progresīvāku 7nm ražošanas procesu rezultātā mēs varēsim redzēt arī dažus papildu, nenozīmīgus ieguvumus.

Runājot par viedtālruņiem, ar Cortex-A77 darbināmi SoC ir paredzēti augstas veiktspējas, flagmaņa produktiem. Arm pilnībā cer redzēt, ka spēkstacijas dizains izmantos 4 + 4 bit.LITTLE galveno izkārtojumu. Ņemot vērā palielinātu caurlaidspēju un nelielu piepūli līdz A77 apgabala lielumam, mēs, iespējams, redzēsim, ka SoC dizaineri turpina virzīties uz leju 1 + 3 + 4 vai 2 + 2 + 4. Ar vienu vai diviem jaudīgiem lieliem kodoliem ar lielāku kešatmiņu un augstākiem pulksteņiem, kas papildināti ar 2 vai 3 A77 kodoliem ar mazāku kešatmiņas izmēru un zemākiem pulksteņiem, lai ietaupītu enerģiju un platību. Galu galā Cortex-A77 norāda uz viedtālruņu mikroshēmām un pieaugošo vienmēr savienojamo Armo bāzes klēpjdatoru tirgu. Sekojiet uzmanībai paziņojumiem par silīciju vēlāk šogad.

Kādreiz fantazējat par kāpšanu kalna galā, izmantojot tikai atverošu āķi, vienlaiku glābjot ieprototo filma apkalpe locekļu un princee? Nu, tagad jū varat intenīva darbība kāpšana pēlē Hang Line: Moun...

Iepriekš mē uzzinājām, ka Google plāno atcelt Google Hangout, kā mē to šobrīd zinām, adalot tā funkcija divā citā lietotnē, ka pazītama kā Hangout Meet un Hangout Chat. Pagaidām jūu tālrunī joprojām i...

Interesanti Raksti