Arm Mali-G77 GPU - täielikud ja halvad muudatused

Autor: Randy Alexander
Loomise Kuupäev: 3 Aprill 2021
Värskenduse Kuupäev: 1 Juuli 2024
Anonim
Arm Mali-G77 GPU - täielikud ja halvad muudatused - Tehnoloogiate
Arm Mali-G77 GPU - täielikud ja halvad muudatused - Tehnoloogiate

Sisu


Uue Cortex-A77 protsessorituuma kõrval on Arm avalikustanud järgmise põlvkonna GPU, mis on mõeldud järgmise põlvkonna nutitelefonide SoC-de jaoks. Mali-G77, mida ei tohiks segi ajada uue Mali-D77 ekraaniprotsessoriga, tähistab Arm’s Bifrost arhitektuuri lahkumist ja siirdumist Valhallisse.

Tutvume hetkega uue arhitektuuri detailidega. Esiteks hüppame otse sellele, mida kasutajad peaksid jõudluse kasvu osas eeldama.

Mali-G77 jõudluse ülevaade

Võrreldes tänapäeva Mali-G76 mudelitega, saab Arm järgmise graafika jõudluse suurendamiseks kuni 40 protsenti suureneda järgmise põlvkonna Mali-G77. Selles numbris võetakse arvesse nii protsessi kui ka arhitektuurilisi täiustusi. Mali-G77 on konfigureeritav 7 kuni 16 varjestatud südamikuga ja iga südamik on peaaegu täpselt sama suur kui G76 südamik. See tähendab, et tipptasemel nutitelefonid tarnitakse tõenäoliselt samade GPU tuumade arvuga nagu praegu - kuskil alaealistel. Käepäraselt võimaldab see meil olemasolevate kiibikomplektide suhtes mõned spekulatiivsed jõudluse hinnangud.


Vaadates populaarset Manhattani GFXBench'i võrdlusalust, avab 40-protsendiline jõudluse suurendamine märkimisväärse eduseisu praeguse põlvkonna riistvaraga. Qualcommi järgmise põlvkonna Adreno kiip vajab oma taseme säilitamiseks oma märkimisväärset jõudlusuuendust. Lauad näivad olevat Armeri kasuks.

Arhitektuuritarkuses suureneb mängude jõudlus 20–40%, masinõpe aga 60%

Selle üsna toore kuulipildistamise põhjal näeb 10-tuumaline Mali-G77 (konfiguratsiooni, mida näeme sageli Huawei-st), et selle põlvkonna tipptasemel mobiiligraafika riistvara paistaks silma. 12-tuumiline konfiguratsioon, mida tavaliselt nähakse Samsungi Exynos, annab Armi uusimale GPU-le suure edumaa. Muidugi sõltuvad tegelikud võrdlusalused muudest teguritest, sealhulgas protsessisõlm, GPU vahemälu, LPDDR-mälu konfiguratsioon ja testitava rakenduse tüüp. Nii et võtke ülaltoodud graafik koos kopsaka soolaannusega.


Ainuüksi uue arhitektuuri osas väidab Arm, et Mali-G77 pakub energiatõhususe ja jõudluse tiheduse paranemist keskmiselt 30 protsenti. Tänu INT8 dot toote toele on masinõppe rakenduste jaoks ka 60-protsendiline hoog. Mängujõudluse ootused jäävad vahemikku 20–40 protsenti, sõltuvalt pealkirjast ja pakutavate graafikakoormuste tüübist.

Et mõista täpselt, kuidas Arm on selle etenduse tõusuga saavutanud, sukeldugem arhitektuuri sügavamale.

Tutvuge Bifrosti järeltulija Valhalliga

Vahall on Armi teise põlvkonna skalaarne GPU-arhitektuur. See on 16-laineline lõimega käivitusmootor, mis tähendab põhimõtteliselt seda, et GPU täidab 16 käsku paralleelselt tsükli, töötlemisüksuse ja südamiku kohta. See on Bifrosti vahemikus 4 ja 8 lai.

Muud uued arhitektuurilised omadused hõlmavad dünaamilist käskude ajastamist, mida hallatakse täielikult riistvaras, ja täiesti uut juhiskomplekti, mis säilitab Bifrostiga operatiivse samaväärsuse. Muud hõlmavad Arme'i AFBC1.3 pakkimisvormingu, FP16 renderdamise sihtmärkide, kihilise renderdamise ja tipuvarjutaja väljundite tuge.

Mali-G77 teeb paralleelselt 33% rohkem matemaatikat kui G76.

Võtmed peamiste arhitektuurimuudatuste mõistmiseks leitakse tuuma sees oleva täitmisüksuse uurimisega. GPU see osa vastutab numbrite krigistamise eest.

Hukkamismootori sees

Bifrostis sisaldas iga GPU tuum kolme täidesaatmismootorit või mõne madalama otsa Mali-G52 konstruktsiooni korral kahte. Iga mootor sisaldab i-vahemälu, registrifaili ja lõime juhtimisseadet. Mali-G72-s käitleb iga mootor 4 juhist tsükli kohta, mis suurenes 8-ni eelmise aasta Mali-G76-s. Nende kolme südamiku vahel levimine võimaldab 12 ja 24 32-bitist ujukoma (FP32) sulatatud korrutamise-kogumise (FMA) juhiseid tsükli kohta.

Valhalli ja Mali-G77 abil on igas GPU tuumas vaid üks täitemootor. Nagu varemgi, sisaldab see mootor lõime juhtimisseadet, registrit ja jäätõrjet, mida nüüd jagatakse kahe töötlemisüksuse vahel. Iga töötlemisüksus töötleb 16 sulamisjuhist tsükli kohta, kogu läbilaskevõimega 32 FP32 FMA käsku südamiku kohta. See on Mali-G76 juhiste läbilaskevõime 33 protsenti.

Arm on kolmelt GPU südamikult ühelt käitusüksuselt üle läinud, kuid G77 südamikus on nüüd kaks töötlemisüksust.

Lisaks sisaldab iga töötlemisüksus kahte uut matemaatilist funktsiooniplokki. Uus teisendusüksus (CVT) tegeleb täisarvu, loogika, hargnemise ja teisendamise juhistega. Spetsiaalse funktsiooniüksus (SFU) kiirendab täisarvu korrutamist, jagamist, ruutjuure, logaritme ja muid keerulisi täisarvu funktsioone.

Tavalises FMA-seadmes on tehtud mõned näpunäited, mis toetavad 16 FP32 juhist tsükli kohta, 32 FP16 või 64 INT8 punkttoodete juhist. Need optimeerimised suurendavad masinõpperakenduste jõudlust 60 protsenti.

Quad tekstuuri kaardistaja

Teine oluline muudatus Mali-G77-s on nelja tekstuuriga kaardistaja kasutuselevõtt, võrreldes eelmise põlvkonna kahekordse tekstuuriga kaardistajaga. Tekstuurikaardistaja vastutab stseenis olevate 3D-polügoonide kaardistamise eest 2D-esinduses, mida näete ekraanil. Selle ülesandeks on proovide võtmine, interpoleerimine ja filtreerimine, et tasandada nurga all ja liikuvat sisu, et vältida karmi ja madala kvaliteediga servi.

Kujutise kvaliteedi parandamiseks on endiselt paigaldatud odav anti-varjundamine, kuid siin on suurimaks eeliseks tekstuuri jõudluse kahekordistamine. Tekstuuriüksus töötleb nüüd 4 bilineaarset tekstiili ühe tunni kohta, võrreldes kahe varasemaga, 2 trilineaarset tekstiili ühe kella kohta, ja töötleb kiiremat FP16 ja FP32 filtreerimist.

Quad-tekstuuriga kaardistaja on jagatud kaheks teeks, pakkudes lühemat torujuhet niitidele, mis löövad vahemälu sisu kokku. Veateel, mis tegeleb vormingu teisendamise ja tekstuuri dekompressiooniga, on L2 vahemälu laiem liides. See on abiks ka masinõppe töökoormuse korral, mille puhul võib sageli olla vaja uusi andmeid mälust tõmmata.

Liites kõik kokku Mali-G77

Arm on teinud Mali-G77-le veel mitmeid muid katsumusi, et need langeksid kokku suuremate muudatustega Valhalli arhitektuuris. Juhtplokki lihtsustatakse tänu ühe täitmisüksuse konstruktsioonile, samas kui sisemine dünaamiline ajakava võimaldab tegelikult iga südamiku sees paindlikumat käsku väljastada. Kuna igas südamikus on suurem läbilaskevõime, on andmetee ka lühem ja latentsusega madalam - vaid 8 tsüklit 8-st varasemast.

Uus kujundus on ka paremini kooskõlas Vulkan API-ga, lihtsustades draiverite kirjeldusi juhi pea alla laskmiseks, et saavutada paremat “metalli” jõudlust.

Kokkuvõtlikult: Mali-G72 ja Valhall teevad Bifrost olulisi muudatusi, mis lubavad mängu- ja masinõpperakenduste jaoks märkimisväärset jõudluse suurendamist. Oluline on see, et disain mahub samade energia- ja alaeelarvete hulka nagu Bifrost, tagades, et mobiilseadmed suudavad pakkuda suuremat jõudlust, muretsemata soojuse, energia ja räni kulude pärast. Esitusprognooside põhjal peaks Mali-G77 suutma anda Qualcommi järgmise põlvkonna Adrenole oma raha eest hea jooksu.

Netflix on viimatel aatatel märkimiväärelt laiendanud oma rahvuvahelii pakkumii. Liak uurepäratele Netflixi originaalfilmidele ja -arjadele on Netflixi aadaval hulgalielt uurep...

Hipaania keele õppimine on UA kekkooliõpilate ja kõrgkooliõpilate ea populaarne. ee on ee keel, mida vajate, kui puhkate Mehhiko (või Hipaania). Enamiku puhkute jaok teeb tri...

Põnev Postitus