Meni oni ThunderX3 rezultati nisu bas izgledali kao "low power server" vec kao apsolutna dominacija, al ajde da sacekamo da izadje i da vidimo non-vendor benchmarke :-)
Za sada mozes da se igras sa Graviton 2 masinama. Ja sam svoje benchmarke odradio i izvukao zakljucke sto se performansi tice: ovo je bukvalno kraj ere.
Nece Intel i AMD nigde, bice to spori put postajanja manje bitnim, bas kao sto IBM nije nigde otisao. Ekonomija ce odraditi svoje - Jeff Bezos ne ulaze u gluposti, samo ga je Annapurna labs kostala $370M - globalni rollout Graviton 2 servera pitaj boga koliko kosta. Ne radi Jeff to za dzaba + ne zaboravi da Jeff ima vec solidnu istoriju vidjanja stvari kakve ce biti za N godina, od cega je profitirao kao bandit.
Plus TSMC je sada #1 sto se procesa fabrikacije tice (zaboravi ARM na momenat: TSMC koji ih je nadmasio je zapravo najozbiljnija egzistencijalna pretnja Intel-u, iz razloga koje sam vec objasnio: TMSC ne samo sto je postao lider u fabrikaciji, vec troskove dele sa vise musterija, bukvalno najgori scenario za Intel - cak i ako zanemaris ARM, AMD sada moze da stanca procesore na superiornom nodu sto je do sada bila misaona imenica).
Da li mozes da zamislis koliko ce love da kosta Intel da, pod jedan, dostigne TSMC - a pod dva, da ih prestigne (TSMC ne sedi bas skrstenih ruku, a sada imaju znanja za EUV litografiju)? U jednom momentu se cela ta stvar nece svideti investitorima.
A ARM... mislim da ces vec ove godine moci da kupis masine jace od Intel/AMD i da kuci lepo vrtis brzi kod.
Sto se lepote asemblera tice, stvar ukusa - meni se ne svidjaju ni ARM a ni x86, otprilike mi je 6502 bio definicija elegancije. Vecina programera koji su asemblerasi preferiraju ARM, ali koga uopste briga? Asemblerski kod ces rucno pisati samo ako si neki driver dev, za ostalo: intrinsici.
Mislim treba da budem lud pa da pisem rucno asemblerski kod i ogranicavam kompajler da optimizuje. Ako mi treba asembler za neki kritican kod, lepo cu da koristim intrinsike i da omogucim kompajleru da koristi optimalne registre i da inline-uje kod gde vec treba (umesto da mora da zove eksternu asemblersku funkciju sa sve snimanjem i vracanjem registara).
A kad koristis intrinsike isti ti q Intel ili ARM kvazi-asemblerski kod. Podjednako ruzno, mada to je mrtva trka posto cist asemblerski kod nije mnogo lepsi.
Evo ti jos malo testova - obrati paznju na "sokantni" deo (ovo je i mene zadesilo kada sam pokrenuo make -j64 na Graviton 2 masini)
Obrati paznju: ovo su testovi m5 i m6g masina sa istim brojem ukljucenih jezgara. Graviton 2 tuce Xeon Platinum.
https://docs.keydb.dev/blog/2020/03/02/blog-post/
Citat:
The M5 instances use Intel Xeon Platinum 8175 processors which typically get us really good results over most other instance types available. It was shocking to us that on the smaller M6g instances, using AWS Graviton2 processors, there was such a huge gain over existing M5 instances for KeyDB.
The m6g.large is 1.65X faster than the m5.large and the m6g.xlarge gets a 1.45X gain over the m5.xlarge. As the number of cores increase the gap starts to narrow between the offerings. However, we are still investigating the performance of the m6g.2xlarge and m6g.4xlarge as we believe we can get the performance levels up to the same multiples. We did not do any tuning specific to the M6g in this test so we’re optimistic about results to come.
It was also nice to see there is an m6g.medium instance (not offered with M5) as part of the M6g offering which enables another powerful lower cost option. What is apparent from the charts above is that not only do the M6g instances provide major performance gains over the M5, it is also 20% cheaper!
i
Citat:
When it comes to the cost of work, some M6g instances can be over 2X cheaper when looking at computing cost / performance. The m6g.medium provides the best bang for your buck with the m6g.large and m6g.xlarge also with major benefits.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos:
http://www.digicortex.net/node/17 Gallery:
http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! -
https://github.com/psyq321/PowerMonkey