Actualités

Intel Architecture Day 2021 : le récap’ des annonces du 19 Août 2021 !

Pendant un plus de deux heures, Intel a officialisé moultes nouveautés : que cela soit à destination des centres de données (data centers), du jeux vidéo, de sa micro-architecture x86 retravaillée ou, entre-autres, du cloud-computing via les fameux Alder Lake, le fondeur a voulu montrer qu’il était encore bien présent sur le marché en terme d’innovation ou du moins de solutions concurrentielles viables. Condensé-express des annonces de la conférence en ligne du 19 Août 2021 !

 

 

XxX micro-Architecture x86 XxX

 

Une actualisation de se qui constitue la base ou le cœur des micro-solutions Intel. Concernant le FE (Intruction Fetch) et le scheduler uOp, de nombreuses améliorations ont été faites via des augmentations de bon nombres de caractéristiques ou fonctionnalités ; entre-autres :

 

  • I-TLB + I-Cache : 256 4K + 32 2M-4M + 12K pour prédicteur de cible-branches,
  • 6 décodeurs,
  • 8 uOp / cyc (depuis uOp$),
  • uOp queue : 144 single-thread et 72 entrées par thread,
  • uOp$ : 4K uOps.

 

Concernant le moteur OoO (Out-of-Order) Scheduler :

 

  • 12 ports d’exécution,
  • 6 allocations larges,
  • De plus grandes tailles-Scheduler,
  • 512 entrées (buffer).

 

Pour les unités d’exécution vectorielles, un support FP16 a été intégré pour les unités de type FMA et deux nouveaux vecteurs FADD (Fast ADDer) font leur apparition.

 

Du côté de la mémoire sous-système, les caches ont droit eux aussi à cette mise à jour ou évolution assez importante :

  • D’une part, concernant le cache L1 qui intègre 3 ports 256 bits de chargement ainsi que 2 autres ports 512 bits de chargement. Au programme pour ce cache-mémoire, également, moins de latence de chargement pour plus de rapidité ainsi qu’un fill-buffer augmenté (16) et un DTLB qui passe de 64 à 96 pour le traitement-donnée ;
  • D’autre part, concernant le cache L2 qui oscillera, suivant l’usage, entre 125 Mo (client) et 2 Mo (data center). Le plafond des échecs-demandes passe de 32 à 48 et un multi-patch prefetcher fait son apparition. Enfin, une optimisation de la bande-passante à ce niveau (communication) se fait, ce qui permet de réduire la lecture-DRAM.

 

 

XxX Alder Lake + Thread Director XxX

 

Après cette introspection dans le cœur de la micro-architecture Intel, place, enfin, à Alder Lake qui se dévoilent avec le Thread Director, un outil intelligent qui permettra d’optimiser les fils d’exécution (les fameux threads). Construit “directement dans le cœur“, cela sera censé mieux guider ou diriger – de manière dynamique – les opérations en adaptant la décision, par exemple, depuis des options ou paramètres (par lecture) comme l’alimentation ou la température.

 

L’ensemble est annoncé avec une nano-précision d’exécution, notamment dans le domaine de l’intelligence artificielle ou encore de la gestion des priorités de tâches pré-déterminées (scheduling). Décliné en trois modèles, Alder Lake en bénéficiera ; ce dernier intégrant, par ailleurs, les caractéristiques techniques principales suivantes :

 

 

Alder Lake BureauAlder Lake MobileAlder Lake Ultra-mobile
SocketLGA 1700BGA Type3BGA Type4 HDI
Finesse de gravure7
Mémoire, connecteurDDR5-4800, PCIe Gen5DDR5, PCIe Gen4
P-Core (Golden Cove)862
E-Core (Gracemont – 1 lot de 4)8
Fils d’exécution (threads)242012
Gaussian Network Accelerator (GNA v3.0)1
EUs (Execution Units)3296
ConnectivitésThunderbolt 4, Wi-fi 6E
TDP?28-45 W9-28 W
Dimensions37,5 mm x 45 mm50 mm x 25 mm x 1,3 mm28,5 mm x 19 mm x 1,1 mm

 

XxX Xe XxX

 

L’architecture graphique d’Intel était également évoquée : toujours dans la course concurrentielle folle de l’upscaling mais aussi du ray-tracing (!), le fabricant continue d’avancer des arguments solides :

 

  • En tout premier lieu, concernant le Xe SS (Super Sampling), une technologie graphique que l’on peut assimiler au DLSS de Nvidia voire au FidelityFX Super Resolution, pour AMD. Intel dégaine donc une version renforcé de l’architecture graphique Xe. Tout comme la tendance au zoom parmi les constructeurs de terminaux mobiles via des capteurs photographiques dédiés, Intel va augmenter la résolution-image maximale (4K) en grossissant une zone, point ou texture tout en conservant, bien sûr, une esthétique-image acceptable et surtout viable. Et, tout comme AMD, un SDK sera déployé courant Août 2021 (d’ici quelques jours donc…) pour permettre de développer sous la technologie graphique ;

 

 

  • En second lieu et plat de résistance, Intel poursuit en dégainant le Xe “Alchimiste” HPG (High Performance Gaming optimized), qui rallie à la fois les bénéfices des technologies graphiques (mille-feuille) HPC, HP et LP. L’ensemble est assez impressionnant en terme de conception : pas moins de 16 moteur vectoriels 256-bits et 16 moteurs matriciels 1024-bits, par cœur, sont instillés pour le GPU. En l’état donc, ce mille-feuille ou napolitain technologique graphique sorti des fourneaux Intel représente pas moins de 32 cœurs, au total… ! Selon les chiffres uniformes à ce niveau d’Intel, en terme de performances / Watt et de fréquence-voltage, cela représente une amélioration estimée à 1,5x plus grande que les Xe LP. Pour assurer le succès – et sans doute par pragmatisme – Intel a confirmé un partenariat avec TSMC qui concevra donc l’ensemble avec une finesse de gravure de 6 nm (N6). Ces GPUs gargantuesques et prometteurs – sur le papier – sont annoncés, au minimum, pour le premier trimestre 2022.

 

XxX Solutions pour data centers (centres de données) XxX

 

La seconde partie de e-conférence s’est longuement étalée sur ce type de solution. Condensé des évolutions ou annonces dans ce domaine :

 

 

 

  • On retrouve, à nouveau, des GPUs Xe : sous la houlette du modèle HPC, Ponte Vecchio se dévoile jusqu’à quelques 45 TFlops (FP32) et une bande-passante maximale (Fabric) de 5 Tops contre 2 Tops pour la bande-passante maximale standard. L’ensemble s’articule, ici aussi, sous un mille-feuille (comme des couches de gâteau ou d’un Opéra) composé de tuiles : chaque tuile gravée en 5 nm recèle ainsi 8 Xe HPC, un cache-mémoire L1 de 4 Mo et peut se configurer du simple (OAM) jusqu’aux solutions sous-système x4 (2S, notamment) sous Sapphire Rapids. Pour un GPU donné, Intel affirme que l’ensemble peut monter (ResNet50 v1.5) jusqu’à 3 400 images par seconde. Aux allures de machine de guerre, les couches Xe HPC qui épauleront Ponte Vecchio (8 tranches composées, entre-autres, de 128 unités Ray-Tracing !) annonce très probablement de bonnes performances ou applications de type IA ;

 

  • Sapphire Rapids : toujours pour les data centers ou les applications de type cloud-computing ou IA, Intel annonce une nouvelle fournée multi-tuiles de Xeon Scalable qui, ajoute, là aussi, de la densité technique mais surtout de nouvelles couches ou tuiles multiples qui s’appuient sur les derniers standards ou technologies comme la DDR5, Intel Optane, HBM, pour la partie mémoire-IP voire le PCIe Gen5, l’UPI v2.0 et CXL v1.1 pour la partie I / O IP. L’interfaçage ou encore la communication entre les cœurs ont été améliorés en terme de réponse ou de réactivité avec une capacité dédiée à la charge de travail toujours un peu plus grande. Si cela ne parle pas beaucoup, Intel donne quelques chiffres sur la compression-décompression de données qui s’opère, au maximum, jusqu’à 160 Go / seconde (pour les deux types d’opération). Pour les opérations de chiffrement, cela peut aller jusqu’à 400 Go / seconde. L’ensemble inter-opère jusqu’à 100 Mo LLC, concernant la mémoire partagée avec tout les cœurs. La DDR5 intègre 4 contrôleurs-mémoire à 8 canaux, sous Intel Optane 300 Series (Mémoire Persistante). Bien évidemment, les Sapphire Rapids seront taillées pour les traitements en relation avec l’IA sous AMX (Advanced Matrix Extensions) INT8 permettant d’effectuer jusqu’à 2 048 opérations par secondes. Dans le domaine du cloud-computing et comparé à Ice Lake, les applications SaaS sont optimisées à hauteur de +69 % ;

 

  • Infrastructure Processing Unit (IPU) : toujours un peu plus près des nuages, Intel a officialisé de nouvelles solutions IPUs. Premièrement, Mount Evans, qui réunit 4 Xeon-hôtes en “full-duplex” jusqu’à 200 Go / secondes sous moteur (off-load) NVMe (Intel Optane) avec des options de télémétrie, 3 canaux-mémoire, jusqu’à 16 ARM N1 Neoverse et, entre-autres, un emplacement dédié pour juguler les paramètres du processeur. Deuxièmement, Oak Springs Canyon, qui se compose d’un FPGA (Field Programmable Gate Array) Intel Agilex et d’un SoC Xeon-D, de 16 branches sous PCIe Gen4 de deux emplacement DDR4 de 16 Go l’un et d’une connectivité haute-vitesse Ethernet (x2) de 100 Go l’une. Troisièmement, enfin, Arrow Creek clôturait ce bal avec, également, l’intégration d’un FPGA Intel Agilex et d’un contrôlleur Ethernet E810. En plus, il se compose de deux zones DDR4 (1 Go + 16 Go répartit en quatre emplacement de 4 Go l’un) et, entre-autres, de 16 branches PCIe Gen4.

 

XxX Super-calculateur XxX

 

En mot de la fin et très rapidement, Intel en a profité pour se placer parmi les concurrents dans ce domaine, en confirmant que l’Aurora Blade qui sert pour les super-calculs intégrera les solutions Ponte Vecchio dopés eux-mêmes, donc sous GPU Xe HPC, ce qui devrait donner un résultat, en terme de performances, plus qu’opérationnel… A suivre !

 

 

 

Source : Intel (Youtube) – 19 Août 2021 – Intel Architecture Day 2021 : e-conférence.




  • 50% J'apprécieVS
    50% Je n'apprécie pas
    Pas de commentaire

    Laisser un commentaire

    ;) :zzz: :youpi: :yes: :xmas: :wink: :whistle: :warning: :twisted: :sw: :sleep: :sg1: :schwarzy: :sarko: :sante: :rollol: :roll: :rip: :pt1cable: :popcorn: :pff: :patapai: :paf: :p :ouch: :oops: :o :non: :na: :mrgreen: :mdr: :macron: :love: :lol: :kissou: :kaola: :jesuisdehors: :jap: :ilovesos: :idea: :houra: :hello: :heink: :grumpy: :fume: :frenchy: :fouet: :fouet2: :first: :fessee: :evil: :dispute: :demon: :cryy: :cry: :cpignon: :cool: :cassepc: :capello: :calin: :bug: :boxe: :bounce: :bluesbro: :bisou: :babyyoda: :assassin: :arrow: :annif: :ange: :amen: :D :??: :?: :/ :-| :-x :-o :-P :-D :-? :-1: :+1: :) :( 8-O 8)

    Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

    Copyright © Association SOSOrdi.net 1998-2021 - v1.11.4a