L’équipe “Google Silicon” nous fait visiter le SoC Pixel 6檚 Tensor

Le Pixel 6 est officiel, avec un nouveau design de caméra sauvage, des prix incroyables et le nouveau système d’exploitation Android 12. Cependant, le composant principal de l’appareil doit être le “système sur puce” (SoC) de Google Tensor. Il s’agit du premier SoC principal de Google dans un smartphone, et la puce a une configuration de cœur de processeur unique et un fort accent sur les capacités d’IA.

Depuis quand Google est-il un fabricant de puces ? Quels sont les objectifs du Tensor SoC ? Pourquoi a-t-il été conçu à sa manière unique ? Pour obtenir des réponses, nous nous sommes assis avec des membres de l’équipe “Google Silicon”, un nom que je ne pense pas avoir entendu auparavant.

Google Silicon est un groupe responsable de mobile puces de Google. Cela signifie que l’équipe a conçu les précédentes puces de sécurité Titan M dans le Pixel 3 et plus, ainsi que le Pixel Visual Core dans le Pixel 2 et 3. Le groupe travaille sur le développement principal du SoC depuis trois ou quatre ans, mais il reste séparé du Le silicium de l’équipe Cloud travaille sur des choses comme les puces de transcodage YouTube et les CloudTPU.

La plupart des fournisseurs de SoC mobiles licencient leur architecture de puce auprès d’ARM, qui propose également des directives (facultatives) sur la façon de concevoir une puce à l’aide de ses cœurs. Et, à part Apple, la plupart de ces conceptions personnalisées respectent assez étroitement ces directives. Cette année, la conception la plus courante est une puce avec un gros cœur ARM Cortex-X1, trois cœurs A78 moyens et quatre cœurs A55 plus lents et moins puissants pour le traitement en arrière-plan.

Maintenant, réfléchissez à ce que Google fait avec Google Tensor : la puce a toujours quatre A55 pour les petits cœurs, mais elle a deuxArmez les processeurs Cortex-X1 à 2,8 GHz pour gérer les tâches de traitement de premier plan.

Pour les cœurs “moyens”, nous obtenons deux processeurs A76 à 2,25 GHz. (C’est A76, pas l’A78 que tout le monde utilise – ces A76 sont les “gros” cœurs de processeur de l’année dernière.) Lorsque Arm a présenté la conception A78, il a déclaré que le cœur sur un processus de 5 nm offrait des performances 20 % plus soutenues. dans la même enveloppe thermique par rapport au 7nm A76. Google utilise maintenant la conception A76 mais sur une puce de 5 nm, donc, selon la description d’ARM, l’A76 de Google devrait émettre moins de chaleur qu’une puce A78. Google dépense essentiellement plus de budget thermique pour avoir deux gros cœurs et moins pour les cœurs moyens.

La première question pour l’équipe Google Silicon est donc : qu’est-ce qui se passe avec cette mise en page de base ?

L’explication de Carmack est que l’architecture dual-X1 est un jeu d’efficacité pour les charges de travail “moyennes”. “Nous avons concentré une grande partie de nos efforts de conception sur la façon dont la charge de travail est allouée, la façon dont l’énergie est répartie sur la puce et la façon dont les processeurs entrent en jeu à différents moments”, a déclaré Carmack. “Lorsqu’une charge de travail lourde arrive, Android a tendance à frapper fort, et c’est ainsi que nous obtenons de la réactivité.”

Cela fait référence au comportement de “précipitation pour dormir” que la plupart des chipsets mobiles présentent, où quelque chose comme le chargement d’une page Web a tout pour que la tâche puisse être effectuée rapidement et que l’appareil puisse revenir rapidement à un état de faible consommation.

“Lorsqu’il s’agit d’un problème à l’état stable où, disons, le processeur a une charge plus légère mais qui reste modestement importante, vous aurez le double X1 en cours d’exécution, et à ce niveau de performance, ce sera le plus efficace”, a déclaré Carmack.

Il a donné une vue de caméra comme exemple d’une charge de travail “moyenne”, en disant que vous “ouvrez votre caméra et vous avez une vue en direct et beaucoup de choses vraiment intéressantes se produisent en même temps. Vous avez des calculs d’imagerie. Vous avez des calculs de rendu. Vous avez ML [machine learning] calculs, car peut-être que Lens détecte des images ou autre. Dans des situations comme celle-là, vous avez beaucoup de calculs, mais c’est hétérogène.”

Un petit aparté : “hétérogène” signifie ici utiliser plus de bits du SoC pour le calcul que le seul CPU, donc dans le cas de Lens, cela signifie CPU, GPU, ISP (le coprocesseur de la caméra) et le coprocesseur ML de Google .

Carmack a poursuivi: “Vous pouvez utiliser les deux X1 à fréquence réduite pour qu’ils soient ultra-efficaces, mais ils ont toujours une charge de travail assez lourde. Une charge de travail que vous auriez normalement faite avec deux A76, au maximum, est maintenant à peine tapant le gaz avec deux X1s. “

L’appareil photo est une excellente étude de cas, car les précédents téléphones Pixel ont échoué exactement à ce genre de tâche. Les Pixel 5 et 5a surchauffent régulièrement après trois minutes d’enregistrement 4K. Je ne suis pas autorisé à trop en parler pour le moment, mais j’ai enregistré une vidéo de 20 minutes, 4K, 60 FPS sur un Pixel 6 sans problème de surchauffe. (Je me suis ennuyé après 20 minutes.)

Voici à quoi ressemble le téléphone, si vous vous demandez.

Agrandir / Voici à quoi ressemble le téléphone, si vous vous demandez. Google

Alors, Google est-il de retour sur l’idée qu’un gros noyau est un bon design ? L’idée d’utiliser un gros cœur n’est apparue que récemment dans les puces Arm, après tout. Nous avions l’habitude d’avoir quatre « gros » cœurs et quatre « petits » cœurs sans aucun de ces éléments « principaux » surdimensionnés et monocœurs.

“Tout dépend de ce que vous essayez d’accomplir”, a déclaré Carmack. « Je vais vous dire où un gros noyau contre deux gagne : lorsque votre objectif est de gagner une référence à un seul fil. Vous lancez autant de portes que possible sur un seul gros noyau pour gagner une référence à un seul fil … Si vous veulent de la réactivité, le moyen le plus rapide d’obtenir cela, et le moyen le plus efficace d’obtenir des performances élevées, est probablement deux gros cœurs.”

Carmack a averti que cela “pourrait évoluer en fonction de la façon dont l’efficacité est mappée d’une génération à l’autre”, mais pour le X1, Google affirme que cette conception est meilleure.

« Les performances monocœur sont 80 % plus rapides que notre génération précédente ; les performances du GPU sont 370% plus rapides que celles de notre génération précédente. Je dis cela parce que les gens vont poser cette question, mais pour moi, ce n’est pas vraiment l’histoire. » Carmack a expliqué. “Je pense que la seule chose que vous pouvez retenir de cette partie de l’histoire est que bien que nous soyons une toute nouvelle entrée dans l’espace SoC, nous savons comment fabriquer des circuits haute fréquence et haute performance qui sont denses, rapides , et capable… Notre implémentation est solide en termes de fréquences, en termes de fréquence par watt, tout ça. Ce n’est pas une raison pour construire un tout nouveau SoC Tensor. “

Leave a Comment

Your email address will not be published. Required fields are marked *