通讯芯片

龙8国际官网娱乐【芯论语】浅谈多核心CPU和SoC芯片及其工作原理

2024-04-06 09:34:31来源:龙8国际官网注册 作者:龙8国际官网唯一入口

  前言:现在的CPU或SoC基本都是在单芯片中集成多个CPU核心,形成通常所说的4核、8核或更多核的CPU或SoC芯片。为什么要采用这种方式?多个CPU 核心在一起是如何工作的?CPU核心越多就一定越好吗?带着这些问题,笔者查阅了一些资料,学习了相关概念和要点并编辑成此文,试以通俗的语言来回答这些专业问题。文章一方面可作为自己的一个学习记录,另一方面也希望对读者有参考作用,不准确的地方欢迎讨论和指正。

  要说明什么是多核心CPU或SoC芯片,首先要从CPU核心(Core)说起。我们知道,CPU是中央处理器(Central Processing Unit)的英文简称,它具有控制和信息处理的能力,是电脑和智能设备的控制中枢。如果把传统CPU芯片中的封装和辅助电路(例如引脚的接口电路、电源电路和时钟电路等)排除在外,只保留完成控制和信息处理功能的核心电路,这部分电路就是CPU核心,也简称CPU核。一个CPU核心基本上是一个完全独立的处理器,它可以从内部存储器中读取指令,并执行指令指定的控制和计算任务。

  如果把一个CPU核心和相关辅助电路封装在一个芯片中,这个芯片就是传统的单核心CPU芯片,简称单核CPU。如果把多个CPU核心和相关辅助电路封装在一个芯片中,这个芯片就是多核心CPU芯片,简称多核CPU。当然,多核心CPU芯片会包含更多的辅助电路,以解决多个CPU核心之间的通信和协调问题。

  如果在多核心CPU芯片中再集成一些功能部件和接口电路,就形成了完整的系统,那么这个芯片就变成了多核心SoC芯片了,简称多核SoC。在不严格区分的情况下,SoC也可以称为CPU。

  图1用ARM的单核心CPU和多核心CPU进行举例。图中红色虚线框标出的部分就是一个个的CPU核心,图1a是ARM Cortex-A8基于ARMv7微架构的单核心CPU芯片的示意图。图1b和图1c分别是ARM Cortex-A9 MPCore用2个和4个Cortex-A9构成的2核心和4核心CPU芯片的示意图。

  发展多核心CPU的初心源于“人多力量大”的简单道理。从这个意义上来看,当初芯片集成度不高的时候,Inteli8086 CPU和i8087协处理器应该算是多核心CPU的雏形,是多芯片协作形成了一个处理核心,需要采取许多技术来解决CPU和协处理器之间的合作、协作问题。

  今天芯片的集成度很高,单芯片中集成几个甚至几十个CPU核心已不在话下,但还是不能满足超级计算的需要,需要在超级计算机中使用成千上万块高性能CPU芯片一起合作、协作,这可以看作芯片内多核心、芯片外多芯片的多核心CPU集群。

  CPU芯片从外观上看是一块芯片,但打开封装来看,内部可能只有一块裸片(die),也可能是多块裸片封装在一起,称为多芯片模组(Multichip Module,简称MCM),如图2b所示。但从软件角度来看,封装形式无关紧要,无论是芯片内还是芯片外,CPU核心多少才是最重要的,它们决定着系统的并行运算和处理能力,它们的主频频率和核心之间通信方式决定了系统的处理速度。

  另外,今天的桌面计算机CPU、手机SoC中还集成了许多图形处理器(GPU)核心、人工智能处理器(APU)核心等,这些是否也应该算作多核心CPU和SoC中的“核心”呢?我觉得从广义角度上应该算吧。

  因此,要回顾多核心CPU的发展,大致可以分为1.雏形期;2. 单芯片单核心;3.单芯片多核心;4.单核心多芯片;5.多核心多芯片几种情形。这些发展阶段不一定按照这个前后顺序,可能有交叉时期,也可能有前后颠倒的情形。第2和第3种情形一般是应用在桌面计算机、智能手机等移动终端上的CPU芯片,第4和第5种是应用在服务器和超级计算机上的CPU芯片。本文限于篇幅和主题集中的需要,主要探讨第3种单芯片多核心的情况,这种情况下的CPU是单芯片多处理器(Chip Multi Processors,简称CMP)模式。

  1971~2004年,单核心CPU一路独行。Intel公司1971年推出全球首款CPU芯片i4004,直到2004年推出超线年时间。在这期间,CPU芯片很好地沿着摩尔定律预示的规律发展,沿着集成度不断翻倍、主频不断提升、晶体管数量快速增加的道路前进,这是一条单核心CPU不断迭代升级的发展之路。

  但是,当晶体管数量大幅增加导致功耗急剧增长,CPU芯片发热让人难以接受,CPU芯片可靠性也受到很大影响的时候,单核心CPU发展似乎到了穷途末路。摩尔定律的提出者戈登.摩尔也依稀觉得“尺寸不断缩小”、“主频为王”这条路子即将走到尽头。2005年4月他曾公开表示,引领芯片行业接近40年的摩尔定律将在10~20年内失效。

  其实,早在上世纪90年代末,就有许多业界人士呼吁用CMP技术实现的多核心CPU替代单线程单核心CPU。IBM、惠普、Sun等高端服务器厂商,更是相继推出了多核心服务器CPU。但是,由于服务器CPU芯片价格太高、应用面较窄,并未引起大众广泛关注。

  2005年初AMD抢先推出了64位CPU芯片,并率先Intel发表声明保证其64位CPU的稳定性和兼容性,Intel才想起了利用“多核心”这一武器进行“帝国反击战”。2005年4月,Intel仓促推出简单封装的2核心Pentium D和Pentium4至尊版840。之后不久,AMD也发布了双核心皓龙(Opteron)和速龙(Athlon)CPU芯片[9]。

  2006年被认为是多核心CPU的元年。这年7月23日,Intel基于酷睿(Core)架构的CPU发布。11月,Intel又推出了面向服务器、工作站和高端PC机的至强(Xeon)5300和酷睿2双核心和4核心至尊版系列CPU。与上一代台式机CPU相比,酷睿2双核心CPU在性能方面提高40%,功耗反而降低40%。

  作为对Intel的回应,7月24日,AMD宣布对双核Athlon64 X2处理器进行大降价。两大CPU巨头在宣传多核心CPU时,都会强调其节能效果。Intel发布的低电压版4核心至强CPU功耗仅为50瓦。而AMD的“Barcelona”4核心CPU的功耗也没超过95瓦。在Intel高级副总裁Pat Gelsinger看来,摩尔定律还是有生命力的,因为“CPU从单核心到双核心,再到多核心的发展,可能是摩尔定律问世以来,CPU芯片性能提升最快的时期” [9]。

  CPU技术发展要比软件技术发展更快,软件对多核心CPU的支持相对滞后。如果没有操作系统的支持,多核心CPU的性能提升优势不能发挥出来。同样运行Win7的情况下,4核心CPU和8核心CPU所带来的差异化体验并不明显,导致这种情况的原因是Win7根本没有对8核心CPU进行相应的优化。而在Win10出来后,8核心CPU所带来的体验速度就明显要比4核心处理器快很多,这源于微软在Win10上对多核心CPU的支持做了优化。而且微软还将在Win10上针对多核心CPU做进一步适配优化。

  目前核心最多的服务器CPU有Intel至强铂金9282,56核心112线线W。这两款CPU都需要采用液冷散热。核心最多的台式机CPU有Intel酷睿i97980XE至尊版,18核心36线美元;AMD的Ryzen9 5950X,16核心32线元。核心最多的手机SoC有Apple M1、麒麟9000、高通骁龙 888等。多核心CPU或者多核心SoC似乎成为一种潮流,但是不是核心越多CPU就越好呢?在不考虑因素影响,单从技术和集成度考虑的线]。

  该芯片采用了全新的6x6网格(Mesh)架构,I/O位于顶部,内存通道在两侧居中的位置,最多28个CPU核心,四倍L2Cache(每个核心的缓存由256KB升级到1MB),减小了共享L3Cache但提高了利用率[11]。

  Xeon W-3175X是该架构的最28个CPU核心配置。但代价是超高功耗和发热,标称热设计功耗就有255W,默认主频实测跑分就能轻松达到380W,超频的线W。它在日常使用中,高端水冷是必须配备的。Intel在发布Xeon W-3175X的时候就特别推荐了Asetek 690LX-PN一体化水冷散热器,这也是目前唯一针对W-3175X设计的散热方案。Asetek宣称该水冷的最大散热能力达500W,因此只要不进行极限超频,该方案为W-3175X散热问题不大[13]。价格399.99美元,约合人民币2680元。

  3.华为麒麟9000:华为Mate40手机搭载了华为海思自研的麒麟9000芯片,它是目前功能和性能最强5G多核心SoC芯片。参见下图,该芯片上集成了8个CPU核心、3个NPU核心和24个核心的GPU,采用了5nm的制造工艺,其上集成了153亿个晶体管。它与联发科最强的5G手机芯片天玑2000相比,性能测试的跑分明显占优。可惜美国无理封堵了华为高端智能手机芯片的生产渠道,使华为旗舰手机Mate40系列可能成为。

  4.AppleM1:下图是苹果首款自研的Mac电脑8核心SoC芯片布图。它具有4个高效能的冰风暴小核心(Icestorm)、4个高性能火风暴大核心(Firestorm)和8核心的GPU。可谓四重天,处理能力十分强劲。该芯片以5nm工艺制造,其上集成了160亿个晶体管。苹果公司为新处理器系列启动新的SoC命名方案,称为Apple M1。

  5.VIACHA:威盛(VIA)最新基于x86的AI处理器是一个8核心SoC,它采用台积电16nm工艺制造,芯片面积不超过195平方毫米,内部采用环形总线设计,串联集成了八个x86 CPU核心、16MB共享缓存、四通道DDR4-3200内存、PCIe 3.0(44条)、南桥和IO功能,是一颗完整的SoC。据报道该芯片暂时命名为CHA。

  6.腾云S2500:据报道[21],国产CPU厂商飞腾公司7月发布了一款面向服务器应用的多核心CPU芯片——腾云S2500,该芯片采用16nm工艺制造,芯片面积达400mm2,最多可配置64个FTC663架构的CPU核心,主频2.0~2.2GHz,缓存64MB,支持八通道DDR4内存,可提供800Gbps带宽的四个直连接。


龙8国际官网娱乐
上一篇:让你一次看懂手机芯片 下一篇:485通信自动收发电路 史上最详细的解释