今年初,Intel发布了Raptor Lake 13代酷睿移动版,包括HX、H、P、U四大系列。不过,其中有一个非常不起眼的型号,就是U300——它没有挂任何一个酷睿的品牌前缀。最近,U300系列终于现身了:GeekBench 5数据库里出现了一款宏碁的设备“Revo RB610”,处理器就是这款Intel U300。
U300规格十分奇特,它拥有1个大核心、4个小核心组成,也就是5核心6线程,三级缓存是8MB。频率部分大核心至,小核心频率是。集显是48EU单元,频率。U300的功耗伟15W,可配置功耗为12W、55W——整体规格比最低端的酷睿i3 1305U有所缩水。
(资料图片)
U300的规格定位更像是入门级PC产品采用的CPU。不过,我们更感兴趣的是它的核心配置为什么会是一大四小。这就我们想要讨论的,Intel为什么要做大小核设计?
从环形结构说起
处理器的结构(不是架构)经历了很多种变化,目前Intel采用的叫做环形总线结构,即Ring Bus。
早先的CPU因为只有单核心或者是双核心,所以直接连接不同CPU内的外围设备就可以,比如I/O、缓存等等。
但随着多核心CPU成为主流,这种连接关系就会显得越来越复杂,为了实现内部无阻的通讯,就必然会往复交叉连接。显然,这样复杂的连接方式会增加通讯时间,延续剧增会极大浪费CPU性能,势必要从结构上改变才能适应多核心时代。
Intel在2008年推出的Nehalem架构处理器,就采用了全新的环形总线结构,简单说就是将所有CPU的核心“挂在一个环”上,当然这个环上还有一些别的模块(比如GPU、I/O等等),核心之间的通讯就通过环形结构进行交流——延迟问题迎刃而解。
注意,环形总线结构其实是双环的,通俗点理解是一个顺时针环和一个逆时针环。各个模块一视同仁,通讯最长距离就是半个环形而已。而且,增加核心也非常简单,在环形结构上添加“核心节点”就够了。
听起来是不是很完美?在当时、以及很长的一段时间内,这个结构都极为有效,尤其是单核心性能表现极为优秀。等等,为什么我不说多核心呢?
环形结构增加CPU核心并不是无限制的,当需要更多核心的时候问题来了:即便是大家内部的通讯都只是半个环形的等距,但是随着核心数量的不断增加,环形的距离变长了(不是物理距离,仅为比喻)——延迟会相应增加。怎么办?
小核心堆叠一变四不是梦
Intel的CPU近年来都以单核心IPC性能为优势,多核心效能表现就没有单核心那么抢眼了。原因就在于在相等的环形总线中增加核心变得更为困难,延迟(核心、内存)问题无法解决。要知道13代酷睿处理器就已经做到了单环形结构的极致:12核心——当然,志强CPU曾经有过双环形结构产品(有兴趣以后聊聊这部分)。
要在普通消费级CPU上堆叠更多的核心,方法有很多,Intel该如何选择呢?这就是小核心设计了——在Atom基础上Intel进行了深度改进,如Gracemont效能核心的IPC性能已经超过了SkyLake架构核心(整数高、浮点略差),并且功耗依旧保持在很低的水平上。然后,同一个环形结构下,原本1个大核心的空间完全可以提供4个这种小核心的空间。
举个例子,一个CPU是10核心20线程,现在拿出2个大核心的占用,改成8个小核心,这样一下就变成了8(性能核,双线程)+8(能效核,单线程)=16核心24线程。因为这8个小核心的存在,多核心性能瞬间就提升了,简单又有效,而且功耗要远低于10核心20线程的“配置”。
当然,这也有一个巨大的难题,那就是调度问题:系统该如何判断哪些类型的命令交给性能核心执行,哪些命令要交给能效核心执行?在使用12代、13代酷睿CPU的电脑上,这个问题非常重要。Windows 10没有经过特殊的优化设计,这个问题就十分棘手,根本无法发挥这种异构设计的CPU性能,比如渲染工作,如果是12代、13代酷睿+Windows 10的配置,你会发现运行时小核心满载,大核心闲置。所以,这也是为什么Intel要和系统应用企业深度合作(也是Intel长久以来的优势),在Windows 11上就没有这个问题了。
回到开头,U300的设计明显只是应用在入门级桌面产品,以及部分定制设备上。如廉价PC(教育机、客户终端)使用(不包括工控机、软路由、广告机)。上有酷睿i3、i5性能向CPU、下有能耗向N系列CPU,留给U300的发挥空间并不多。不过,这种少大核心、多小核心的设计,可能未来会逐渐成为入门级产品的“标配”。