cove 英特尔Sunny Cove架构很“吸睛”：10nm加持猛料不少

美妆认证作者

2021-04-08 07:15:24

导语：在最近举行的架构日上，英特尔很少公布未来多年CPU和GPU架构的路线图，以及一系列相关技术和战略规划，让人大饱眼福。其中，新CPU架构是很多人非常关注的亮点。本文收集了一些数据，尽可能通俗地做了一些简单的解读。从2019年到2021年的三年间，英特尔每年都会推出一代高性能的酷睿架构，从2019年到2023年间，将推出三代低功耗的凌动架构，重点是前者。2019年新的高性能架构是“阳光湾”。CPU大幅

在最近举行的架构日上，英特尔很少公布未来多年CPU和GPU架构的路线图，以及一系列相关技术和战略规划，让人大饱眼福。其中，新CPU架构是很多人非常关注的亮点。本文收集了一些数据，尽可能通俗地做了一些简单的解读。

从2019年到2021年的三年间，英特尔每年都会推出一代高性能的酷睿架构，从2019年到2023年间，将推出三代低功耗的凌动架构，重点是前者。

2019年新的高性能架构是“阳光湾”。CPU大幅升级，集成第11代核心显卡，10nm工艺制造。台式机处理器代码为“冰湖”，也将是英特尔量产的第一款10纳米产品。

2020年是“柳树湾”，几乎可以肯定是10nm工艺，但要像14nm+和14nm+一样优化改进，2021年是“黄金湾”。不知道能不能和7nm一起用。

对于柳树湾和黄金湾，英特尔只简单提到了一些主要特性，而对于即将到来的阳光湾，英特尔毫不犹豫地宣布了许多架构技术细节。

首先，这应该是英特尔历史上第一次在新产品发布前N个月慷慨宣布路线图和技术细节。此外，10纳米新技术将首次大规模应用，因此10纳米Sunny Cove一经公布，将引起业界乃至普通用户的广泛关注。

每一次新一代CPU架构的公布，了解其原理和变化都是非常激动人心的。同样值得鼓掌和品味的是，英特尔这次提前公布了一系列激动人心的资料。

遗憾的是，英特尔给出的信息仍然不完整，主要介绍Sunny Cove架构的后端设计细节，不涉及指令调度、指令队列等前端部分。

Sunny Cove的架构更新可以分为两部分，一部分是通用性能提升，一部分是专用性能提升。

通用性能提升是通过架构增强来提升大量应用的性能和能效，几乎每个人在日常使用中都可以体验到。其本质是改变原有的IPC吞吐量或提高运行频率。

无论是什么流程节点，只要这两点有所提升，整体性能都会相应提升，至少在与计算相关的方面。

频率通常取决于进程和优化，而IPC可以来自更宽、更深、更智能的内核，或者专业地说，每个时钟周期执行更多的指令，每个时钟周期更多的并行性，通过前端更好的数据传输。

然而，针对特定目的的性能改进是针对特定的使用场景和算法扩展体系结构，包括新的指令集和新的软件编译器/库。

这种变化只有在特殊场合才能实现。例如，英特尔广告称，Sunny Cove架构通过新增指令集，可以将7-Zip软件的压缩和解压缩性能提高高达75%，这就是一个典型的例子。只有使用这种软件或其他针对相应指令优化的软件，才能实现如此明显的改进。

虽然专用性能提升的应用范围有限，但只要给定空的范围，效果极其显著，远远超过一般的性能提升。

Sunny Cove在这方面也做了很多改进，涉及人工智能/机器学习、加解密、压缩/解压、通信/网络、通用SIMD/矢量处理、特殊SIMD/矢量处理、多线程和多代理处理等等。

如果你有这些应用，Sunny Cove带来的变化会非常可观。

以上提到的都是一些比较大的应用领域，每个领域都有比较确切的应用场景。新指令的引入可以大大加速特定计算任务的执行。随着AVX-512指令单元的加入，Sunny Cove加入了IFMA进行大数运算，也可以用于加密和解密。

同时还有矢量AES加密、矢量乘法、伽罗瓦域、SHA/SHA-NI安全算法等等，很多都是密码学的一些基本要素。

缓存方面，Sunny Cove后端有48KB的一级数据缓存，比目前的32KB高出50%。一般来说，缓存的非命中率与容量增加的平方根成反比，这意味着Sunny Cove一级数据缓存的命中率将降低22%。

阳光湾的L2缓存也更大，但具体容量尚未披露。目前，Core是每核256KB的L2缓存，而至强是1MB。

此外，微操作缓存比目前的2048入口设计更大，但具体数字暂时不透露。

L2 TLB也增加到未知的数字，这有助于机器历史地址的翻译。通常，这是在需要保存和存储更多轮询时进行的，这意味着英特尔发现在某些应用环境中，最近的机器地址在使用前已经被检索到。

该图显示了更多的变化，包括将执行端口的数量从8个增加到10个，这允许调度程序一次释放更多的指令。端口4和端口9连接到循环数据存储，使带宽和AGU存储容量翻倍，更大的L1指令缓存也起到了一定的作用。

之前的Skylake架构有一个瓶颈。当三个AGU都尝试存储时，带宽明显不足，每个时钟周期只能执行一个AGU。

加载性能保持不变，而宽度调度从4增加到5，这意味着记录缓冲区的调度每个时钟周期可以命中5条指令，但实际效果还有待观察。

Sunny Cove和Skylake建筑的执行港发生了根本性的变化。

可以看出，英特尔为核心的整数部分配备了更多的LEA单元，用于内存寻址计算，这可能会在需要频繁进行内存计算时，通过安全更新来缓解性能损失，或者通过常数偏移来贡献高性能的数组代码。

在Skylake中MUL单元已经从5号口转移到1号口，可能是出于平衡设计的目的，同时增加了一个iDIV整数除法单元。

这个变化不大。10纳米的Cannon Lake还有一个64位的IDIV，可以把64位证书的数量从97个时钟周期减少到18个。阳光湾可能也差不多。

在INT整数运算方面，Skylake端口5的乘法单元变成了MulHi单元，但其在新架构中的具体作用还不清楚。

在FP浮点运算中，Sunny Cove增加了重排资源，因为Intel收到了客户的反馈，希望消除代码中的瓶颈。

英特尔没有在内核的浮点部分指定FMA单元的功能，但我们知道内核中有一个AVX-512指令单元，因此至少有一个FMA单元会与之交互。

坎农湖架构只有一个512位的FMA单元，很可能在这里继续，至强上可能有两个。

为了更清晰的对比Skylake和Sunny Cove的后端执行资源变化，外媒AnandTech也做了如下对比表:

英特尔列出的其他内核改进包括:分支预测器改进、有效负载延迟降低等。，但英特尔也承认这些改进不会惠及所有人，并且需要在特定代码中使用新算法。

此外，Sunny Cove还支持更大的内存。主存分页是5层设计，支持线性寻址空之间57位，物理寻址空之间52位。

这意味着至强服务器平台理论上每处理器最多可以匹配4TB内存，而基于Skylake-SP架构的可扩展至强只有1.5TB，AMD小龙只有2TB。

事实上，Sunny Cove是自AMD在2003年推出x86-64 64位架构以来，第一个对x64虚拟内存寻址进行重大更改的架构。

十几年来，虚拟内存寻址虽然支持64位，但实际上只有前48位有用，后16位只是前面的简单拷贝，把虚拟寻址空限制在256TB。

这些虚拟内存通过分页表映射到物理内存，使得物理内存的内存寻址限制在48位，导致整个系统的最大物理内存不能超过256TB。

现在，Sunny Cove将有效虚拟内存寻址扩展到57位，而物理寻址则高达52位。因此，虚拟内存和物理内存分别可以支持高达128PB和4PB的容量。

根据英特尔给出的路线图，冰湖-SP家族的新一代至强将在2020年上市，届时内存扩展能力将得到前所未有的提升。

顺便说一下，在安全性方面，Sunny Cove支持多密钥全内存加密和用户模式指令预防。

至于Sunny Cove前端的变化，我们期待英特尔公布更多信息。

阳光湾很有意境:虽然这张图中的天空空不是很阳光，但是苏利文的确很美

注:本文部分文字和图片参考国外媒体AnandTech和Arstechnica的报道。

免责申明：以上内容属作者个人观点，版权归原作者所有，不代表评测网立场！登载此文只为提供信息参考，并不用于任何商业目的。如有侵权或内容不符，请联系我们处理，谢谢合作！

cove

当前文章地址：https://www.pcapqz.com/meizhuang/401703.html 感谢你把文章分享给有需要的朋友！

上一篇：丰田卡罗拉召回神车卡罗拉惨遭召回丰田又栽在了CVT上下一篇： sandbox是什么 Win10大更新 Windows Sandbox沙盘功能体验

cove 英特尔Sunny Cove架构很“吸睛”：10nm加持 猛料不少

相关文章

cove 英特尔Sunny Cove架构很“吸睛”：10nm加持猛料不少