M1 Pro|Max 解析:重新定义性能天花板

M1 Pro|Max 解析:重新定义性能天花板-1

M1 Pro|Max 一出世, 几乎就站到了性能军备竞赛的天花板.

不仅仅是绝对性能完成了反超, 能效水平就是3-5年后的水平。

要想了解 M1 Pro|Max 的性能, 就需要从下面几个方面开始探索.

缓存-内存系统: 刷新认知

这样的提升不仅仅是靠核心架构, 还依赖缓存-内存子系统的提升.

CPU 需要大容量缓存实现低延迟操作; 同时提供足够大的内存也非常重要.

GPU 更注重吞吐量, 所以需要做的就是更高的带宽; 也需要大容量片上缓存去拉高局部的平均带宽, 同时借助 SRAM(缓存器件) 相比 DRAM(内存器件)更低的功耗, 从而减少能耗.

M1 Pro|Max 解析:重新定义性能天花板-1

M1 Pro

M1 Pro|Max 解析:重新定义性能天花板-2

M1 Max

M1 Pro|Max 的带宽有多恐怖? 256-512bit 的 LPDDR5, 比四-八通道的 PC DDR5 的带宽还要高.

M1 Pro|Max 解析:重新定义性能天花板-3

再找个基准, 上一代 Apple/AWS 找 AMD 定制的 Radeon Pro 5600M 的2048bit HBM2 内存, M1 Max 的内存带宽已经达到这个水平.

M1 Pro|Max 解析:重新定义性能天花板-4

这一次 Apple 不再使用原来的 System Level Cache 的说法, 而是采用了 Memory Cache 去描述如今的片上缓存.

我个人觉得这个说法背后可能意味着这次的缓存的表现会更偏向加速 CPU/GPU 访问的作用, 而非原来 A 系列芯片用来辅助各个模块高速互联, 从而满足计算摄影这样依赖多个部件功能.

当然这种差异本身就是可以借助 Fabric 总线的 QoS 调度方式实现, 很显然在 M1 Pro|Max 设备上, 缓存的作用就是优化 CPU 延迟、GPU 带宽.

M1 Pro|Max 解析:重新定义性能天花板-5

容量方面, 既然 A15 已经达到了 32MB, 那么 M1 Pro 要么还是 32MB(相比 M1 翻倍), 要么就是 64MB, 这等于是 6700XT 级别的片上缓存规模; 而如果 M1 Max 达到 128MB, 那么就是 6900XT 的片上缓存规模.

另外一点需要提到的差异就是统一缓存系统. Apple 宣称这样做能 zero-copy 提升性能/降低功耗, 在我看来最实际的意义, 是把 GPU 能访问的内存规模提升到一个新的量级, 就像 NV 自己的 Grace 架构一样.

M1 Pro|Max 解析:重新定义性能天花板-6

M1 Pro|Max 解析:重新定义性能天花板-7

传统显卡的 VRAM 都太小了, 就比如我的 6900XT 就区区 16GB 显存. 当然 Nvidia 这边因为上了 GDDR6X 所以容量更看老黄刀法, 一方面和位宽绑定, 另外一方面内存成本特别高, 而且高容量版本很容易成为准专业卡, 所以 3080 10GB 这样的怪胎就是典型的坑爹代表, 容量还不如 3060 12GB, 更别说 3060 6GB 在高分辨率下也是挺压抑的.

对于专业制作场景, 显存的容量完全决定了能做的内容的规模. 虽然我们天天吐槽 Apple 的内存堪比金条, 但在 M1 系列的 Mac 上, 还是不得不承认, 在超大 Cache 的基础上, 能让 GPU 访问如此大的内存, 加起来是非常值的.

不仅仅是视频应用, 这次 Blender 的 Cycles 渲染引擎要支持 Metal, 这么大的内存应该能让设计师很开心.

GPU: 重建天花板

在 M1 杀遍所有 iGPU 之后, M1 Pro|Max 系列又要拿PC独显祭天了.

16-32C 的规模, 双-四倍于 M1.

借助 macOS 的图片转文字识别功能, 我们看看 Apple 到底拿了啥 PC 笔记本和 Mac 比:

M1 Pro|Max 解析:重新定义性能天花板-8

联想拯救者R7000P R7+3050Ti, 差不多是两倍于 M1 对应的 1650MQ.

M1 Pro|Max 解析:重新定义性能天花板-9

从 Apple 的曲线看起来, 30W 的 M1 Pro GPU 相当于 90W 的 3050Ti. 不赖了.

M1 Pro|Max 解析:重新定义性能天花板-10

然后就是 32C GPU, 请屏住呼吸.

发布会之前我在想, 最大的 M1X 大概有四倍规格于 M1, 对应 1650MQ 的话 Time Spy 分数已经超过 3080 了… 是不是搞错了什么.

M1 Pro|Max 解析:重新定义性能天花板-11

没错, 就是那么离谱.

M1 Max 达到了 RTX3080 Laptop 的性能范围, 3080 要达到 60W M1 Max 同等性能, 要多付出 100W 的功率. 如果是紧凑系统上的低功耗版本, 距离 M1 Max 的距离仍旧很大.

M1 Pro|Max 解析:重新定义性能天花板-12

然后看看这两台本子, 价格也不便宜了.

M1 Pro|Max 解析:重新定义性能天花板-13

M1 Pro|Max 解析:重新定义性能天花板-14

然后就是日常辱 PC 时间, 在不插电情况下 M1 Max 能把对手摁在地板上摩擦.

M1 Pro|Max 解析:重新定义性能天花板-15

而且 M1 系列不仅仅是性能、能效卓越.

M1 系列的统一内存架构, 意味着能让 M1 Pro/Max 做更大的工程. 相比之下只有 Quadro 系列能达到要求, 那个价格就更恐怖了. 但即便如此也只有 48GB 内存, 而且光是 GDDR6X 的显存的功耗, 可能就能达到两三个 M1 Max 满载的水平.

M1X, 哦不, 老黄的显存发热就是这么恐怖.

M1 Pro|Max 解析:重新定义性能天花板-16

当然也不是每个方面都很美好, M1 系列仍然不支持硬件光线追踪所需的个别 ASIC 单元, 即便 Metal 有光追和 Cycles 的支持, 但是比起 Nvidia Optix 渲染后端的光追加速可能还是要差一些.

但是毕竟如今有了 Metal 加速, Apple Silicon 也集成了 NPU 单元能完成降噪操作, 已经相比以前迈出了一大步.

M1 Pro|Max 解析:重新定义性能天花板-17

需要吐槽的就是 10.4T 的单精度挺一般的, 也就 3060 水平. 这也算是 Apple TBDR 架构的劣势, 但是你不能说单精度性能差代表图形性能不行.

CPU: 仍然强大, 够用就好

Apple 应该是意识到移动端的小核心 Cluster 在 Mac 上的效率并不高, 所以将 8 个性能核心作为主力, 效率核心缩到两个.

M1 Pro|Max 解析:重新定义性能天花板-18

而这次 Apple 的大核心缓存为 3M per core L2 配置, 还是老样子, 但是因为核心数量翻倍, 达到了24MB. 看起来 Apple 还是有点偏心 iPhone, 两个核心就有 12MB L3 了.

但是性能提升仍然显著:

M1 Pro|Max 解析:重新定义性能天花板-19

比起 Intel 目前的主力 H45 系列, 同等功耗下要强 70%. 考虑到那电阻丝一般的性能-功耗曲线, 就算超冒烟了距离 M1X 还有很远.

M1 Pro|Max 解析:重新定义性能天花板-20

单核心方面 Apple 没提, 但是考虑到 A15 Tock 的 IPC 提升非常微弱, 加上 Apple L1 设计带来的 3.2G 封顶的单核频率, 哪怕总共有 24M L3, 相比 M1 估计能提升 10% 就很了不起了.

但是别搞错, 更大的 L1、以及领先的分支预测能力, 在大量分支指令的游戏、业务逻辑场景中的表现会远大于跑分中的体现.

Video Engine/Display Engine: 该有的都有了, 吧?

M1 Pro|Max 解析:重新定义性能天花板-21

Apple 在这块一直写的不是很全, 比如 VP8/VP9 解码其实 A12 就有. 这次还特别加入了解 ProRes RAW 的能力, 但是不确定说的是不是解拜耳运算.

对于视频媒体用户来说, M1 系列能解码 422 视频一直是一个很有用的优势, 很多绿幕视频都需要用到 422 的抽样.

更快的编解码速度等效更多流、更高清晰度的解码/编码能力, 这样导入素材、导出成片也能省不少功夫.

当然我更关心 AV1 的支持, 毕竟现在看片, AV1 能提供更好的画质、更低的带宽. 希望最后能见到吧.

还有一个 M1 用户抱怨很多的问题, 多显示器支持终于得到了解决. 如今除了带内屏之外, M1 Max 能接三块 Pro Display XDR 和一块电视屏幕. 当然 M1 Pro 稍微菜一点, 只有两块 XDR, 但是也非常够用了.

M1 Pro|Max 解析:重新定义性能天花板-22

总结

过去的一年总有一种奇怪的抽离感: 明明 Apple 手头有先进工艺的资源和先进工艺的架构, 加上优秀的工业设计, macOS 的软件生态, 但是在桌面端的性能却总是受制于散热.

现在只能说明, 近 5-10 年 CPU 和 GPU 的欠竞争状态让消费者能享受到的成果变少了. 当手机 SoC 的性能竞争基本成为定局的时候, 就意味着是王者归来的时候.

M1 Pro|Max 解析:重新定义性能天花板-23

M1 Pro|Max 解析:重新定义性能天花板-24

话又说回来, M1 全系列芯片的生命周期都是两年. 如果你只是一般文字办公需求, M1 Mac 还是非常能打, 估计最近 Intel Alder Lake 发布也很难对 M1 形成压制; M1 Pro|Max 拿来办公就太大材小用了. M1 MBA 有 16G 内存的情况下, 办公体验还是不错的.

给TA买糖
共{{data.count}}人
人已赞赏
技术宅

iOS15更新后,会主动提醒“降雨通知”!

2021-10-22 18:27:46

技术宅

俗话说,微软出品必属废品~微软正式弃用 UWP~坑了一大波开发者~

2021-10-24 0:03:55

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索