M1 Max GPU 性能测试终极指南 1.0 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ColorfulBoar
V2EX    Apple
h1>M1 Max GPU 性能测试终极指南 1.0
  •  
  •   ColorfulBoar 2021-10-29 10:30:29 +08:00 5203 次点击
    这是一个创建于 1518 天前的主题,其中的信息可能已经有所发展或是发生改变。

    测量 GPU 性能的要点是要想办法把 M1 Max 测出 3080 以上的性能并让人心服口服,作为持有 AAPL 的股东(这句话是真话),我实在是看不下去现在这些隔几天冒出来一个的水平普遍不太行的测试了,决定写个简单易懂又全面的评测指南

    1. 多跑分,少跑实际应用。如果要跑实际应用,请继续看以下 5 点要义。
    2. 众所周知,GPU 里的计算模块主要由两部分( video encoding 和 video decoding )组成,目前主流游戏 rasterization 使用的流水线的简化模形大概如下:vertex shader 控制 video decoding 模块解压出 fragments ,再送入 video encoding 部份由 fragment shader 算出最终屏幕空间里的显示结果。测试 GPU 性能就是要测试这两个模块的表现。相反,ray tracing 的 API 标准基本由 NV 垄断,充满了对其他平台负优化的风险,属于典型的作弊行为,所以在实际应用测量的时候要多测 Final Cut Pro ,远离 Redshift (像 https://prolost.com/blog/m1max 这个就很不专业)。
    3. 测试肯定要对比多个平台的结果,Mac 侧记得只放 M1 Max ,绝对不要放 M1 Pro ,否则容易被看出来瓶颈是不是真的在 GPU 。至于 PC 平台的选择就比较随意了,但记住我们是在测量 GPU 性能,尽可能少提用了什么 CPU 。这条可能正着不太好理解,但之前那个古墓丽影的测试就是个经典的反面教材( https://www.anandtech.com/show/17024/apple-m1-max-performance-review/6 ),可以对照着研究一下,而且融会贯通之后对理解下一点也大有裨益。
    4. 众所周知,G 只比 C 多几个像素,所以在测量 GPU 性能的时候应该尽量选择瓶颈在 CPU 端但用一点 GPU 的原生应用,比如 Photoshop (况且图形和图像只差一个字,肯定是一回事)(至于游戏的例子见下面第六点)。如果一定要测试瓶颈在 GPU 时候的表现,请选择使用 Rosetta2 转译 CPU 指令集的应用,并把最后测量结果除以转译 CPU 指令集时的性能损失的百分比获得 GPU 的部分真实性能。之所以说是「部分」是因为 Metal 这种薄驱动层的底层 API 可能因为驱动层太厚对应用的意图猜测不够好导致无谓的性能损失,所以真实表现还得再算上这个因子。
    5. 游戏性能当然是 GPU 性能的重要体现,测量游戏性能时候的讲究更多一点,讲起来有点复杂,所以我们从例子入手。前面几点还是适用的,比如根据第二点,我们应该少碰 Metro Exodus 这种优化太烂没人玩的小众游戏;根据第四点,我们应该多测 dota2 和 WOW 一类的主流游戏才能体现 GPU 的实际表现。此外还有个集大成的例子( t/811292 | https://www.reddit.com/r/macgaming/comments/qgqzeo/baldurs_gate_3_120_fps_2560x1440_ultra_on_m1_max ),综合运用了多种技巧:博德之门 3 是个非常优秀与成熟的 EA 阶段 benchmark ,能把 DX11 用出了超过 Vulkan 的水平,充分体现了 Larian 相关团队高超的优化水平,最大限度利用了硬件资源。目前就是进行评测最好的 timing ,Patch6 尚未支持 M1 ,所以用 Patch5 测量合情合理,而 Patch5 刚好是最后一个 RTX 显卡不能使用 DLSS 作弊的版本( https://www.pcgamesn.com/nvidia/baldurs-gate-3-DLSS-update )。除此之外,测试的场景也有讲究,在运行在 MacBook 上的时候不要选择优化不好的战斗场景,多选择没几个能动的东西的场景(像 WOW 这种更新多年的游戏有条件可以尽量在多年前的老地图里面测试);运行在 PC 上的时候可以选择压力最小的起始场景,体现我们这个测试的公平性。帧数最后记得报最大值,不要管瞎切镜头才会出现的掉帧现象。分辨率不要选 4K ,多试试 1080p/2K 。这方面一言难尽,毕竟实时渲染的瓶颈在哪情况很复杂,只能说……运用之妙,存乎一心。
    6. 最后,也是很重要的一点:不管测试的是啥,最后都要尽量做出一副测试对象是随便找来的,只要不是暴力移殖但凡是个 native 的应用都会有这种表现的姿态,给人一种开发者长年浸淫 PC 平台在那边的优化水平已经磨练到头了反过来在 Mac 端经验不足无法发挥 GPU 的全部性能、认真优化还有很大提升空间的希望(反面教材:像 https://developer.apple.com/videos/play/wwdc2021/10148/ 这种东西就不要乱发)

    目前想到的就是这些,希望不用出下一版! (以上仅供娱乐,不是实操说明书)

    24 条回复    2021-10-29 14:16:16 +08:00
    Leonard
        1
    Leonard  
       2021-10-29 10:37:12 +08:00
    写了这么多,辛苦了
    jr55475f112iz2tu
        2
    jr55475f112iz2tu  
       2021-10-29 10:42:18 +08:00   3
    “测量 GPU 性能的要点是要想办法把 M1 Max 测出 3080 以上的性能并让人心服口服”

    所以这是预设结果然后找尺子?
    killsting
        3
    killsting  
       2021-10-29 10:45:04 +08:00   6
    真想吐槽没必要这样阴阳怪气的。

    令人不舒服的文字:「我们应该少碰 Metro Exodus 这种优化太烂没人玩的小众游戏」「所以在实际应用测量的时候要多测 Final Cut Pro ,远离 Redshift 」「 Mac 侧记得只放 M1 Max ,绝对不要放 M1 Pro 」「不管测试的是啥,最后都要尽量做出一副测试对象是随便找来的」
    nonoyang
        4
    nonoyang  
       2021-10-29 10:50:19 +08:00
    饵太咸了
    jiangwangzhang
        5
    jiangwangzhang  
       2021-10-29 10:52:03 +08:00 via iPhone
    @killsting 二十一世纪禁止阴阳怪气了?
    pikaconan
        6
    pikaconan  
       2021-10-29 10:54:14 +08:00 via iPhone   2
    @jiangwangzhang 二十一世纪禁止吐槽阴阳怪气了?
    killsting
        7
    killsting  
       2021-10-29 10:55:22 +08:00
    @jiangwangzhang 你说你的,我说我的,他说他的,不冲突。
    LeonParker
        8
    LeonParker  
       2021-10-29 10:59:07 +08:00
    休息的时候看看挺合适的

    差点没笑出声
    murmur
        9
    murmur  
       2021-10-29 10:59:25 +08:00   2
    如果 M1 GPU 真有 3080 的硬件和性能,那他就一定可以挖矿,到时候看什么时候 macbook 挖矿不就完了
    murmur
        10
    murmur  
       2021-10-29 10:59:51 +08:00
    天天吹 fcpx+prores 编码,都看累了,合着影视只要 fcpx 就搞定一切了是吧
    weqopy
        11
    weqopy  
       2021-10-29 11:02:16 +08:00
    众所周知,G 只比 C 多几个像素

    以为后面马上有一个
    mikeven
        12
    mikeven  
       2021-10-29 11:04:56 +08:00
    问题是现在买 M1 Max 的现在不就是为了剪视频吗。。。目前应该没有人为了玩游戏买个 Mac 吧,现在 Mac 上的游戏就是能跑万岁,优化好的基本没有。。

    程序员整个 10C 的 M1 Pro 足以,性价比也可以
    felixcode
        13
    felixcode  
       2021-10-29 11:09:17 +08:00   1
    Metro Exodus 这种优化太烂没人玩的小众游戏
    实际应用测量的时候要多测 Final Cut Pro ,远离 Redshift
    测量 GPU 性能的要点是要想办法把 M1 Max 测出 3080 以上的性能并让人心服口服
    不管测试的是啥,最后都要尽量做出一副测试对象是随便找来的

    M1 测试学,可以交给苹果做营销参考了。
    cwbsw
        14
    cwbsw  
       2021-10-29 11:12:01 +08:00   5
    习惯了阴阳怪气之后会变得无法正经说话的。
    jin5354
        15
    jin5354  
       2021-10-29 11:34:39 +08:00
    吃饱了撑的
    otakustay
        16
    otakustay  
       2021-10-29 11:50:31 +08:00
    性能 + 可发挥性能的场景 = 实际使用体验
    所以你到底要测啥,要测性能还是测实际使用体验,能搞明白不
    autoxbc
        17
    autoxbc  
       2021-10-29 12:26:06 +08:00   1
    普通人看个阴阳怪气,苹果 PR 已经偷偷右键
    chonger
        18
    chonger  
       2021-10-29 13:22:06 +08:00
    阴阳怪气也没什么用,m1max 的强悍会用时间来证明的。
    gps949
        19
    gps949  
       2021-10-29 13:38:25 +08:00
    阴阳怪气 b 之
    HuPu
        20
    HuPu  
       2021-10-29 13:48:16 +08:00
    整挺好
    xfrgux
        21
    xfrgux  
       2021-10-29 14:02:17 +08:00
    很酸啊,nv 股东坐不住了?
    clrss
        22
    clrss  
       2021-10-29 14:03:31 +08:00
    《挖矿是检验性能的唯一标准》
    icy37785
        23
    icy37785  
       2021-10-29 14:07:28 +08:00 via iPhone
    整个新号挺拼的。就是这个饵确实太咸了。
    kaqiuqiu
        24
    kaqiuqiu  
       2021-10-29 14:16:16 +08:00
    快进到视频挖矿。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3999 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 05:28 PVG 13:28 LAX 21:28 JFK 00:28
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86