×

Utilizziamo i cookies per contribuire a migliorare LingQ. Visitando il sito, acconsenti alla nostra politica dei cookie.

image

Geekerwan, 吹牛 还是 真牛 ?苹果 M1 全网 最 硬核 评测 (上) (2)

吹牛 还是 真 牛 ?苹果 M1 全网 最 硬核 评测 (上 )(2)

x 86 CPU 的 AVX 性能 在 如今 十分 重要 曾经 Zen 2 相较 于 Zen 和 Zen + 的 巨大 提升 很大 程度 就 来源于 AVX 性能 的 提升 而 AVX 作为 SIMD 指令集 十分 依赖 SIMD 宽度 而 ARM 架构 中 类似 于 AVX 的 指令集 叫做 Neon M 1 的 每个 核心 里 有 4 个 128 bit 的 Neon 管道 这个 规格 和 Skylake 以及 Zen 3 是 同一 水平 至少 在 处理器 架构 层面 上 这颗 ARM 处理器 的 浮点 性能 已经 站上 了 和 x 86 最 先进 的 架构 平等 的 水平 除此之外 M 1 还有 一个 能 让 浮点 单元 和 NPU 里应外合 的 AMX 指令集 这 让 它 的 浮点 性能 更上一层楼 但 浮点 性能 的 发挥 还 和 频率 以及 内存 性能 有关 那么 接下来 我们 来 聊聊 M 1 的 缓存 与 内存 设计 缓存 对 CPU 的 PPC 有着 巨大 的 帮助 Zen 2 的 桌面版 和 移动 版 的 差距 就是 由于 L 3 缓存 导致 的 而 Ice Lake 和 Tiger Lake 更是 几乎 只有 缓存 设计 上 的 区别 苹果 在 M 1 的 大 核里 塞进 了 12 MB 的 共享 L 2 缓存 作为 对比 A 14 里面 的 大核 的 L 2 缓存 是 8 MB 这 应该 是 现代 CPU 里 最大 的 二级缓存 设计 平均 每 核心 3 MB 的 二级缓存 远大于 Tiger Lake 或者 Zen 3 的 L 2 缓存 更 接近 它们 的 三级 缓存 上次 在 苹果 以外 的 CPU 上 见到 这样 的 大 L 2 还是 酷睿 2 时代 M 1 的 小 核心 则 配置 了 4 MB 的 L 2 缓存 这个 大小 就 更 接近 我们 认知 中 的 L 2 缓存 了 但 因为 我们 没有 办法 在 新 MacBook Pro 上 跑 AIDA 64 之类 的 测试工具 所以 M 1 和 Zen 3 以及 Tiger Lake 的 L 2 性能 差别 我们 还 不得而知 一般来说 L 2 容量 越大 延迟 就 越 难 优化 但 就 容量 来看 M 1 的 规格 确实 有点 吓人 除此之外 M 1 还有 一个 类似 三级 缓存 的 系统 级别 缓存 这个 缓存 是 CPU 、 GPU 和 NPU 等 单元 共享 的 从 官方 keynote 里 公布 的 DIE Shot 来看 应该 和 A 14 一样 都 是 16 MB 因为 GPU 也 要 用 这个 缓存 CPU 的 大 L 2 缓存 应该 和 这 一点 也 有 关系 内存 方面 M 1 配备 了 苹果 称之为 统一 内存 架构 实际上 这 并 不是 苹果 第一次 这样 做 左边 是 iPad Pro 里面 的 A 12 X 和 A 12 Z 右边 是 这次 的 M 1 是不是 发现 它们 长得 很 像 ? 事实上 新 的 内存 架构 应该 在 A 12 X 时 就 已经 应用 在 了 iPad Pro 里面 M 1 集成 在 片 上 的 内存 是 双通道 的 LPDDR 4 X 4266 这里 我 说 的 双通道 指 的 是 128 bit 不是 手机 常说 的 64 bit 带宽 相比 A 14 是 翻番 的 和 内存 配置 比较 好 的 Intel 、 AMD 核显 笔记本 带宽 近似 但 计算机 里 有 一个 常识 距离 越近 延迟 越低 所以 苹果 这个 操作 应该 主要 是 为了 降低 延迟 以及 更好 保证 GPU 的 性能 表现 当然 升级 内存 就别 想 了 尤其 是 这次 的 Mac mini 彻底 关上 了 升级 硬件 的 大门 买来 是 啥 样 就是 啥样 至于 笔记本 不能 换 硬件 已经 四年 了 倒 是 没 啥 影响 大家 都 习惯 了 容量 方面 这次 提供 了 8 GB 和 16 GB 两种 这 两个 容量 其实 就是 在 告诉 你 这次 的 新 电脑 就 不是 给 强 生产力 用户 准备 的 也许 明年 夏天 之后 看 苹果 会 在 稍微 高阶 的 产品 上用 上 32 G 及 以上 的 片 上 内存 但 虽说 这次 M 1 用 上 了 统一 内存 架构 但 我 还是 有 一点 更 不切实际 的 贪念 什么 时候 苹果 能 抛弃 DDR 内存 把 HBM 技术 用 在 自家 的 SoC 上 就 牛 逼 炸 了 我 相信 能 做到 这步 的 目前 有且 只有 苹果 就 看 他们 愿不愿意 这样 干 了 毕竟 这 成本 可不 低 简单 总结 一下 M 1 的 架构 这 应该 是 目前 最 “ 超大 杯 ” 的 处理器 核心 即使 和 Zen 3、 Skylake 相比 依然 十分 巨大 加上 使用 了 目前 桌面 CPU 唯一 的 5 nm 工艺 这颗 处理器 的 表现 很 令人 期待 其实 这么 分析 下来 你 会 发现 AMD 的 Zen 3 架构 也 非常 优秀 似乎 只是 规格 不如 M 1 那么 暴力 也许 再 做 宽 一点 就 能 在 IPC 上 打败 M 1 了 可 为什么 其他 厂商 不去 做 像 M 1 处理器 一样 宽 的 架构 来 提升 IPC 呢 ? 其实 这里 包含 着 几个 方面 的 原因 苹果 的 处理器 不 外卖 它 卖 的 是 笔记本 、 平板 和 手机 但 其他 处理器 厂商 卖 的 是 处理器 甭管 你 是 高通 还是 Intel 、 AMD 他们 赚 的 是 处理器 那 部分 的 利润 苹果 就 可以 省出 这部分 利润 用来 继续 堆 规格 但 整机 的 成本 却 不会 上涨 甚至 因为 Mac 和 iOS 设备 共享 处理器 架构 处理器 的 研发 成本 还 可以 得到 iPhone 和 iPad 的 分摊 于是 在 处理器 制造 成本 可能 比 intel 或 AMD 更 高 的 情况 下 苹果 赚 的 反而 更 多 了 苹果 在 A 11 的 时代 就 在 硬件 层面 终结 了 对 32 位 应用 的 支持 而 macOS 也 在 去年 的 10.15 版本 里 去掉 了 对 32 位 应用 的 支持 到 如今 已经 完成 了 全 64 位 软件 的 准备 你 能 想象 你 买 回家 的 Zen 3 处理器 完全 不 支持 32 位 应用 吗 ? 如果 真的 这样 估计 你 得 爆炸 但 苹果 对 生态 的 控制 使得 他们 可以 用 一定 的 兼容性 换取 更强 的 性能 而 x 86 就 得 背着 这种 具有 数十年 历史 的 “ x 86 税 ” 在 增加 性能 的 同时 继续 保持 对 上古 软件 的 兼容 但 这种 兼容性 也 是 要 占 面积 和 费电 的 M 1 毕竟 脱胎 于 A 14 而 A 14 来自 于 手机 这 意味着 它 要 用 更 高 的 IPC 去 换取 更 低 的 频率 和 电压 这样 才能 保证 移动 设备 的 续航 对 AMD 和 Intel 来说 应用 它们 处理器 的 最 低功耗 设备 是 笔记本 而 更 高功耗 的 台式机 并不需要 考虑 续航 问题 所以 他们 可以 用 更 高 的 频率 获得 相同 的 性能 虽然 此时 的 能耗 比会 下降 但 绝对 性能 上 4.5 GHz -5 GHz 的 Zen 3 也 不会 低于 3.2 GHz 的 M 1 可以 说 M 1 虽然 是 同频 性能 之王 但 未必 是 同 面积 性能 之王 前面 也 说 了 面积 就是 制造 成本 这 对于 双核 或者 四核 可能 不会 差 那么 大 那 如果 是 16 个 核 乃至 64 个 核 呢 ? 处理器 厂商 的 一个 架构 要 覆盖 笔记本 到 服务器 那么 这件 事 就 不得不 考虑 了 说白了 处理器 的 设计 无非 就是 平衡 功耗 、 性能 和 成本 功耗 会 因为 频率 和 电压 而 大幅 上升 成本 会 由于 利润率 的 要求 尽可能 压低 所以 反映 在 性能 上 就 得 找到 一个 平衡点 了 苹果 的 特别之处 就 在于 有 足够 强大 的 生态 这 三者 它 都 有着 绝对 的 控制权 于是 就 可以 找到 一个 相对 高 的 平衡点 所以 M 1 就 这样 横空出世 了 接下来 的 实际 测试 里 我们 会 实际 来 看看 它 的 真实性 能 、 功耗 表现 我们 还会 分析 一下 它 的 每 核心 功耗 对比 一下 x 86 阵营 里 最 先进 的 Zen 3 处理器 以及 和 同 架构 的 小弟 A 14 对比 来 看看 苹果 是否 在 频率 上 还 留 了 一手 那么 在 进入 实际 测试 之前 我们 再 来 聊 一个 非常 重要 的 东西 —— Rosetta 2 Rosetta 2 可以 说 是 M 1 Mac 的 一个 杀手锏 毕竟 苹果 不是 第一次 做 处理器 架构 间 的 转换 工具 了 第一代 Rosetta 正是 Mac 从 Power PC 转向 Intel 架构 时 苹果 推出 的 秘密武器 而 这次 的 第二代 让 我们 看到 了 苹果 牌 补丁 的 实力 首先 它 的 兼容性 确实 不错 不像 隔壁 搞 了 一年 多才 姗姗来迟 的 x 86-64 支持 苹果 的 Rosetta 2 从 一 开始 就 能 跑 x 86-64 应用 而且 兼容性 大家 也 看 了 不少 评测 确实 不错 基本上 老 Mac 用户 可以 直接 用 Time Machine 恢复 他们 的 备份 到 M 1 的 Mac 绝大多数 软件 运行 都 没 啥 问题 但 作为 一个 转译 器 除了 要 保证 兼容性 性能 表现 也 十分 重要 其实 在 这里 苹果 用 上 了 它们 最大 的 优势 —— 软硬件 结合 ARM 和 x 86 的 内存 一致性 模型 不同 这会 导致 多线程 软件 运行 的 问题 苹果 在 M 1 里 直接 做 了 两版 内存 模型 在 运行 原生 应用 的 时候 使用 ARM 的 那套 而 在 运行 X 86 转译 应用 时 就 切换 到 x 86 的 那套 这种 深入骨髓 的 软硬 结合 是 其他 厂商 羡慕 却 学不来 的 这才 带来 了 Rosetta 2 的 优秀 表现 说白了 Rosetta 2 并 不仅仅 是 一个 软件 层面 的 转译 器 而是 需要 配合 苹果 自己 的 处理器 设计 才 实现 了 如今 的 表现 另一方面 Rosetta 2 并 不是 一个 动态 转译 器 它 是 一个 静态 转译 器 在 你 第一次 打开 x 86 应用 时 它会 帮 你 默默 转换 完 你 的 软件 之后 打开 的 时候 就 会 直接 打开 翻译 后 的 代码 形象 点 说 动态 翻译器 就 像是 同声 传译 而 静态 翻译 就 像是 字幕组 做好 了 熟肉 再 给 你 看 这样一来 性能 损失 会 更 小 也 更 容易 保持 软件 的 稳定 但 如果 你 是 个 完全 不 关心 电脑 里 用 什么 处理器 的 人 它 第一次 打开 譬如 Word 之类 的 软件 时 时间 长得 可能 会 让 你 觉得 你 新 买 的 电脑 坏 了 不过 好 在 Office 已经 原生 兼容 了 M 1 处理器 VS Code 也 是 微软 不愧 是 苹果 最佳 开发者 总结 一下 在 两年 的 过渡期 内 Rosetta 2 的 表现 直接 决定 了 使用 Apple Silicon 处理器 的 Mac 能 用 多少 老 软件 看看 隔壁 的 Surface Pro X 你 就 知道 如果 转译 器 做 不好 会 造成 多 翻车 的 结果 所以 带 着 曾经 开发 初代 Rosetta 得到 的 宝贵 经验 苹果 用 软硬兼施 + 静态 翻译 的 做法 做出 了 一个 稳定 且 高效 的 Rosetta 2 在我看来 这才 是 M 1 得以 完成 它 的 历史 任务 的 首要 功臣 这 期 视频 我们 主要 聊 性能 所以 我会 测试 Rosetta 转译 后 M 1 的 性能 表现 兼容性 的 部分 我们 下期 再 详细 测试 但 就 一个月 的 使用 体验 来看 不 兼容 的 软件 很少 这 是 个 很 成熟 的 果味 补丁 我 的 MacBook Pro 13 寸 是 16 GB 内存 +1 TB 硬盘 的 版本 我们 接下来 对 M 1 的 性能 测试 就 在 这台 电脑 上 完成 温度 的 读数 则 通过 iStatistica Pro 来 完成 功耗 的 读数 我们 使用 Mac 自带 的 PowerMetrics 来 完成 首先 咱们 从 CPU 性能 开始 M 1 的 CPU 由 4 个 Firestorm 大核 和 4 个 IceStorm 小核 组成 大核 频率 3.2 GHz 小核 频率 2.064 GHz 由于 目前 跨平台 测试 的 工具 还 很 有限 所以 与 其他 桌面 CPU 的 对比 我们 使用 Cinebench R 23 来 完成 在 R 23 当中 M 1 跑 出 了 多 核 7823、 单核 1514 分 的 成绩 单核 成绩 和 1165 G 7 基本相同 但略弱 于 默认 状态 的 5600 X 而多核 成绩 整体 成绩 几乎 和 4 核 8 线程 时 的 Zen 3 在 4.5 GHz 的 性能 一模一样 超过 全核睿频 还 不到 4 GHz 的 英特尔 i 7 1165 G 7 不少 但 面对 R 7 4800 U 这样 8 核 16 线程 的 选手 就 毫无 还手 之力 了 更 不要 说 R 7 4800 H 这样 的 标压 处理器 了 就 R 23 的 表现 来看 3.2 GHz 下 的 M 1 大 核心 约等于 4.7 GHz 下 的 Tiger Lake 或 4.5 GHz 下 的 Zen 3 IPC 应该 是 目前 消费 级 处理器 的 最高 水平 由于 大小 核 设计 它 的 多 核 性能 基本 等同于 Zen 3 在 4 核心 8 线程 时 的 表现 满载 时 你 大 可以 把 M 1 当作 是 4 核 8 线程 的 处理器 为了 方便 和 移动 端的 ARM 芯片 对比 我们 也 跑 了 一下 Geekbench 5 单核 成绩 比 iPad Air 4 上 3.0 GHz 的 A 14 高 大约 9% 比 A 12 Z 则 高出 约 56% 多核 则 比 满血 A 14 高出 了 78% 相 较 于 A 12 Z 也 有着 68% 的 优势 可以 说 远远 甩开 目前 移动 端的 所有 ARM 处理器 并 不是 一个 量级 但 M 1 毕竟 初来乍到 现在 不少 软件 依然 不是 原生 ARM 指令集 那 M 1 在 经过 Rosetta 2 转移 器 模拟 x 86 处理器 时有 怎样 的 性能 表现 呢 ? 我们 用 了 三代 Cinebench 进行 了 测试 结果 很 有趣 Cinebench R 23 中 经过 了 转译 的 M 1 跑 出 了 单核 999 分 多核 5241 分 的 成绩 大约 相当于 原生 状态 的 67% 这个 成绩 甚至 要 低于 同样 以 3.2 GHz 运行 的 4 核 8 线程 Zen 3 也 低于 除 Skylake 以外 参测 的 的 其他 x 86 处理器 但 相 较 于 定频 3.2 GHz 运行 的 4 核 8 线 Skylake 来说 还是 有 优势 的

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE

吹牛 还是 真 牛 ?苹果 M1 全网 最 硬核 评测 (上 )(2) bragging|or|really|impressive|Apple|M1|across the internet|most|hardcore|review|part one papo furado|ou|realmente impressionante|Apple||na internet|mais|poderoso|avaliação|parte 1| Prahlerei oder echter Bulle? Apple M1 Der Hardest Core Test im Internet (Teil 1) (2) ¿Derechos de fanfarronería o la realidad? Análisis del Apple M1 hardestcore en la web (2) Un droit à la vantardise ou un vrai produit ? Apple M1 : l'avis le plus tranché du web (2) Diritto di vantarsi o realtà vera? La recensione dell'Apple M1 più duro del web (2) 自慢ですか、それとも本当の雄牛ですか? Apple M1 インターネット上で最もハードなコア レビュー (パート 1) (2) 자랑인가, 진짜인가? Apple M1 하드코어 리뷰 (상단) (2) Pasigyrimas ar tiesa? "Apple M1 Hardcore" apžvalga (viršuje) (2) Opschepperij of het echte werk? Apple M1 hardstcore recensie op het web (2) Prawo do przechwałek czy prawdziwa rzecz? Najtrudniejsza recenzja Apple M1 w sieci (2) Vangloriar-se ou touro real? Apple M1 A revisão mais difícil da Internet (parte 1) (2) Хвастовство или реальная вещь? Самый жесткий обзор Apple M1 в Интернете (2) Skrytmåns eller äkta vara? Apple M1 hårdaste recension på webben (2) Övünme Hakkı mı Gerçek Şey mi? Web'de Apple M1 hardestcore incelemesi (2) 吹牛 还是 真牛 ?苹果 M1 全网 最 硬核 评测 (上) (2) 吹牛还是真牛?苹果M1 全网最硬核评测(上) (2) 吹牛還是真牛?蘋果M1 全網最硬核評測(上) (2) Bragging or really impressive? Apple's M1 All-Net Hardcore Review (Part 1) (2)

x 86 CPU 的 AVX 性能 在 如今 十分 重要 曾经 Zen 2 相较 于 Zen 和 Zen + 的 巨大 提升 很大 程度 就 来源于 AVX 性能 的 提升 而 AVX 作为 SIMD 指令集 十分 依赖 SIMD 宽度 而 ARM 架构 中 类似 于 AVX 的 指令集 叫做 Neon M 1 的 每个 核心 里 有 4 个 128 bit 的 Neon 管道 这个 规格 和 Skylake 以及 Zen 3 是 同一 水平 至少 在 处理器 架构 层面 上 这颗 ARM 处理器 的 浮点 性能 已经 站上 了 和 x 86 最 先进 的 架构 平等 的 水平 除此之外 M 1 还有 一个 能 让 浮点 单元 和 NPU 里应外合 的 AMX 指令集 这 让 它 的 浮点 性能 更上一层楼 但 浮点 性能 的 发挥 还 和 频率 以及 内存 性能 有关 那么 接下来 我们 来 聊聊 M 1 的 缓存 与 内存 设计 缓存 对 CPU 的 PPC 有着 巨大 的 帮助 Zen 2 的 桌面版 和 移动 版 的 差距 就是 由于 L 3 缓存 导致 的 而 Ice Lake 和 Tiger Lake 更是 几乎 只有 缓存 设计 上 的 区别 苹果 在 M 1 的 大 核里 塞进 了 12 MB 的 共享 L 2 缓存 作为 对比 A 14 里面 的 大核 的 L 2 缓存 是 8 MB 这 应该 是 现代 CPU 里 最大 的 二级缓存 设计 平均 每 核心 3 MB 的 二级缓存 远大于 Tiger Lake 或者 Zen 3 的 L 2 缓存 更 接近 它们 的 三级 缓存 上次 在 苹果 以外 的 CPU 上 见到 这样 的 大 L 2 还是 酷睿 2 时代 M 1 的 小 核心 则 配置 了 4 MB 的 L 2 缓存 这个 大小 就 更 接近 我们 认知 中 的 L 2 缓存 了 但 因为 我们 没有 办法 在 新 MacBook Pro 上 跑 AIDA 64 之类 的 测试工具 所以 M 1 和 Zen 3 以及 Tiger Lake 的 L 2 性能 差别 我们 还 不得而知 一般来说 L 2 容量 越大 延迟 就 越 难 优化 但 就 容量 来看 M 1 的 规格 确实 有点 吓人 除此之外 M 1 还有 一个 类似 三级 缓存 的 系统 级别 缓存 这个 缓存 是 CPU 、 GPU 和 NPU 等 单元 共享 的 从 官方 keynote 里 公布 的 DIE Shot 来看 应该 和 A 14 一样 都 是 16 MB 因为 GPU 也 要 用 这个 缓存 CPU 的 大 L 2 缓存 应该 和 这 一点 也 有 关系 内存 方面 M 1 配备 了 苹果 称之为 统一 内存 架构 实际上 这 并 不是 苹果 第一次 这样 做 左边 是 iPad Pro 里面 的 A 12 X 和 A 12 Z 右边 是 这次 的 M 1 是不是 发现 它们 长得 很 像 ? The AVX performance of x86 CPUs is very important today. The significant improvement of Zen 2 compared to Zen and Zen+ largely comes from the enhancement of AVX performance. AVX, as a SIMD instruction set, heavily relies on SIMD width. In the ARM architecture, a similar instruction set to AVX is called Neon. Each core of the M1 has 4 128-bit Neon pipelines. This specification is on par with Skylake and Zen 3, at least at the processor architecture level. This ARM processor's floating-point performance has already reached a level comparable to the most advanced x86 architectures. Additionally, the M1 has an AMX instruction set that allows the floating-point unit and NPU to work together, further enhancing its floating-point performance. However, the performance of floating-point operations also depends on frequency and memory performance. Next, let's talk about the cache and memory design of the M1. Cache has a huge impact on the PPC of CPUs. The difference between the desktop and mobile versions of Zen 2 is due to the L3 cache, while Ice Lake and Tiger Lake differ almost solely in cache design. Apple has included a 12 MB shared L2 cache in the M1's big cores. In comparison, the L2 cache in the big cores of the A14 is 8 MB. This is likely the largest L2 cache design in modern CPUs, averaging 3 MB of L2 cache per core, which is much larger than the L2 cache of Tiger Lake or Zen 3, and is closer to their L3 cache. The last time we saw such a large L2 cache outside of Apple was during the Core 2 era. The M1's small cores are equipped with a 4 MB L2 cache, which is more in line with our understanding of L2 cache. However, since we cannot run testing tools like AIDA 64 on the new MacBook Pro, we still do not know the performance differences in L2 cache between the M1, Zen 3, and Tiger Lake. Generally speaking, the larger the L2 capacity, the harder it is to optimize latency. But in terms of capacity, the specifications of the M1 are indeed a bit intimidating. Additionally, the M1 has a system-level cache similar to L3 cache, which is shared among the CPU, GPU, and NPU. According to the DIE shot released in the official keynote, it should be 16 MB, similar to the A14, since the GPU also needs to use this cache. The large L2 cache of the CPU should also be related to this. In terms of memory, the M1 is equipped with what Apple calls a unified memory architecture. In fact, this is not the first time Apple has done this. On the left is the A12X and A12Z in the iPad Pro, and on the right is the M1. Do you notice they look very similar? 事实上 新 的 内存 架构 应该 在 A 12 X 时 就 已经 应用 在 了 iPad Pro 里面 M 1 集成 在 片 上 的 内存 是 双通道 的 LPDDR 4 X 4266 这里 我 说 的 双通道 指 的 是 128 bit 不是 手机 常说 的 64 bit 带宽 相比 A 14 是 翻番 的 和 内存 配置 比较 好 的 Intel 、 AMD 核显 笔记本 带宽 近似 但 计算机 里 有 一个 常识 距离 越近 延迟 越低 所以 苹果 这个 操作 应该 主要 是 为了 降低 延迟 以及 更好 保证 GPU 的 性能 表现 当然 升级 内存 就别 想 了 尤其 是 这次 的 Mac mini 彻底 关上 了 升级 硬件 的 大门 买来 是 啥 样 就是 啥样 至于 笔记本 不能 换 硬件 已经 四年 了 倒 是 没 啥 影响 大家 都 习惯 了 容量 方面 这次 提供 了 8 GB 和 16 GB 两种 这 两个 容量 其实 就是 在 告诉 你 这次 的 新 电脑 就 不是 给 强 生产力 用户 准备 的 也许 明年 夏天 之后 看 苹果 会 在 稍微 高阶 的 产品 上用 上 32 G 及 以上 的 片 上 内存 但 虽说 这次 M 1 用 上 了 统一 内存 架构 但 我 还是 有 一点 更 不切实际 的 贪念 什么 时候 苹果 能 抛弃 DDR 内存 把 HBM 技术 用 在 自家 的 SoC 上 就 牛 逼 炸 了 我 相信 能 做到 这步 的 目前 有且 只有 苹果 就 看 他们 愿不愿意 这样 干 了 毕竟 这 成本 可不 低 简单 总结 一下 M 1 的 架构 这 应该 是 目前 最 “ 超大 杯 ” 的 处理器 核心 即使 和 Zen 3、 Skylake 相比 依然 十分 巨大 加上 使用 了 目前 桌面 CPU 唯一 的 5 nm 工艺 这颗 处理器 的 表现 很 令人 期待 其实 这么 分析 下来 你 会 发现 AMD 的 Zen 3 架构 也 非常 优秀 似乎 只是 规格 不如 M 1 那么 暴力 也许 再 做 宽 一点 就 能 在 IPC 上 打败 M 1 了 可 为什么 其他 厂商 不去 做 像 M 1 处理器 一样 宽 的 架构 来 提升 IPC 呢 ? In fact, the new memory architecture should have been applied in the A12X in the iPad Pro. The memory integrated on the M1 chip is dual-channel LPDDR4X 4266. Here, when I say dual-channel, I mean 128 bits, not the 64-bit bandwidth commonly referred to in mobile phones. Compared to the A14, this is a doubling, and the bandwidth is similar to that of Intel and AMD integrated graphics laptops with good memory configurations. However, there is a common understanding in computers: the closer the distance, the lower the latency. Therefore, Apple's approach should primarily be to reduce latency and better ensure GPU performance. Of course, forget about upgrading the memory. Especially this time, the Mac mini has completely closed the door on hardware upgrades. What you buy is what you get. As for laptops, they haven't allowed hardware upgrades for four years, but it hasn't had much impact; everyone has gotten used to it. In terms of capacity, this time it offers 8 GB and 16 GB. These two capacities actually indicate that this new computer is not designed for high productivity users. Perhaps after next summer, we will see Apple use 32 GB or more of on-chip memory in slightly higher-end products. But even though the M1 uses a unified memory architecture this time, I still have a somewhat unrealistic desire: when will Apple abandon DDR memory and use HBM technology in its own SoCs? That would be incredibly impressive. I believe that currently, only Apple can achieve this; it just depends on whether they are willing to do it, as the cost is not low. To summarize the M1 architecture, this should be the most "super-sized" processor core currently available. Even compared to Zen 3 and Skylake, it is still quite large. Coupled with the use of the only 5 nm process for desktop CPUs, the performance of this processor is highly anticipated. In fact, upon analysis, you will find that AMD's Zen 3 architecture is also very excellent; it seems that its specifications are just not as aggressive as the M1. Perhaps if they made it a bit wider, they could surpass the M1 in IPC. But why don't other manufacturers create architectures as wide as the M1 processor to improve IPC? 其实 这里 包含 着 几个 方面 的 原因 苹果 的 处理器 不 外卖 它 卖 的 是 笔记本 、 平板 和 手机 但 其他 处理器 厂商 卖 的 是 处理器 甭管 你 是 高通 还是 Intel 、 AMD 他们 赚 的 是 处理器 那 部分 的 利润 苹果 就 可以 省出 这部分 利润 用来 继续 堆 规格 但 整机 的 成本 却 不会 上涨 甚至 因为 Mac 和 iOS 设备 共享 处理器 架构 处理器 的 研发 成本 还 可以 得到 iPhone 和 iPad 的 分摊 于是 在 处理器 制造 成本 可能 比 intel 或 AMD 更 高 的 情况 下 苹果 赚 的 反而 更 多 了 苹果 在 A 11 的 时代 就 在 硬件 层面 终结 了 对 32 位 应用 的 支持 而 macOS 也 在 去年 的 10.15 版本 里 去掉 了 对 32 位 应用 的 支持 到 如今 已经 完成 了 全 64 位 软件 的 准备 你 能 想象 你 买 回家 的 Zen 3 处理器 完全 不 支持 32 位 应用 吗 ? In fact, there are several reasons for this. Apple's processors are not sold separately; they sell laptops, tablets, and phones. But other processor manufacturers sell processors. Whether you are Qualcomm, Intel, or AMD, they earn profits from the processor segment. Apple can save this portion of profit to continue increasing specifications, but the overall cost of the machine does not increase. In fact, because Macs and iOS devices share processor architecture, the R&D costs of the processors can be shared with iPhones and iPads. Thus, even if the manufacturing costs of the processors may be higher than those of Intel or AMD, Apple ends up earning even more. Apple ended support for 32-bit applications at the hardware level during the A11 era, and macOS also removed support for 32-bit applications in last year's version 10.15. Now, it has completed the transition to all 64-bit software. Can you imagine that the Zen 3 processor you bought home completely does not support 32-bit applications? 如果 真的 这样 估计 你 得 爆炸 但 苹果 对 生态 的 控制 使得 他们 可以 用 一定 的 兼容性 换取 更强 的 性能 而 x 86 就 得 背着 这种 具有 数十年 历史 的 “ x 86 税 ” 在 增加 性能 的 同时 继续 保持 对 上古 软件 的 兼容 但 这种 兼容性 也 是 要 占 面积 和 费电 的 M 1 毕竟 脱胎 于 A 14 而 A 14 来自 于 手机 这 意味着 它 要 用 更 高 的 IPC 去 换取 更 低 的 频率 和 电压 这样 才能 保证 移动 设备 的 续航 对 AMD 和 Intel 来说 应用 它们 处理器 的 最 低功耗 设备 是 笔记本 而 更 高功耗 的 台式机 并不需要 考虑 续航 问题 所以 他们 可以 用 更 高 的 频率 获得 相同 的 性能 虽然 此时 的 能耗 比会 下降 但 绝对 性能 上 4.5 GHz -5 GHz 的 Zen 3 也 不会 低于 3.2 GHz 的 M 1 可以 说 M 1 虽然 是 同频 性能 之王 但 未必 是 同 面积 性能 之王 前面 也 说 了 面积 就是 制造 成本 这 对于 双核 或者 四核 可能 不会 差 那么 大 那 如果 是 16 个 核 乃至 64 个 核 呢 ? Wenn Sie das wirklich so einschätzen, werden Sie explodieren, aber Apples Kontrolle über die Ökologie erlaubt es ihnen, bestimmte Kompatibilität gegen stärkere Leistung einzutauschen, und x86 muss diese jahrzehntealte „x86-Steuer“ tragen, um die Leistung zu steigern. es wird weiterhin die Kompatibilität mit alter Software aufrechterhalten, aber diese Kompatibilität nimmt auch Platz in Anspruch und verbraucht Strom.Schließlich wurde das M 1 aus dem A 14 geboren, und das A 14 stammt aus einem Mobiltelefon, was bedeutet, dass es benötigt wird höhere IPC gegen niedrigere auszutauschen. Die Frequenz und Spannung können die Akkulaufzeit mobiler Geräte sicherstellen. Für AMD und Intel sind die Geräte mit dem niedrigsten Stromverbrauch, die ihre Prozessoren verwenden, Notebooks, und Desktops mit höherem Stromverbrauch müssen die Akkulaufzeit nicht berücksichtigen, So können sie höhere Frequenzen verwenden, um bei gleicher Leistung zu erhalten, obwohl das Energieverbrauchsverhältnis zu diesem Zeitpunkt sinkt, wird die absolute Leistung des 4,5-GHz- bis 5-GHz-Zen 3 nicht niedriger sein als die des 3,2-GHz-M 1. Das kann sein sagte, dass, obwohl der M 1 der König der Leistung bei der gleichen Frequenz ist, es nicht unbedingt derselbe Bereich sein muss.Der König der Leistung sagte auch, dass der Bereich die Herstellungskosten ist, die für Dual-Core oder nicht so schlecht sein können Quad-Core Was ist, wenn es 16 Kerne oder sogar 64 Kerne sind? If that were really the case, you would probably explode. But Apple's control over the ecosystem allows them to exchange a certain level of compatibility for stronger performance, while x86 has to bear the "x86 tax" with decades of history, maintaining compatibility with ancient software while increasing performance. However, this compatibility also takes up space and consumes power. The M1, after all, is derived from the A14, and the A14 comes from mobile phones. This means it needs to achieve higher IPC to exchange for lower frequency and voltage, ensuring the battery life of mobile devices. For AMD and Intel, the lowest power consumption devices using their processors are laptops, while higher power consumption desktops do not need to consider battery life. Therefore, they can use higher frequencies to achieve the same performance. Although the energy consumption ratio may decrease at this point, the absolute performance of the 4.5 GHz - 5 GHz Zen 3 will not be lower than that of the 3.2 GHz M1. It can be said that while the M1 is the king of performance at the same frequency, it may not be the king of performance at the same area. As mentioned earlier, area relates to manufacturing costs. This may not be a significant difference for dual-core or quad-core processors, but what if it is 16 cores or even 64 cores? 处理器 厂商 的 一个 架构 要 覆盖 笔记本 到 服务器 那么 这件 事 就 不得不 考虑 了 说白了 处理器 的 设计 无非 就是 平衡 功耗 、 性能 和 成本 功耗 会 因为 频率 和 电压 而 大幅 上升 成本 会 由于 利润率 的 要求 尽可能 压低 所以 反映 在 性能 上 就 得 找到 一个 平衡点 了 苹果 的 特别之处 就 在于 有 足够 强大 的 生态 这 三者 它 都 有着 绝对 的 控制权 于是 就 可以 找到 一个 相对 高 的 平衡点 所以 M 1 就 这样 横空出世 了 接下来 的 实际 测试 里 我们 会 实际 来 看看 它 的 真实性 能 、 功耗 表现 我们 还会 分析 一下 它 的 每 核心 功耗 对比 一下 x 86 阵营 里 最 先进 的 Zen 3 处理器 以及 和 同 架构 的 小弟 A 14 对比 来 看看 苹果 是否 在 频率 上 还 留 了 一手 那么 在 进入 实际 测试 之前 我们 再 来 聊 一个 非常 重要 的 东西 —— Rosetta 2 Rosetta 2 可以 说 是 M 1 Mac 的 一个 杀手锏 毕竟 苹果 不是 第一次 做 处理器 架构 间 的 转换 工具 了 第一代 Rosetta 正是 Mac 从 Power PC 转向 Intel 架构 时 苹果 推出 的 秘密武器 而 这次 的 第二代 让 我们 看到 了 苹果 牌 补丁 的 实力 首先 它 的 兼容性 确实 不错 不像 隔壁 搞 了 一年 多才 姗姗来迟 的 x 86-64 支持 苹果 的 Rosetta 2 从 一 开始 就 能 跑 x 86-64 应用 而且 兼容性 大家 也 看 了 不少 评测 确实 不错 基本上 老 Mac 用户 可以 直接 用 Time Machine 恢复 他们 的 备份 到 M 1 的 Mac 绝大多数 软件 运行 都 没 啥 问题 但 作为 一个 转译 器 除了 要 保证 兼容性 性能 表现 也 十分 重要 其实 在 这里 苹果 用 上 了 它们 最大 的 优势 —— 软硬件 结合 ARM 和 x 86 的 内存 一致性 模型 不同 这会 导致 多线程 软件 运行 的 问题 苹果 在 M 1 里 直接 做 了 两版 内存 模型 在 运行 原生 应用 的 时候 使用 ARM 的 那套 而 在 运行 X 86 转译 应用 时 就 切换 到 x 86 的 那套 这种 深入骨髓 的 软硬 结合 是 其他 厂商 羡慕 却 学不来 的 这才 带来 了 Rosetta 2 的 优秀 表现 说白了 Rosetta 2 并 不仅仅 是 一个 软件 层面 的 转译 器 而是 需要 配合 苹果 自己 的 处理器 设计 才 实现 了 如今 的 表现 另一方面 Rosetta 2 并 不是 一个 动态 转译 器 它 是 一个 静态 转译 器 在 你 第一次 打开 x 86 应用 时 它会 帮 你 默默 转换 完 你 的 软件 之后 打开 的 时候 就 会 直接 打开 翻译 后 的 代码 形象 点 说 动态 翻译器 就 像是 同声 传译 而 静态 翻译 就 像是 字幕组 做好 了 熟肉 再 给 你 看 这样一来 性能 损失 会 更 小 也 更 容易 保持 软件 的 稳定 但 如果 你 是 个 完全 不 关心 电脑 里 用 什么 处理器 的 人 它 第一次 打开 譬如 Word 之类 的 软件 时 时间 长得 可能 会 让 你 觉得 你 新 买 的 电脑 坏 了 不过 好 在 Office 已经 原生 兼容 了 M 1 处理器 VS Code 也 是 微软 不愧 是 苹果 最佳 开发者 总结 一下 在 两年 的 过渡期 内 Rosetta 2 的 表现 直接 决定 了 使用 Apple Silicon 处理器 的 Mac 能 用 多少 老 软件 看看 隔壁 的 Surface Pro X 你 就 知道 如果 转译 器 做 不好 会 造成 多 翻车 的 结果 所以 带 着 曾经 开发 初代 Rosetta 得到 的 宝贵 经验 苹果 用 软硬兼施 + 静态 翻译 的 做法 做出 了 一个 稳定 且 高效 的 Rosetta 2 在我看来 这才 是 M 1 得以 完成 它 的 历史 任务 的 首要 功臣 这 期 视频 我们 主要 聊 性能 所以 我会 测试 Rosetta 转译 后 M 1 的 性能 表现 兼容性 的 部分 我们 下期 再 详细 测试 但 就 一个月 的 使用 体验 来看 不 兼容 的 软件 很少 这 是 个 很 成熟 的 果味 补丁 我 的 MacBook Pro 13 寸 是 16 GB 内存 +1 TB 硬盘 的 版本 我们 接下来 对 M 1 的 性能 测试 就 在 这台 电脑 上 完成 温度 的 读数 则 通过 iStatistica Pro 来 完成 功耗 的 读数 我们 使用 Mac 自带 的 PowerMetrics 来 完成 首先 咱们 从 CPU 性能 开始 M 1 的 CPU 由 4 个 Firestorm 大核 和 4 个 IceStorm 小核 组成 大核 频率 3.2 GHz 小核 频率 2.064 GHz 由于 目前 跨平台 测试 的 工具 还 很 有限 所以 与 其他 桌面 CPU 的 对比 我们 使用 Cinebench R 23 来 完成 在 R 23 当中 M 1 跑 出 了 多 核 7823、 单核 1514 分 的 成绩 单核 成绩 和 1165 G 7 基本相同 但略弱 于 默认 状态 的 5600 X 而多核 成绩 整体 成绩 几乎 和 4 核 8 线程 时 的 Zen 3 在 4.5 GHz 的 性能 一模一样 超过 全核睿频 还 不到 4 GHz 的 英特尔 i 7 1165 G 7 不少 但 面对 R 7 4800 U 这样 8 核 16 线程 的 选手 就 毫无 还手 之力 了 更 不要 说 R 7 4800 H 这样 的 标压 处理器 了 就 R 23 的 表现 来看 3.2 GHz 下 的 M 1 大 核心 约等于 4.7 GHz 下 的 Tiger Lake 或 4.5 GHz 下 的 Zen 3 IPC 应该 是 目前 消费 级 处理器 的 最高 水平 由于 大小 核 设计 它 的 多 核 性能 基本 等同于 Zen 3 在 4 核心 8 线程 时 的 表现 满载 时 你 大 可以 把 M 1 当作 是 4 核 8 线程 的 处理器 为了 方便 和 移动 端的 ARM 芯片 对比 我们 也 跑 了 一下 Geekbench 5 单核 成绩 比 iPad Air 4 上 3.0 GHz 的 A 14 高 大约 9% 比 A 12 Z 则 高出 约 56% 多核 则 比 满血 A 14 高出 了 78% 相 较 于 A 12 Z 也 有着 68% 的 优势 可以 说 远远 甩开 目前 移动 端的 所有 ARM 处理器 并 不是 一个 量级 但 M 1 毕竟 初来乍到 现在 不少 软件 依然 不是 原生 ARM 指令集 那 M 1 在 经过 Rosetta 2 转移 器 模拟 x 86 处理器 时有 怎样 的 性能 表现 呢 ? If a processor manufacturer wants to cover everything from laptops to servers, then this matter must be considered. In simple terms, the design of a processor is all about balancing power consumption, performance, and cost. Power consumption can rise significantly due to frequency and voltage, while costs are kept as low as possible due to profit margin requirements. Therefore, a balance point must be found in terms of performance. Apple's uniqueness lies in having a sufficiently powerful ecosystem, where it has absolute control over all three aspects, allowing it to find a relatively high balance point. Thus, the M1 was born. In the following actual tests, we will take a look at its real performance and power consumption. We will also analyze its per-core power consumption compared to the most advanced Zen 3 processors in the x86 camp and its little brother, the A14, to see if Apple has left some headroom in terms of frequency. Before we dive into the actual tests, let's discuss something very important—Rosetta 2. Rosetta 2 can be said to be a killer feature of the M1 Mac. After all, Apple is not new to creating tools for transitioning between processor architectures. The first generation of Rosetta was Apple's secret weapon when transitioning from PowerPC to Intel architecture. This second generation shows us the power of Apple's patch. First of all, its compatibility is indeed quite good, unlike the neighboring camp that took over a year to finally support x86-64. Apple's Rosetta 2 was able to run x86-64 applications from the very beginning, and the compatibility has been well-reviewed. Basically, old Mac users can directly use Time Machine to restore their backups to M1 Macs, and most software runs without issues. However, as a translator, ensuring performance is also very important. Here, Apple leveraged its greatest advantage—hardware and software integration. The memory consistency models of ARM and x86 are different, which can lead to issues with multi-threaded software. Apple directly implemented two versions of the memory model in the M1: using the ARM model when running native applications and switching to the x86 model when running x86-translated applications. This deep integration of hardware and software is something other manufacturers envy but cannot replicate, which has led to the excellent performance of Rosetta 2. In simple terms, Rosetta 2 is not just a software-level translator; it needs to work in conjunction with Apple's own processor design to achieve its current performance. On the other hand, Rosetta 2 is not a dynamic translator; it is a static translator. When you first open an x86 application, it will silently convert your software, and when you open it again, it will directly launch the translated code. To put it visually, a dynamic translator is like simultaneous interpretation, while static translation is like a subtitle group preparing the content before showing it to you. This way, performance loss is minimized, and it is easier to maintain software stability. However, if you are someone who completely does not care about what processor is in your computer, the time it takes to open software like Word for the first time might make you feel like your newly purchased computer is broken. Fortunately, Office has already natively supported the M1 processor, and VS Code is also a testament to Microsoft's status as Apple's best developer. To summarize, during the two-year transition period, the performance of Rosetta 2 directly determines how much old software can be used on Macs with Apple Silicon processors. Just look at the neighboring Surface Pro X, and you will understand that if the translator is not done well, it can lead to many failures. Therefore, leveraging the valuable experience gained from developing the first generation of Rosetta, Apple has created a stable and efficient Rosetta 2 through a combination of hardware and software and static translation. In my opinion, this is the primary reason the M1 has been able to accomplish its historical mission. In this video, we mainly discuss performance, so I will test the performance of the M1 after Rosetta translation. We will test the compatibility part in detail in the next episode, but based on a month of usage experience, there are very few incompatible software. This is a very mature patch. My MacBook Pro 13-inch has 16 GB of memory and a 1 TB hard drive. We will conduct the performance tests of the M1 on this computer. Temperature readings will be done using iStatistica Pro, and power consumption readings will be done using Mac's built-in PowerMetrics. First, let's start with CPU performance. The M1's CPU consists of 4 Firestorm big cores and 4 IceStorm small cores, with big core frequencies at 3.2 GHz and small core frequencies at 2.064 GHz. Currently, there are still very limited tools for cross-platform testing, so we will use Cinebench R23 for comparison with other desktop CPUs. In R23, the M1 scored 7823 in multi-core and 1514 in single-core performance. The single-core score is basically the same as the 1165 G7 but slightly weaker than the default state of the 5600 X. However, the multi-core score is almost identical to the performance of the Zen 3 at 4.5 GHz with 4 cores and 8 threads, surpassing the Intel i7 1165 G7, which has a maximum turbo frequency of just under 4 GHz. However, against competitors like the R7 4800 U, which has 8 cores and 16 threads, it is completely outmatched. Not to mention the R7 4800 H, which is a standard voltage processor. From the R23 performance, the M1's big core at 3.2 GHz is roughly equivalent to the IPC of Tiger Lake at 4.7 GHz or Zen 3 at 4.5 GHz, which should be the highest level among consumer-grade processors. Due to the design of big and small cores, its multi-core performance is basically equivalent to the performance of Zen 3 at 4 cores and 8 threads. Under full load, you can consider the M1 as a 4-core, 8-thread processor. To facilitate comparison with mobile ARM chips, we also ran Geekbench 5. The single-core score is about 9% higher than the 3.0 GHz A14 in the iPad Air 4 and about 56% higher than the A12 Z. The multi-core score is 78% higher than the full-power A14 and has a 68% advantage over the A12 Z. It can be said that it far surpasses all current mobile ARM processors and is not in the same league. However, the M1 is still new, and many software are not yet natively using the ARM instruction set. So how does the M1 perform when simulating an x86 processor through the Rosetta 2 translator? 我们 用 了 三代 Cinebench 进行 了 测试 结果 很 有趣 Cinebench R 23 中 经过 了 转译 的 M 1 跑 出 了 单核 999 分 多核 5241 分 的 成绩 大约 相当于 原生 状态 的 67% 这个 成绩 甚至 要 低于 同样 以 3.2 GHz 运行 的 4 核 8 线程 Zen 3 也 低于 除 Skylake 以外 参测 的 的 其他 x 86 处理器 但 相 较 于 定频 3.2 GHz 运行 的 4 核 8 线 Skylake 来说 还是 有 优势 的 We tested with three generations of Cinebench, and the results are quite interesting. In Cinebench R23, the translated M1 scored 999 in single-core and 5241 in multi-core, which is about 67% of the native state. This score is even lower than the 4-core, 8-thread Zen 3 running at 3.2 GHz. It is also lower than other x86 processors tested, except for Skylake. However, compared to the 4-core, 8-thread Skylake running at a fixed frequency of 3.2 GHz, it still has an advantage.

SENT_CWT:AsVK4RNK=17.37 PAR_TRANS:gpt-4o-mini=12.43 en:AsVK4RNK openai.2025-01-22 ai_request(all=9 err=0.00%) translation(all=7 err=0.00%) cwt(all=2147 err=99.49%)