×

Nós usamos os cookies para ajudar a melhorar o LingQ. Ao visitar o site, você concorda com a nossa política de cookies.


image

李永乐老师 Youtube, 机器能像人一样思考吗?人工智能(一)机器学习和神经网络 (1)

机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1)

各位 同学 大家 好 我 是 李永乐 老师 前 一段时间 我 为 大家 介绍 了 创造 未来 的 新 技术 5G 有个 小朋友 就 跟 我 说 他 对 人工智能 的 话题 特别 感兴趣 小 的 时候 就 特别 喜欢 看 科幻片 比如说 像 《 终结者 》 《 机械公敌 》 这样 的 电影 但 他 始终 不 明白 为什么 机器 能够 像 人 一样 思考 呢 其实 人工智能 早就 不是 科学幻想 了 而是 已经 应用 到 生活 的 方方面面 了 比如说 为了 应对 新冠 肺炎 很多 公司 都 加装 了 人脸识别 系统 它 能够 区分 你 是不是 这个 公司 的 员工 用 的 就是 人工智能 在 进行 新冠 肺炎 筛查 的 时候 肺部 影像 CT 是 一个 很 重要 的 指标 人工智能 就 可以 帮助 医生 快速 判断 这个 人 的 肺部 是不是 感染 了 同时 人工智能 也 可以 判断 肿瘤 的 类型 当 我们 在 路上 开车 被 电子眼 抓拍 的 时候 人工智能 可以 帮助 我们 识别 车牌 除了 图像识别 之外 人工智能 还 可以 用 在 语音 识别 上 比如说 各种 语音 助手 智能 音箱 都 用到 了 人工智能 的 原理 再 比如 我们 手机 中 的 美颜 软件 短 视频 平台 的 推荐 系统 邮件系统 中 的 反垃圾 系统 其实 用到 的 都 是 人工智能 还有 自动 驾驶 智慧 工业 也 离不开 人工智能 今天 我们 就 来 聊 一聊 人工智能 的 相关 话题 希望 通过 今天 的 讲解 大家 能够 对 人工智能 和 神经网络 有 一个 基本 的 认识 我们 首先 先来 聊 一聊 人工智能 的 发展史 人工智能 其实 并 不是 一个 新 出现 的 事物 在 上古时代 不管 是 东方 还是 西方 其实 都 有 人造 人 的 神话 而 到 了 上 世纪 的 30 到 50 年代 随着 计算机科学 这个 神经科学 还有 数学 的 发展 人工智能 才 第一次 进入 到 了 科学家 的 视野 在 1950 年 的 时候 英国 的 著名 的 这个 计算机 科学家 叫 图灵 他 提出 了 一个 问题 他 说 机器 能够 像 人类 一样 思考 吗 并且 为了 这个 问题 图灵 还 提出 了 一种 测试方法 也 就是 我们 今天 所说 的 图灵 测试 图灵 测试 是 说 我们 可以 让 一个 人 通过 文字 的 方法 和 两个 东西 进行 交流 这有 一个 里边 是 个人 另外 它 是 一个 电脑 是 个 机器 是 吧 他 通过 文字 的 方法 进行 交流 然后 能 不能 通过 一系列 的 提问 和 回答 让 左边 的 这个 人 判断 哪 一个 才 是 真人 哪 一个 才 是 机器 呢 如果 经过 判断 这个 人 没有 办法 区分 真人 和 机器 的话 就 说明 这个 机器 通过 了 图灵 测试 图灵 预测 到 2000 年 的 时候 将会 有 一台 机器 它 能够 使 30% 以上 的 人 相信 它 是 一个 人 这 就 通过 了 图灵 测试 图灵 测试 每 一年 都 会 举行 那 在 2014 年 的 时候 终于 有 一台 机器 它 骗过 了 33% 的 人 让 别人 相信 它 是 一个 小男孩 是 一个 13 岁 的 男孩 算是 通过 了 图灵 测试 那么 计算机领域 的 最高 奖项 叫 图灵奖 就是 以 图灵 命名 的 它 被 称为 计算机领域 里面 的 诺贝尔奖 那么 还有 一个 重要 的 年代 就是 1956 年 在 1956 年 的 时候 有 这个 两位 计算机 科学家 一个 叫做 马文 · 明斯基 还有 一个 叫做 约翰 · 麦卡锡 那么 这 两个 人 又 拽 上 了 这个 信息论 的 奠基者 著名 大佬 香农 他们 几个 召集 了 一个 会议 这个 会议 就是 著名 的 达特茅斯 会议 达特茅斯 会议 上 主要 的 议题 就是 机器 是否 能够 像 人类 一样 思考 是 吧 并且 在 这次 会议 上 人们 发明 了 一个 词 这个 词 就是 人工智能 也 就是 我们 经常 听说 到 的 AI 是 吧 从 那 一次 会议 开始 这个 人工智能 就 进入 了 第一次 大 发展 时代 而 这个 明斯基 和 麦卡锡 就 因为 他们 在 人工智能 领域 的 贡献 而 获得 了 图灵奖 是 吧 香农 是 不 需要 图灵奖 了 因为 香农 的 名字 被 用来 命名 通信 领域 的 诺贝尔奖 那 就是 香农 奖 是 吧 好 那么 人工智能 在历史上 其实 也 经历 了 几次 涨落 有三涨 两落 那 现在 我们 是 处于 第三次 大 发展 的 时代 这个 事件 的 起源 是 在 1997 年 的 时候 1997 年 那 段时间 这个 人工智能 陷入 了 低谷 不过 那 一段时间 出 了 一个 事 就是 IBM 公司 造 了 一个 机器人 这个 机器人 名字 叫做 深蓝 它 干 了 什么 事 想必 很多 人 还 记得 吧 就是 它 下象棋 结果 战胜 了 12 年 的 国际象棋 冠军 卡斯帕罗夫 因为 深蓝 战胜 了 卡斯帕罗夫 所以 人工智能 再次 复苏 了 当然 这 一次 的 人工智能 复苏 和 发展 是 得益于 最近 几十年 计算机科学 以及 各种 算法 的 改进 尤其 是 在 人工智能 算法 领域 涌现出 很多 的 灵魂 人物 比如说 像 加拿大多伦多大学 的 这个 辛顿 是 吧 他 的 著名 的 贡献 就是 将 反向 传播 算法 BP 引入 到 人工智能 当中 这个 我们 后面 会 介绍 还有 叫 纽约大学 的 杨立 坤 他 的 这个 著名 的 贡献 就是 卷积 神经网络 这个 我们 也 会 介绍 还有 比如说 像 加拿大 的 这个 蒙特利尔 大学 的 这个 本 吉奥 他们 三个 也 因为 在 人工智能 领域 的 贡献 获得 了 2018 年 的 图灵奖 经过 几十年 的 发展 这个 人工智能 已经 有 了 长足 的 进步 在 特定 领域 比如说 像 图像识别 领域 人工智能 甚至 已经 超过 了 人类 而 在 机器翻译 和 语音 识别 方面 人工智能 也 已经 有 了 长足 的 应用 比如 现在 我们 上网 看到 一个 网页 英文 的 我们 看不懂 看到 一个 网页 英文 的 我们 看不懂 我们 可以 右键 选择 翻译成 中文 它 就 能 直接 把 网页 给 我们 翻译 过来 我们 出国 旅游 遇到 外国人 我们 不会 说话 怎么办 我们 用 一个 手机软件 就 可以 了 比如说 我 遇到 一个 英国人 我 想 问问 他 我 说 这个 英国 的 伦敦 火车站 怎么 走 你 看 我 跟 你 说 请问 伦敦 火车站 怎么 走 How can I get to the London railway station 它 就 翻译 过来 了 比如 我 去 韩国 旅游 是 吧 我 去 韩国 旅游 请问 最近 的 厕所 在 哪里 가장 가까운 화장실이 어디예요 ? 你 看 它 就 可以 翻译 过来 是 吧 当然 了 外国人 说话 我们 也 可以 通过 这个 软件 翻译 回来 这 其实 都 是 人工智能 的 一个 应用 那么 计算机 是 如何 做到 这 一点 呢 这 其实 本质 上 是 一个 数学 问题 咱们 来 一步 一步 给 大家 做 一个 解释 首先 我们 需要 大家 了解 一个 概念 叫做 梯度 下降 算法 梯度 下降 是 人工智能 最 核心 的 一个 算法 是 吧 这个 梯度 下降 算法 可以 帮助 我们 去 处理 分类 问题 还有 回归 问题 我们 以 回归 问题 为例 吧 比如说 我们 想 让 人工智能 帮 我们 干 一件 事 就是 预测 房价 咱们 说 这个 预测 房价 就是 你 给 我 一个 房子 然后 机器 判断 出来 这 房子 大概 值 多少钱 是 吧 那 怎么 做 呢 你 首先 得 给 我 一些 数据 你 告诉 我 说 房价 取决于 什么 呢 我们 知道 房价 取决于 它 是 城市 的 还是 乡村 的 它 面积 大小 楼层 它 的 小区 环境 等等 一系列 因素 对 吧 我们 先 简化 一下 比如说 这个 房价 我们 认为 它 就 取决于 一个 因素 就是 面积 我们 就 简单 一点 面积 我们 叫 它 x 那么 纵坐标 这个 是 房屋 的 价格 价格 叫做 y 你 给 了 我 一大堆 的 数据 每 一个 房屋 的 价格 对应 着 它 的 这个 面积 给 了 我 这么 一个 数据 比如说 有 m 个 数据 我们 把 这 m 个 数据 我 放在 这张 图上 大概 是 这样 比如说 这个 房子 在 这 这个 房子 价格 是 这样 这个 房子 是 这样 这 房子 是 这样 是 吧 大概 来讲 是 面积 越大 的 房子 价格 越高 当然 它会 有 一定 的 起伏 现在 我 就 问 我 说 你 能 不能 告诉 我 一个 函数 这个 价格 和 面积 之间 到底 是 什么 关系 呢 当然 最 简单 的 函数 就是 直线 所以 我们 就 可以 说 我们 假设 这个 关系 就是 y=wx+b 我 引入 了 两个 参数 大家 看 这 一个 参数 是 w 相当于 是 斜率 还有 一个 参数 是 b 是 截距 于是 我们 就 用 一条 直线 来 描述 y 和 x 的 关系 当然 大家 会 发现 这个 直线 不 可能 会过 所有 的 点 甚至于 可能 每 一个点 它 都 不过 是 吧 它 和 实际 的 情况 是 有 差别 的 比如说 第一个 房子 它 的 价格 在 这 但是 我 预测 你 价格 在 这 你 就 出现 了 一个 差别 叫 Δy₁ 这 就是 你 预测 的 误差 对 吧 第二个 房子 你 也 出现 了 一个 误差 Δy₂ 只不过 这个 误差 是 负 的 是 吧 第三个 房子 又 有 一个 误差 叫 Δy₃ 第四个 房子 又 有 一个 误差 Δy₄ 第五个 房子 又 有 一个 误差 Δy₅ 你 可能 有 很多 个 房子 都 出现 了 误差 此时 我 要说 你 这个 预测 是 精准 的 什么 意思 呢 就是 要 让 所有 的 误差 综合 来讲 是 最小 的 这个 我们 管它 叫 损失 函数 它 的 损失 函数 叫 J J 等于 什么 呢 等于 1/(2m)... m 就是 有 多少 个 数据 1/(2m) 然后 加 和 每 一个 误差 的 平方 说 误差 为什么 要 平方 加 和 呢 因为 你 如果 直接 加 和 的话 正负 会 抵消 我 为了 不让 它 抵消 我 把 它 给 平方 加 和 我 是 希望 这个 损失 函数 它 最小 对 不 对 我 也 可以 换 一个 写法 说 这个 损失 函数 J 等于 什么 呢 等于 (1/(2m))Σ(yᵢ-(wxᵢ+b))² 我 引入 的 参数 是 w 和 b 我 希望 使得 这个 误差 函数 最小 误差 函数 最小 就 说明 这 条 直线 最 符合 房价 的 价格 和 面积 关系 它 不 可能 完全符合 因为 每 一个 房价 它 可能 也 不能 满足 同一个 函数 但 它 最 符合 我 就 希望 能够 找到 这样 的 w 和 这样 的 b 但 问题 是 你 怎么 找到 这个 合适 的 参数 w 和 b 使得 损失 函数 最小 呢 上 过 大学 的 同学 都 知道 这 叫做 最小 二 乘法 这个 方法 其实 在 高斯 和 勒 让 德 的 时代 人们 就 已经 弄清楚 了 只不过 有 两个 参数 你好 算 如果 你 参数 非常 多 用 高斯 和 勒 让 德 的 方法 就 会 非常 的 复杂 于是 人们 就 想 我们 能 不能 有 一个 更好 的 方法 来 优化 这个 参数 呢 那么 这种 方法 就 称之为 梯度 下降 算法 什么 意思 啊 我们 举个 例子 比如 我 想 优化 这个 参数 w 我 想 看看 w 取 什么 值 能够 让 这个 损失 函数 最小 我 最 容易 能够 预测 这个 房价 是 吧 怎么 做 呢 我们 首先 把 这个 参数 w 作为 横坐标 然后 我们 再 把 这个 损失 函数 就是 你 的 预测 和 实际 的 差别 作为 纵坐标 你 把 它 画出 一个 图像 来 你 会 发现 这个 图像 有 可能 是 这个 样子 的 我们 希望 找到 一个 w 让 这个 损失 函数 最小 那 是 在 哪 那 是不是 在 这 我 就 希望 找到 这个 点 这个 就是 最好 的 w 但是 你 最 开始 给 它 一个 w 的 时候 你 可能 给 的 是 这个 数 w₁ 所以 这个 值 它 并不等于 我们 最优 的 参数 于是 怎么办 我们 就 需要 用 梯度 下降 算法 了 这个 梯度 下降 算法 的 过程 是 这样 的 首先 我们 求 一个 函数 叫做 ∂J/∂w 偏 导数 是 大学 的 一个 概念 大概 的 意思 就是说 你 这个 损失 函数 是 如何 随着 w 而 变化 的 它 表示 的 是 这个 函数 的 倾斜 程度 如果 这个 点 它 离 最低点 越远 的话 它 的 斜率 就 越 大 倾斜 得 越 厉害 这个 数就会 越大 对 不 对 你 先 把 这个 数求 出来 求 完 了 之后 我们 说 你 进行 迭代 怎么 迭代 呢 就是 新 的 w 就 wₙ₊₁


机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1) Can machines think like humans? Artificial Intelligence (I) Machine Learning and Neural Networks (1)

各位 同学 大家 好 我 是 李永乐 老师 前 一段时间 我 为 大家 介绍 了 创造 未来 的 新 技术 5G 有个 小朋友 就 跟 我 说 他 对 人工智能 的 话题 特别 感兴趣 小 的 时候 就 特别 喜欢 看 科幻片 比如说 像 《 终结者 》 《 机械公敌 》 这样 的 电影 Movies like "Machine Enemy" 但 他 始终 不 明白 为什么 机器 能够 像 人 一样 思考 呢 其实 人工智能 早就 不是 科学幻想 了 而是 已经 应用 到 生活 的 方方面面 了 比如说 为了 应对 新冠 肺炎 For example, in response to new coronary pneumonia 很多 公司 都 加装 了 人脸识别 系统 它 能够 区分 你 是不是 这个 公司 的 员工 用 的 就是 人工智能 在 进行 新冠 肺炎 筛查 的 时候 肺部 影像 CT 是 一个 很 重要 的 指标 人工智能 就 可以 帮助 医生 快速 判断 这个 人 的 肺部 是不是 感染 了 同时 人工智能 也 可以 判断 肿瘤 的 类型 当 我们 在 路上 开车 被 电子眼 抓拍 的 时候 人工智能 可以 帮助 我们 识别 车牌 除了 图像识别 之外 人工智能 还 可以 用 在 语音 识别 上 比如说 各种 语音 助手 智能 音箱 For example, various voice assistant smart speakers 都 用到 了 人工智能 的 原理 再 比如 我们 手机 中 的 美颜 软件 短 视频 平台 的 推荐 系统 邮件系统 中 的 反垃圾 系统 其实 用到 的 都 是 人工智能 还有 自动 驾驶 智慧 工业 There is also autonomous driving smart industry 也 离不开 人工智能 今天 我们 就 来 聊 一聊 人工智能 的 相关 话题 希望 通过 今天 的 讲解 大家 能够 对 人工智能 和 神经网络 有 一个 基本 的 认识 我们 首先 先来 聊 一聊 人工智能 的 发展史 人工智能 其实 并 不是 一个 新 出现 的 事物 在 上古时代 不管 是 东方 还是 西方 其实 都 有 人造 人 的 神话 In fact, there are myths of artificial people 而 到 了 上 世纪 的 30 到 50 年代 随着 计算机科学 这个 神经科学 还有 数学 的 发展 人工智能 才 第一次 进入 到 了 科学家 的 视野 在 1950 年 的 时候 英国 的 著名 的 这个 计算机 科学家 叫 图灵 他 提出 了 一个 问题 他 说 机器 能够 像 人类 一样 思考 吗 并且 为了 这个 问题 图灵 还 提出 了 一种 测试方法 也 就是 我们 今天 所说 的 图灵 测试 图灵 测试 是 说 我们 可以 让 一个 人 通过 文字 的 方法 和 两个 东西 进行 交流 这有 一个 里边 是 个人 另外 它 是 一个 电脑 是 个 机器 是 吧 他 通过 文字 的 方法 进行 交流 然后 能 不能 通过 一系列 的 提问 和 回答 让 左边 的 这个 人 判断 哪 一个 才 是 真人 哪 一个 才 是 机器 呢 如果 经过 判断 这个 人 没有 办法 区分 真人 和 机器 的话 就 说明 这个 机器 通过 了 图灵 测试 图灵 预测 到 2000 年 的 时候 将会 有 一台 机器 它 能够 使 30% 以上 的 人 相信 它 是 一个 人 这 就 通过 了 图灵 测试 图灵 测试 每 一年 都 会 举行 那 在 2014 年 的 时候 终于 有 一台 机器 它 骗过 了 33% 的 人 让 别人 相信 它 是 一个 小男孩 是 一个 13 岁 的 男孩 算是 通过 了 图灵 测试 那么 计算机领域 的 最高 奖项 叫 图灵奖 就是 以 图灵 命名 的 它 被 称为 计算机领域 里面 的 诺贝尔奖 那么 还有 一个 重要 的 年代 就是 1956 年 在 1956 年 的 时候 有 这个 两位 计算机 科学家 一个 叫做 马文 · 明斯基 还有 一个 叫做 约翰 · 麦卡锡 那么 这 两个 人 又 拽 上 了 这个 信息论 的 奠基者 著名 大佬 香农 他们 几个 召集 了 一个 会议 这个 会议 就是 著名 的 达特茅斯 会议 达特茅斯 会议 上 主要 的 议题 就是 机器 是否 能够 像 人类 一样 思考 是 吧 并且 在 这次 会议 上 人们 发明 了 一个 词 这个 词 就是 人工智能 也 就是 我们 经常 听说 到 的 AI 是 吧 从 那 一次 会议 开始 这个 人工智能 就 进入 了 第一次 大 发展 时代 而 这个 明斯基 和 麦卡锡 就 因为 他们 在 人工智能 领域 的 贡献 而 获得 了 图灵奖 是 吧 香农 是 不 需要 图灵奖 了 因为 香农 的 名字 被 用来 命名 通信 领域 的 诺贝尔奖 那 就是 香农 奖 是 吧 好 那么 人工智能 在历史上 其实 也 经历 了 几次 涨落 有三涨 两落 In fact, it has experienced several fluctuations, three fluctuations and two fluctuations. 那 现在 我们 是 处于 第三次 大 发展 的 时代 这个 事件 的 起源 是 在 1997 年 的 时候 1997 年 那 段时间 这个 人工智能 陷入 了 低谷 不过 那 一段时间 出 了 一个 事 就是 IBM 公司 造 了 一个 机器人 这个 机器人 名字 叫做 深蓝 它 干 了 什么 事 想必 很多 人 还 记得 吧 就是 它 下象棋 It's playing chess 结果 战胜 了 12 年 的 国际象棋 冠军 卡斯帕罗夫 因为 深蓝 战胜 了 卡斯帕罗夫 所以 人工智能 再次 复苏 了 当然 这 一次 的 人工智能 复苏 和 发展 是 得益于 最近 几十年 计算机科学 以及 各种 算法 的 改进 尤其 是 在 人工智能 算法 领域 涌现出 很多 的 灵魂 人物 Many souls have emerged 比如说 像 加拿大多伦多大学 的 这个 辛顿 是 吧 他 的 著名 的 贡献 就是 将 反向 传播 算法 BP His famous contribution is the back propagation algorithm BP 引入 到 人工智能 当中 这个 我们 后面 会 介绍 还有 叫 纽约大学 的 杨立 坤 他 的 这个 著名 的 贡献 就是 卷积 神经网络 这个 我们 也 会 介绍 还有 比如说 像 加拿大 的 这个 蒙特利尔 大学 的 这个 本 吉奥 他们 三个 也 因为 在 人工智能 领域 的 贡献 获得 了 2018 年 的 图灵奖 经过 几十年 的 发展 这个 人工智能 已经 有 了 长足 的 进步 在 特定 领域 比如说 像 图像识别 领域 人工智能 甚至 已经 超过 了 人类 而 在 机器翻译 和 语音 识别 方面 人工智能 也 已经 有 了 长足 的 应用 比如 现在 我们 上网 看到 一个 网页 英文 的 我们 看不懂 看到 一个 网页 英文 的 我们 看不懂 我们 可以 右键 选择 翻译成 中文 它 就 能 直接 把 网页 给 我们 翻译 过来 我们 出国 旅游 遇到 外国人 我们 不会 说话 怎么办 我们 用 一个 手机软件 就 可以 了 比如说 我 遇到 一个 英国人 我 想 问问 他 我 说 这个 英国 的 伦敦 火车站 怎么 走 你 看 我 跟 你 说 请问 伦敦 火车站 怎么 走 How can I get to the London railway station 它 就 翻译 过来 了 比如 我 去 韩国 旅游 是 吧 我 去 韩国 旅游 请问 最近 的 厕所 在 哪里 가장 가까운 화장실이 어디예요 ? 你 看 它 就 可以 翻译 过来 是 吧 当然 了 外国人 说话 我们 也 可以 通过 这个 软件 翻译 回来 这 其实 都 是 人工智能 的 一个 应用 那么 计算机 是 如何 做到 这 一点 呢 这 其实 本质 上 是 一个 数学 问题 咱们 来 一步 一步 给 大家 做 一个 解释 首先 我们 需要 大家 了解 一个 概念 叫做 梯度 下降 算法 梯度 下降 是 人工智能 最 核心 的 一个 算法 是 吧 这个 梯度 下降 算法 可以 帮助 我们 去 处理 分类 问题 还有 回归 问题 我们 以 回归 问题 为例 吧 比如说 我们 想 让 人工智能 帮 我们 干 一件 事 就是 预测 房价 咱们 说 这个 预测 房价 就是 你 给 我 一个 房子 然后 机器 判断 出来 这 房子 大概 值 多少钱 是 吧 那 怎么 做 呢 你 首先 得 给 我 一些 数据 你 告诉 我 说 房价 取决于 什么 呢 我们 知道 房价 取决于 它 是 城市 的 还是 乡村 的 它 面积 大小 楼层 它 的 小区 环境 等等 一系列 因素 对 吧 我们 先 简化 一下 比如说 这个 房价 我们 认为 它 就 取决于 一个 因素 就是 面积 我们 就 简单 一点 面积 我们 叫 它 x 那么 纵坐标 这个 是 房屋 的 价格 价格 叫做 y 你 给 了 我 一大堆 的 数据 每 一个 房屋 的 价格 对应 着 它 的 这个 面积 给 了 我 这么 一个 数据 比如说 有 m 个 数据 我们 把 这 m 个 数据 我 放在 这张 图上 大概 是 这样 比如说 这个 房子 在 这 这个 房子 价格 是 这样 这个 房子 是 这样 这 房子 是 这样 是 吧 大概 来讲 是 面积 越大 的 房子 价格 越高 当然 它会 有 一定 的 起伏 现在 我 就 问 我 说 你 能 不能 告诉 我 一个 函数 这个 价格 和 面积 之间 到底 是 什么 关系 呢 当然 最 简单 的 函数 就是 直线 所以 我们 就 可以 说 我们 假设 这个 关系 就是 y=wx+b 我 引入 了 两个 参数 大家 看 这 一个 参数 是 w 相当于 是 斜率 还有 一个 参数 是 b 是 截距 于是 我们 就 用 一条 直线 来 描述 y 和 x 的 关系 当然 大家 会 发现 这个 直线 不 可能 会过 所有 的 点 甚至于 可能 每 一个点 它 都 不过 是 吧 它 和 实际 的 情况 是 有 差别 的 比如说 第一个 房子 它 的 价格 在 这 但是 我 预测 你 价格 在 这 你 就 出现 了 一个 差别 叫 Δy₁ 这 就是 你 预测 的 误差 对 吧 第二个 房子 你 也 出现 了 一个 误差 Δy₂ 只不过 这个 误差 是 负 的 是 吧 第三个 房子 又 有 一个 误差 叫 Δy₃ 第四个 房子 又 有 一个 误差 Δy₄ 第五个 房子 又 有 一个 误差 Δy₅ 你 可能 有 很多 个 房子 都 出现 了 误差 此时 我 要说 你 这个 预测 是 精准 的 什么 意思 呢 就是 要 让 所有 的 误差 综合 来讲 是 最小 的 这个 我们 管它 叫 损失 函数 We call it the loss function 它 的 损失 函数 叫 J J 等于 什么 呢 等于 1/(2m)... m 就是 有 多少 个 数据 1/(2m) 然后 加 和 每 一个 误差 的 平方 说 误差 为什么 要 平方 加 和 呢 因为 你 如果 直接 加 和 的话 正负 会 抵消 我 为了 不让 它 抵消 我 把 它 给 平方 加 和 我 是 希望 这个 损失 函数 它 最小 对 不 对 我 也 可以 换 一个 写法 说 这个 损失 函数 J 等于 什么 呢 等于 (1/(2m))Σ(yᵢ-(wxᵢ+b))² 我 引入 的 参数 是 w 和 b 我 希望 使得 这个 误差 函数 最小 误差 函数 最小 就 说明 这 条 直线 最 符合 房价 的 价格 和 面积 关系 它 不 可能 完全符合 因为 每 一个 房价 它 可能 也 不能 满足 同一个 函数 但 它 最 符合 我 就 希望 能够 找到 这样 的 w 和 这样 的 b 但 问题 是 你 怎么 找到 这个 合适 的 参数 w 和 b 使得 损失 函数 最小 呢 上 过 大学 的 同学 都 知道 这 叫做 最小 二 乘法 This is called the least squares method 这个 方法 其实 在 高斯 和 勒 让 德 的 时代 人们 就 已经 弄清楚 了 只不过 有 两个 参数 你好 算 如果 你 参数 非常 多 用 高斯 和 勒 让 德 的 方法 就 会 非常 的 复杂 于是 人们 就 想 我们 能 不能 有 一个 更好 的 方法 来 优化 这个 参数 呢 那么 这种 方法 就 称之为 梯度 下降 算法 什么 意思 啊 我们 举个 例子 比如 我 想 优化 这个 参数 w 我 想 看看 w 取 什么 值 能够 让 这个 损失 函数 最小 我 最 容易 能够 预测 这个 房价 是 吧 怎么 做 呢 我们 首先 把 这个 参数 w 作为 横坐标 然后 我们 再 把 这个 损失 函数 就是 你 的 预测 和 实际 的 差别 作为 纵坐标 你 把 它 画出 一个 图像 来 你 会 发现 这个 图像 有 可能 是 这个 样子 的 我们 希望 找到 一个 w 让 这个 损失 函数 最小 那 是 在 哪 那 是不是 在 这 我 就 希望 找到 这个 点 这个 就是 最好 的 w 但是 你 最 开始 给 它 一个 w 的 时候 你 可能 给 的 是 这个 数 w₁ 所以 这个 值 它 并不等于 我们 最优 的 参数 于是 怎么办 我们 就 需要 用 梯度 下降 算法 了 这个 梯度 下降 算法 的 过程 是 这样 的 首先 我们 求 一个 函数 叫做 ∂J/∂w 偏 导数 是 大学 的 一个 概念 大概 的 意思 就是说 你 这个 损失 函数 是 如何 随着 w 而 变化 的 它 表示 的 是 这个 函数 的 倾斜 程度 如果 这个 点 它 离 最低点 越远 的话 它 的 斜率 就 越 大 倾斜 得 越 厉害 这个 数就会 越大 对 不 对 你 先 把 这个 数求 出来 求 完 了 之后 我们 说 你 进行 迭代 怎么 迭代 呢 就是 新 的 w 就 wₙ₊₁