×

LingQ'yu daha iyi hale getirmek için çerezleri kullanıyoruz. Siteyi ziyaret ederek, bunu kabul edersiniz: çerez politikası.

image

李永乐老师 Youtube, 机器能像人一样思考吗?人工智能(一)机器学习和神经网络 (1)

机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1)

各位 同学 大家 好 我 是 李永乐 老师 前 一段时间 我 为 大家 介绍 了 创造 未来 的 新 技术 5G 有个 小朋友 就 跟 我 说 他 对 人工智能 的 话题 特别 感兴趣 小 的 时候 就 特别 喜欢 看 科幻片 比如说 像 《 终结者 》 《 机械公敌 》 这样 的 电影 但 他 始终 不 明白 为什么 机器 能够 像 人 一样 思考 呢 其实 人工智能 早就 不是 科学幻想 了 而是 已经 应用 到 生活 的 方方面面 了 比如说 为了 应对 新冠 肺炎 很多 公司 都 加装 了 人脸识别 系统 它 能够 区分 你 是不是 这个 公司 的 员工 用 的 就是 人工智能 在 进行 新冠 肺炎 筛查 的 时候 肺部 影像 CT 是 一个 很 重要 的 指标 人工智能 就 可以 帮助 医生 快速 判断 这个 人 的 肺部 是不是 感染 了 同时 人工智能 也 可以 判断 肿瘤 的 类型 当 我们 在 路上 开车 被 电子眼 抓拍 的 时候 人工智能 可以 帮助 我们 识别 车牌 除了 图像识别 之外 人工智能 还 可以 用 在 语音 识别 上 比如说 各种 语音 助手 智能 音箱 都 用到 了 人工智能 的 原理 再 比如 我们 手机 中 的 美颜 软件 短 视频 平台 的 推荐 系统 邮件系统 中 的 反垃圾 系统 其实 用到 的 都 是 人工智能 还有 自动 驾驶 智慧 工业 也 离不开 人工智能 今天 我们 就 来 聊 一聊 人工智能 的 相关 话题 希望 通过 今天 的 讲解 大家 能够 对 人工智能 和 神经网络 有 一个 基本 的 认识 我们 首先 先来 聊 一聊 人工智能 的 发展史 人工智能 其实 并 不是 一个 新 出现 的 事物 在 上古时代 不管 是 东方 还是 西方 其实 都 有 人造 人 的 神话 而 到 了 上 世纪 的 30 到 50 年代 随着 计算机科学 这个 神经科学 还有 数学 的 发展 人工智能 才 第一次 进入 到 了 科学家 的 视野 在 1950 年 的 时候 英国 的 著名 的 这个 计算机 科学家 叫 图灵 他 提出 了 一个 问题 他 说 机器 能够 像 人类 一样 思考 吗 并且 为了 这个 问题 图灵 还 提出 了 一种 测试方法 也 就是 我们 今天 所说 的 图灵 测试 图灵 测试 是 说 我们 可以 让 一个 人 通过 文字 的 方法 和 两个 东西 进行 交流 这有 一个 里边 是 个人 另外 它 是 一个 电脑 是 个 机器 是 吧 他 通过 文字 的 方法 进行 交流 然后 能 不能 通过 一系列 的 提问 和 回答 让 左边 的 这个 人 判断 哪 一个 才 是 真人 哪 一个 才 是 机器 呢 如果 经过 判断 这个 人 没有 办法 区分 真人 和 机器 的话 就 说明 这个 机器 通过 了 图灵 测试 图灵 预测 到 2000 年 的 时候 将会 有 一台 机器 它 能够 使 30% 以上 的 人 相信 它 是 一个 人 这 就 通过 了 图灵 测试 图灵 测试 每 一年 都 会 举行 那 在 2014 年 的 时候 终于 有 一台 机器 它 骗过 了 33% 的 人 让 别人 相信 它 是 一个 小男孩 是 一个 13 岁 的 男孩 算是 通过 了 图灵 测试 那么 计算机领域 的 最高 奖项 叫 图灵奖 就是 以 图灵 命名 的 它 被 称为 计算机领域 里面 的 诺贝尔奖 那么 还有 一个 重要 的 年代 就是 1956 年 在 1956 年 的 时候 有 这个 两位 计算机 科学家 一个 叫做 马文 · 明斯基 还有 一个 叫做 约翰 · 麦卡锡 那么 这 两个 人 又 拽 上 了 这个 信息论 的 奠基者 著名 大佬 香农 他们 几个 召集 了 一个 会议 这个 会议 就是 著名 的 达特茅斯 会议 达特茅斯 会议 上 主要 的 议题 就是 机器 是否 能够 像 人类 一样 思考 是 吧 并且 在 这次 会议 上 人们 发明 了 一个 词 这个 词 就是 人工智能 也 就是 我们 经常 听说 到 的 AI 是 吧 从 那 一次 会议 开始 这个 人工智能 就 进入 了 第一次 大 发展 时代 而 这个 明斯基 和 麦卡锡 就 因为 他们 在 人工智能 领域 的 贡献 而 获得 了 图灵奖 是 吧 香农 是 不 需要 图灵奖 了 因为 香农 的 名字 被 用来 命名 通信 领域 的 诺贝尔奖 那 就是 香农 奖 是 吧 好 那么 人工智能 在历史上 其实 也 经历 了 几次 涨落 有三涨 两落 那 现在 我们 是 处于 第三次 大 发展 的 时代 这个 事件 的 起源 是 在 1997 年 的 时候 1997 年 那 段时间 这个 人工智能 陷入 了 低谷 不过 那 一段时间 出 了 一个 事 就是 IBM 公司 造 了 一个 机器人 这个 机器人 名字 叫做 深蓝 它 干 了 什么 事 想必 很多 人 还 记得 吧 就是 它 下象棋 结果 战胜 了 12 年 的 国际象棋 冠军 卡斯帕罗夫 因为 深蓝 战胜 了 卡斯帕罗夫 所以 人工智能 再次 复苏 了 当然 这 一次 的 人工智能 复苏 和 发展 是 得益于 最近 几十年 计算机科学 以及 各种 算法 的 改进 尤其 是 在 人工智能 算法 领域 涌现出 很多 的 灵魂 人物 比如说 像 加拿大多伦多大学 的 这个 辛顿 是 吧 他 的 著名 的 贡献 就是 将 反向 传播 算法 BP 引入 到 人工智能 当中 这个 我们 后面 会 介绍 还有 叫 纽约大学 的 杨立 坤 他 的 这个 著名 的 贡献 就是 卷积 神经网络 这个 我们 也 会 介绍 还有 比如说 像 加拿大 的 这个 蒙特利尔 大学 的 这个 本 吉奥 他们 三个 也 因为 在 人工智能 领域 的 贡献 获得 了 2018 年 的 图灵奖 经过 几十年 的 发展 这个 人工智能 已经 有 了 长足 的 进步 在 特定 领域 比如说 像 图像识别 领域 人工智能 甚至 已经 超过 了 人类 而 在 机器翻译 和 语音 识别 方面 人工智能 也 已经 有 了 长足 的 应用 比如 现在 我们 上网 看到 一个 网页 英文 的 我们 看不懂 看到 一个 网页 英文 的 我们 看不懂 我们 可以 右键 选择 翻译成 中文 它 就 能 直接 把 网页 给 我们 翻译 过来 我们 出国 旅游 遇到 外国人 我们 不会 说话 怎么办 我们 用 一个 手机软件 就 可以 了 比如说 我 遇到 一个 英国人 我 想 问问 他 我 说 这个 英国 的 伦敦 火车站 怎么 走 你 看 我 跟 你 说 请问 伦敦 火车站 怎么 走 How can I get to the London railway station 它 就 翻译 过来 了 比如 我 去 韩国 旅游 是 吧 我 去 韩国 旅游 请问 最近 的 厕所 在 哪里 가장 가까운 화장실이 어디예요 ? 你 看 它 就 可以 翻译 过来 是 吧 当然 了 外国人 说话 我们 也 可以 通过 这个 软件 翻译 回来 这 其实 都 是 人工智能 的 一个 应用 那么 计算机 是 如何 做到 这 一点 呢 这 其实 本质 上 是 一个 数学 问题 咱们 来 一步 一步 给 大家 做 一个 解释 首先 我们 需要 大家 了解 一个 概念 叫做 梯度 下降 算法 梯度 下降 是 人工智能 最 核心 的 一个 算法 是 吧 这个 梯度 下降 算法 可以 帮助 我们 去 处理 分类 问题 还有 回归 问题 我们 以 回归 问题 为例 吧 比如说 我们 想 让 人工智能 帮 我们 干 一件 事 就是 预测 房价 咱们 说 这个 预测 房价 就是 你 给 我 一个 房子 然后 机器 判断 出来 这 房子 大概 值 多少钱 是 吧 那 怎么 做 呢 你 首先 得 给 我 一些 数据 你 告诉 我 说 房价 取决于 什么 呢 我们 知道 房价 取决于 它 是 城市 的 还是 乡村 的 它 面积 大小 楼层 它 的 小区 环境 等等 一系列 因素 对 吧 我们 先 简化 一下 比如说 这个 房价 我们 认为 它 就 取决于 一个 因素 就是 面积 我们 就 简单 一点 面积 我们 叫 它 x 那么 纵坐标 这个 是 房屋 的 价格 价格 叫做 y 你 给 了 我 一大堆 的 数据 每 一个 房屋 的 价格 对应 着 它 的 这个 面积 给 了 我 这么 一个 数据 比如说 有 m 个 数据 我们 把 这 m 个 数据 我 放在 这张 图上 大概 是 这样 比如说 这个 房子 在 这 这个 房子 价格 是 这样 这个 房子 是 这样 这 房子 是 这样 是 吧 大概 来讲 是 面积 越大 的 房子 价格 越高 当然 它会 有 一定 的 起伏 现在 我 就 问 我 说 你 能 不能 告诉 我 一个 函数 这个 价格 和 面积 之间 到底 是 什么 关系 呢 当然 最 简单 的 函数 就是 直线 所以 我们 就 可以 说 我们 假设 这个 关系 就是 y=wx+b 我 引入 了 两个 参数 大家 看 这 一个 参数 是 w 相当于 是 斜率 还有 一个 参数 是 b 是 截距 于是 我们 就 用 一条 直线 来 描述 y 和 x 的 关系 当然 大家 会 发现 这个 直线 不 可能 会过 所有 的 点 甚至于 可能 每 一个点 它 都 不过 是 吧 它 和 实际 的 情况 是 有 差别 的 比如说 第一个 房子 它 的 价格 在 这 但是 我 预测 你 价格 在 这 你 就 出现 了 一个 差别 叫 Δy₁ 这 就是 你 预测 的 误差 对 吧 第二个 房子 你 也 出现 了 一个 误差 Δy₂ 只不过 这个 误差 是 负 的 是 吧 第三个 房子 又 有 一个 误差 叫 Δy₃ 第四个 房子 又 有 一个 误差 Δy₄ 第五个 房子 又 有 一个 误差 Δy₅ 你 可能 有 很多 个 房子 都 出现 了 误差 此时 我 要说 你 这个 预测 是 精准 的 什么 意思 呢 就是 要 让 所有 的 误差 综合 来讲 是 最小 的 这个 我们 管它 叫 损失 函数 它 的 损失 函数 叫 J J 等于 什么 呢 等于 1/(2m)... m 就是 有 多少 个 数据 1/(2m) 然后 加 和 每 一个 误差 的 平方 说 误差 为什么 要 平方 加 和 呢 因为 你 如果 直接 加 和 的话 正负 会 抵消 我 为了 不让 它 抵消 我 把 它 给 平方 加 和 我 是 希望 这个 损失 函数 它 最小 对 不 对 我 也 可以 换 一个 写法 说 这个 损失 函数 J 等于 什么 呢 等于 (1/(2m))Σ(yᵢ-(wxᵢ+b))² 我 引入 的 参数 是 w 和 b 我 希望 使得 这个 误差 函数 最小 误差 函数 最小 就 说明 这 条 直线 最 符合 房价 的 价格 和 面积 关系 它 不 可能 完全符合 因为 每 一个 房价 它 可能 也 不能 满足 同一个 函数 但 它 最 符合 我 就 希望 能够 找到 这样 的 w 和 这样 的 b 但 问题 是 你 怎么 找到 这个 合适 的 参数 w 和 b 使得 损失 函数 最小 呢 上 过 大学 的 同学 都 知道 这 叫做 最小 二 乘法 这个 方法 其实 在 高斯 和 勒 让 德 的 时代 人们 就 已经 弄清楚 了 只不过 有 两个 参数 你好 算 如果 你 参数 非常 多 用 高斯 和 勒 让 德 的 方法 就 会 非常 的 复杂 于是 人们 就 想 我们 能 不能 有 一个 更好 的 方法 来 优化 这个 参数 呢 那么 这种 方法 就 称之为 梯度 下降 算法 什么 意思 啊 我们 举个 例子 比如 我 想 优化 这个 参数 w 我 想 看看 w 取 什么 值 能够 让 这个 损失 函数 最小 我 最 容易 能够 预测 这个 房价 是 吧 怎么 做 呢 我们 首先 把 这个 参数 w 作为 横坐标 然后 我们 再 把 这个 损失 函数 就是 你 的 预测 和 实际 的 差别 作为 纵坐标 你 把 它 画出 一个 图像 来 你 会 发现 这个 图像 有 可能 是 这个 样子 的 我们 希望 找到 一个 w 让 这个 损失 函数 最小 那 是 在 哪 那 是不是 在 这 我 就 希望 找到 这个 点 这个 就是 最好 的 w 但是 你 最 开始 给 它 一个 w 的 时候 你 可能 给 的 是 这个 数 w₁ 所以 这个 值 它 并不等于 我们 最优 的 参数 于是 怎么办 我们 就 需要 用 梯度 下降 算法 了 这个 梯度 下降 算法 的 过程 是 这样 的 首先 我们 求 一个 函数 叫做 ∂J/∂w 偏 导数 是 大学 的 一个 概念 大概 的 意思 就是说 你 这个 损失 函数 是 如何 随着 w 而 变化 的 它 表示 的 是 这个 函数 的 倾斜 程度 如果 这个 点 它 离 最低点 越远 的话 它 的 斜率 就 越 大 倾斜 得 越 厉害 这个 数就会 越大 对 不 对 你 先 把 这个 数求 出来 求 完 了 之后 我们 说 你 进行 迭代 怎么 迭代 呢 就是 新 的 w 就 wₙ₊₁

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE

机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1) ||||||||||||neural networks Können Maschinen wie Menschen denken?Künstliche Intelligenz (I) Maschinelles Lernen und neuronale Netze (1) Can machines think like humans? Artificial Intelligence (I) Machine Learning and Neural Networks (1) Le macchine possono pensare come gli esseri umani? Intelligenza artificiale (I) Apprendimento automatico e reti neurali (1)

各位 同学 大家 好 我 是 李永乐 老师 前 一段时间 我 为 大家 介绍 了 创造 未来 的 新 技术 5G create||||technology| 有个 小朋友 就 跟 我 说 他 对 人工智能 的 话题 特别 感兴趣 小 的 时候 就 特别 喜欢 看 科幻片 |||||||sci-fi movies 比如说 像 《 终结者 》 ||The Terminator 《 机械公敌 》 这样 的 电影 I Robot|||movies like I Robot Movies like "Machine Enemy" 但 他 始终 不 明白 ||always|| 为什么 机器 能够 像 人 一样 思考 呢 其实 人工智能 早就 不是 科学幻想 了 actually||long ago||science fiction| 而是 已经 应用 到 生活 的 方方面面 了 ||application||||every aspect| 比如说 为了 应对 新冠 肺炎 ||respond to|COVID-19|pneumonia For example, in response to new coronary pneumonia 很多 公司 都 加装 了 人脸识别 系统 |||added||facial recognition| 它 能够 区分 你 是不是 这个 公司 的 员工 |can|distinguish||||||employee 用 的 就是 人工智能 在 进行 新冠 肺炎 筛查 的 时候 |conducting|COVID-19|pneumonia|screening|| 肺部 影像 CT 是 一个 很 重要 的 指标 Lung area|imaging|lung imaging CT||||||indicator 人工智能 就 可以 帮助 医生 快速 判断 这个 人 的 肺部 是不是 感染 了 |||||lungs||infection| 同时 人工智能 也 可以 判断 肿瘤 的 类型 |||||tumor|| 当 我们 在 路上 开车 被 电子眼 抓拍 的 时候 ||||||speed camera|snap shot|| 人工智能 可以 帮助 我们 识别 车牌 ||||recognize|license plate 除了 图像识别 之外 |image recognition| 人工智能 还 可以 用 在 语音 识别 上 |||||voice recognition|recognition| 比如说 各种 语音 助手 智能 音箱 |||assistant|smart|smart speaker For example, various voice assistant smart speakers 都 用到 了 人工智能 的 原理 |||||principle 再 比如 我们 手机 中 的 美颜 软件 ||||||beautifying software| 短 视频 平台 的 推荐 系统 short||platform||recommendation|system 邮件系统 中 的 反垃圾 系统 mail system|||anti-spam| 其实 用到 的 都 是 人工智能 还有 自动 驾驶 智慧 工业 |automatic|driving|smart technology|smart industry There is also autonomous driving smart industry 也 离不开 人工智能 今天 我们 就 来 聊 一聊 人工智能 的 相关 话题 希望 通过 今天 的 讲解 ||||explanation 大家 能够 对 人工智能 和 神经网络 |||||neural networks 有 一个 基本 的 认识 我们 首先 先来 聊 一聊 人工智能 的 发展史 |||||||history of development 人工智能 其实 并 不是 一个 新 出现 的 事物 在 上古时代 不管 是 东方 还是 西方 |ancient times||||| 其实 都 有 人造 人 的 神话 |||artificial|||myth In fact, there are myths of artificial people 而 到 了 上 世纪 的 30 到 50 年代 随着 计算机科学 这个 神经科学 With the|computer science||neuroscience 还有 数学 的 发展 人工智能 才 第一次 进入 到 了 科学家 的 视野 ||||||||scientists' perspective 在 1950 年 的 时候 at in||| 英国 的 著名 的 这个 计算机 科学家 叫 图灵 ||||||||Turing 他 提出 了 一个 问题 他 说 机器 能够 像 人类 一样 思考 吗 ||machine|can||||| 并且 为了 这个 问题 图灵 还 提出 了 一种 测试方法 Turing||||| 也 就是 我们 今天 所说 的 图灵 测试 ||||||Turing|Turing test 图灵 测试 是 说 我们 可以 让 一个 人 通过 文字 的 方法 和 两个 东西 进行 交流 这有 一个 里边 是 个人 另外 它 是 一个 电脑 是 个 机器 是 吧 他 通过 文字 的 方法 进行 交流 然后 能 不能 通过 一系列 的 提问 和 回答 ||||a series|||| 让 左边 的 这个 人 判断 哪 一个 才 是 真人 ||||||||||real person 哪 一个 才 是 机器 呢 如果 经过 判断 这个 人 没有 办法 区分 真人 和 机器 的话 就 说明 这个 机器 通过 了 图灵 测试 |indicates||the machine|||Turing|Turing test 图灵 预测 到 2000 年 的 时候 |predicted|||| 将会 有 一台 机器 它 能够 使 30% 以上 的 人 相信 它 是 一个 人 这 就 通过 了 图灵 测试 图灵 测试 每 一年 都 会 举行 |test||||| 那 在 2014 年 的 时候 终于 有 一台 机器 它 骗过 了 33% 的 人 让 别人 相信 它 是 一个 小男孩 是 一个 13 岁 的 男孩 算是 通过 了 图灵 测试 |||Turing|Turing test 那么 计算机领域 的 最高 奖项 叫 图灵奖 |computer science|||Turing Award||Turing Award 就是 以 图灵 命名 的 |||named after Turing| 它 被 称为 计算机领域 里面 的 诺贝尔奖 |||Nobel Prize in Computing|||Nobel Prize 那么 还有 一个 重要 的 年代 就是 1956 年 在 1956 年 的 时候 有 这个 两位 计算机 科学家 一个 叫做 马文 · 明斯基 ||Mawen|Minsky 还有 一个 叫做 约翰 · 麦卡锡 |||John McCarthy|John McCarthy 那么 这 两个 人 又 拽 上 了 这个 信息论 的 奠基者 |||||argued||||Information Theory||founder 著名 大佬 香农 famous|big shot|Shannon 他们 几个 召集 了 一个 会议 ||called a meeting||| 这个 会议 就是 著名 的 达特茅斯 会议 |||||Dartmouth Conference| 达特茅斯 会议 上 主要 的 议题 |||||main topic 就是 机器 是否 能够 像 人类 一样 思考 是 吧 并且 在 这次 会议 上 人们 发明 了 一个 词 ||||||invented||| 这个 词 就是 人工智能 也 就是 我们 经常 听说 到 的 AI 是 吧 从 那 一次 会议 开始 这个 人工智能 就 进入 了 第一次 大 发展 时代 |||entered||||| 而 这个 明斯基 和 麦卡锡 ||Minsky||McCarthy 就 因为 他们 在 人工智能 领域 的 贡献 |||||||contribution 而 获得 了 图灵奖 是 吧 |won|||| 香农 是 不 需要 图灵奖 了 Shannon||||| 因为 香农 的 名字 被 用来 命名 |Shannon|||||naming 通信 领域 的 诺贝尔奖 communication||| 那 就是 香农 奖 是 吧 好 那么 人工智能 在历史上 其实 也 经历 了 几次 涨落 有三涨 两落 ||experienced|||fluctuations|three rises|two declines In fact, it has experienced several fluctuations, three fluctuations and two fluctuations. 那 现在 我们 是 处于 第三次 大 发展 的 时代 ||||in the midst of||||| 这个 事件 的 起源 是 在 1997 年 的 时候 |event||origin||||| 1997 年 那 段时间 这个 人工智能 陷入 了 低谷 ||fell into||low point 不过 那 一段时间 出 了 一个 事 就是 IBM 公司 造 了 一个 机器人 |||made||| 这个 机器人 名字 叫做 深蓝 ||||Deep Blue 它 干 了 什么 事 想必 很多 人 还 记得 吧 |||||probably||||| 就是 它 下象棋 ||play chess It's playing chess 结果 战胜 了 12 年 的 国际象棋 冠军 卡斯帕罗夫 |defeated||||chess|champion|Kasparov 因为 深蓝 战胜 了 卡斯帕罗夫 |Deep Blue|defeated||Kasparov 所以 人工智能 再次 复苏 了 |||revived again| 当然 这 一次 的 人工智能 复苏 和 发展 是 得益于 最近 几十年 计算机科学 |thanks to||| 以及 各种 算法 的 改进 ||||improvement 尤其 是 在 人工智能 算法 领域 especially in||||algorithm| 涌现出 很多 的 灵魂 人物 emerged|||soul characters| Many souls have emerged 比如说 像 加拿大多伦多大学 的 这个 辛顿 是 吧 ||University of Toronto|||Hinton|| 他 的 著名 的 贡献 就是 将 反向 传播 算法 BP ||famous||contribution||to apply|backpropagation|backpropagation|algorithm|backpropagation algorithm His famous contribution is the back propagation algorithm BP 引入 到 人工智能 当中 introduce into||| 这个 我们 后面 会 介绍 还有 叫 纽约大学 的 杨立 坤 ||||Yang Li|Kun 他 的 这个 著名 的 贡献 就是 卷积 神经网络 |||||contribution||convolution|convolutional neural network 这个 我们 也 会 介绍 还有 比如说 像 加拿大 的 这个 蒙特利尔 大学 的 这个 本 吉奥 ||||Montreal|||this||Gio 他们 三个 也 因为 在 人工智能 领域 的 贡献 ||||||||contribution 获得 了 2018 年 的 图灵奖 经过 几十年 的 发展 这个 人工智能 已经 有 了 长足 的 进步 |||||great progress|| 在 特定 领域 比如说 像 图像识别 领域 |specific||||| 人工智能 甚至 已经 超过 了 人类 |even|||| 而 在 机器翻译 和 语音 识别 方面 ||machine translation|||| 人工智能 也 已经 有 了 长足 的 应用 比如 现在 我们 上网 看到 一个 网页 英文 的 我们 看不懂 ||webpage|||| 看到 一个 网页 英文 的 我们 看不懂 我们 可以 右键 选择 翻译成 中文 ||right-click||| 它 就 能 直接 把 网页 给 我们 翻译 过来 我们 出国 旅游 ||travel 遇到 外国人 我们 不会 说话 怎么办 我们 用 一个 手机软件 就 可以 了 |||mobile app||| 比如说 我 遇到 一个 英国人 我 想 问问 他 我 说 这个 英国 的 伦敦 火车站 怎么 走 |||||London||| 你 看 我 跟 你 说 请问 伦敦 火车站 怎么 走 |London||| How can I get to the London railway station ||||||London railway station|railway station|London railway station 它 就 翻译 过来 了 比如 我 去 韩国 旅游 是 吧 我 去 韩国 旅游 请问 最近 的 厕所 在 哪里 가장 가까운 화장실이 어디예요 ? the closest|nearest|the nearest restroom|Where is it 你 看 它 就 可以 翻译 过来 是 吧 当然 了 外国人 说话 我们 也 可以 通过 这个 软件 翻译 回来 |||||||back 这 其实 都 是 人工智能 的 一个 应用 ||all||||| 那么 计算机 是 如何 做到 这 一点 呢 |computer|||||| 这 其实 本质 上 是 一个 数学 问题 ||essence||||| 咱们 来 一步 一步 给 大家 做 一个 解释 首先 我们 需要 大家 了解 一个 概念 叫做 梯度 下降 算法 |gradient|descent|Gradient Descent Algorithm 梯度 下降 是 人工智能 最 核心 的 一个 算法 是 吧 gradient|gradient descent|||||||algorithm|| 这个 梯度 下降 算法 |||algorithm 可以 帮助 我们 去 处理 分类 问题 还有 回归 问题 ||||||||regression| 我们 以 回归 问题 为例 吧 ||returning to||as an example| 比如说 我们 想 让 人工智能 帮 我们 干 一件 事 就是 预测 房价 |predicting|housing prices 咱们 说 这个 预测 房价 |||prediction| 就是 你 给 我 一个 房子 然后 机器 判断 出来 这 房子 大概 值 多少钱 是 吧 |||||||worth||| 那 怎么 做 呢 你 首先 得 给 我 一些 数据 你 告诉 我 说 房价 取决于 什么 呢 |||||depends on|| 我们 知道 房价 取决于 它 是 城市 的 还是 乡村 的 它 面积 大小 楼层 它 的 小区 环境 等等 一系列 因素 对 吧 ||||||factors|| 我们 先 简化 一下 比如说 这个 房价 我们 认为 它 就 取决于 一个 因素 就是 面积 ||||factor|| 我们 就 简单 一点 面积 我们 叫 它 x area|||| 那么 纵坐标 这个 是 房屋 的 价格 |vertical axis||||| 价格 叫做 y 你 给 了 我 一大堆 的 数据 ||||a lot of||data 每 一个 房屋 的 价格 对应 着 它 的 这个 面积 ||house|||||||| 给 了 我 这么 一个 数据 比如说 有 m 个 数据 ||||data 我们 把 这 m 个 数据 我 放在 这张 图上 大概 是 这样 比如说 这个 房子 在 这 这个 房子 价格 是 这样 ||price|| 这个 房子 是 这样 这 房子 是 这样 是 吧 |the house|||| 大概 来讲 是 面积 越大 的 房子 价格 越高 |||area||||| 当然 它会 有 一定 的 起伏 |||||ups and downs 现在 我 就 问 我 说 你 能 不能 告诉 我 一个 函数 ||||||||||||function 这个 价格 和 面积 之间 到底 是 什么 关系 呢 当然 最 简单 的 函数 就是 直线 ||||||line 所以 我们 就 可以 说 我们 假设 这个 关系 ||||||assume|| 就是 y=wx+b ||weight vector| 我 引入 了 两个 参数 |introduced|||parameters 大家 看 这 一个 参数 是 w 相当于 是 斜率 ||slope 还有 一个 参数 是 b 是 截距 ||||||intercept 于是 我们 就 用 一条 直线 来 描述 y 和 x 的 关系 |||||straight line||||||| 当然 大家 会 发现 这个 直线 不 可能 会过 所有 的 点 甚至于 可能 每 一个点 它 都 不过 是 吧 even|||||||| 它 和 实际 的 情况 是 有 差别 的 比如说 第一个 房子 它 的 价格 在 这 但是 我 预测 你 价格 在 这 ||predict|||| 你 就 出现 了 一个 差别 叫 Δy₁ 这 就是 你 预测 的 误差 对 吧 |||||error|| 第二个 房子 你 也 出现 了 一个 误差 Δy₂ 只不过 这个 误差 是 负 的 是 吧 just that||error||||| 第三个 房子 又 有 一个 误差 叫 Δy₃ 第四个 房子 又 有 一个 误差 Δy₄ ||||||error Δy 第五个 房子 又 有 一个 误差 Δy₅ |||||error| 你 可能 有 很多 个 房子 都 出现 了 误差 此时 我 要说 你 这个 预测 是 精准 的 At this moment|||||||accurate| 什么 意思 呢 就是 要 让 所有 的 误差 综合 来讲 是 最小 的 ||||||overall|||| 这个 我们 管它 叫 损失 函数 ||call it||loss function| We call it the loss function 它 的 损失 函数 叫 J ||loss function||| J 等于 什么 呢 等于 1/(2m)... m 就是 有 多少 个 数据 |||how many|| 1/(2m) 然后 加 和 每 一个 误差 的 平方 ||||||error||squared 说 误差 为什么 要 平方 加 和 呢 |error|||||| 因为 你 如果 直接 加 和 的话 正负 会 抵消 |||directly||plus||positive and negative||cancel out 我 为了 不让 它 抵消 我 把 它 给 平方 加 和 ||||cancel out||||||| 我 是 希望 这个 损失 函数 它 最小 对 不 对 我 也 可以 换 一个 写法 说 这个 损失 函数 J 等于 什么 呢 ||loss function||||| 等于 (1/(2m))Σ(yᵢ-(wxᵢ+b))² ||summation symbol|predicted value|predicted value| 我 引入 的 参数 是 w 和 b |introduced|||||| 我 希望 使得 这个 误差 函数 最小 ||to make||error|| 误差 函数 最小 就 说明 error|function||| 这 条 直线 最 符合 房价 的 价格 和 面积 关系 ||line||best fits|||||| 它 不 可能 完全符合 |||completely matches 因为 每 一个 房价 它 可能 也 不能 满足 同一个 函数 ||||||||||function 但 它 最 符合 我 就 希望 能够 找到 这样 的 w 和 这样 的 b 但 问题 是 你 怎么 找到 这个 合适 的 参数 w 和 b |||||||suitable||||| 使得 损失 函数 最小 呢 to make|loss||| 上 过 大学 的 同学 都 知道 这 叫做 最小 二 乘法 ||||multiplication This is called the least squares method 这个 方法 其实 在 高斯 和 勒 让 德 的 时代 ||||Gauss||Le|||| 人们 就 已经 弄清楚 了 |||figured out| 只不过 有 两个 参数 你好 算 only||||| 如果 你 参数 非常 多 用 高斯 和 勒 让 德 的 方法 就 会 非常 的 复杂 |||||||method||||| 于是 人们 就 想 我们 能 不能 有 一个 更好 的 方法 来 优化 这个 参数 呢 |optimize||| 那么 这种 方法 就 称之为 梯度 下降 算法 什么 意思 啊 我们 举个 例子 |give an example| 比如 我 想 优化 这个 参数 w |||optimize||| 我 想 看看 w 取 什么 值 能够 让 这个 损失 函数 最小 ||||||||||loss|function| 我 最 容易 能够 预测 这个 房价 是 吧 ||||predict|||| 怎么 做 呢 我们 首先 把 这个 参数 w 作为 横坐标 |||||||horizontal axis 然后 我们 再 把 这个 损失 函数 ||||this|| 就是 你 的 预测 和 实际 的 差别 作为 纵坐标 |||prediction||actual situation|||| 你 把 它 画出 一个 图像 来 |||||image| 你 会 发现 这个 图像 有 可能 是 这个 样子 的 我们 希望 找到 一个 w 让 这个 损失 函数 最小 |||||||loss|| 那 是 在 哪 那 是不是 在 这 我 就 希望 找到 这个 点 这个 就是 最好 的 w 但是 你 最 开始 给 它 一个 w 的 时候 你 可能 给 的 是 这个 数 w₁ 所以 这个 值 它 并不等于 我们 最优 的 参数 ||||not equal to||||parameter 于是 怎么办 我们 就 需要 用 梯度 下降 算法 了 这个 梯度 下降 算法 的 过程 是 这样 的 |gradient||||||| 首先 我们 求 一个 函数 叫做 ∂J/∂w ||find||||| 偏 导数 是 大学 的 一个 概念 partial|partial derivative||||| 大概 的 意思 就是说 你 这个 损失 函数 是 如何 随着 w 而 变化 的 ||||||with|||| 它 表示 的 是 这个 函数 的 倾斜 程度 |||||||slope| 如果 这个 点 它 离 最低点 越远 的话 |||||lowest point|| 它 的 斜率 就 越 大 ||slope||| 倾斜 得 越 厉害 more tilted||| 这个 数就会 越大 对 不 对 |the number|||| 你 先 把 这个 数求 出来 ||||calculate the number| 求 完 了 之后 我们 说 你 进行 迭代 ||||iteration 怎么 迭代 呢 |iteration| 就是 新 的 w 就 wₙ₊₁