×
LingQ'yu daha iyi hale getirmek için çerezleri kullanıyoruz. Siteyi ziyaret ederek, bunu kabul edersiniz:
çerez politikası .
李永乐老师 Youtube, 机器能像人一样思考吗?人工智能(一)机器学习和神经网络 (1)
机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1)
各位 同学 大家 好
我 是 李永乐 老师
前 一段时间 我 为 大家 介绍 了
创造 未来 的 新 技术 5G
有个 小朋友 就 跟 我 说
他 对 人工智能 的 话题 特别 感兴趣
小 的 时候 就 特别 喜欢 看 科幻片
比如说 像 《 终结者 》
《 机械公敌 》 这样 的 电影
但 他 始终 不 明白
为什么 机器 能够 像 人 一样 思考 呢
其实 人工智能 早就 不是 科学幻想 了
而是 已经 应用 到 生活 的 方方面面 了
比如说 为了 应对 新冠 肺炎
很多 公司 都 加装 了 人脸识别 系统
它 能够 区分 你 是不是 这个 公司 的 员工
用 的 就是 人工智能
在 进行 新冠 肺炎 筛查 的 时候
肺部 影像 CT 是 一个 很 重要 的 指标
人工智能 就 可以 帮助 医生
快速 判断 这个 人 的 肺部 是不是 感染 了
同时 人工智能 也 可以 判断 肿瘤 的 类型
当 我们 在 路上 开车 被 电子眼 抓拍 的 时候
人工智能 可以 帮助 我们 识别 车牌
除了 图像识别 之外
人工智能 还 可以 用 在 语音 识别 上
比如说 各种 语音 助手 智能 音箱
都 用到 了 人工智能 的 原理
再 比如 我们 手机 中 的 美颜 软件
短 视频 平台 的 推荐 系统
邮件系统 中 的 反垃圾 系统
其实 用到 的 都 是 人工智能
还有 自动 驾驶 智慧 工业
也 离不开 人工智能
今天 我们 就 来 聊 一聊 人工智能 的 相关 话题
希望 通过 今天 的 讲解
大家 能够 对 人工智能 和 神经网络
有 一个 基本 的 认识
我们 首先 先来 聊 一聊 人工智能 的 发展史
人工智能 其实 并 不是 一个 新 出现 的 事物
在 上古时代 不管 是 东方 还是 西方
其实 都 有 人造 人 的 神话
而 到 了 上 世纪 的 30 到 50 年代
随着 计算机科学 这个 神经科学
还有 数学 的 发展
人工智能 才 第一次 进入 到 了 科学家 的 视野
在 1950 年 的 时候
英国 的 著名 的 这个 计算机 科学家 叫 图灵
他 提出 了 一个 问题
他 说 机器 能够 像 人类 一样 思考 吗
并且 为了 这个 问题
图灵 还 提出 了 一种 测试方法
也 就是 我们 今天 所说 的 图灵 测试
图灵 测试 是 说 我们 可以 让 一个 人
通过 文字 的 方法 和 两个 东西 进行 交流
这有 一个 里边 是 个人
另外 它 是 一个 电脑 是 个 机器 是 吧
他 通过 文字 的 方法 进行 交流
然后 能 不能 通过 一系列 的 提问 和 回答
让 左边 的 这个 人 判断 哪 一个 才 是 真人
哪 一个 才 是 机器 呢
如果 经过 判断
这个 人 没有 办法 区分 真人 和 机器 的话
就 说明 这个 机器 通过 了 图灵 测试
图灵 预测 到 2000 年 的 时候
将会 有 一台 机器
它 能够 使 30% 以上 的 人 相信 它 是 一个 人
这 就 通过 了 图灵 测试
图灵 测试 每 一年 都 会 举行
那 在 2014 年 的 时候
终于 有 一台 机器 它 骗过 了 33% 的 人
让 别人 相信 它 是 一个 小男孩
是 一个 13 岁 的 男孩
算是 通过 了 图灵 测试
那么 计算机领域 的 最高 奖项 叫 图灵奖
就是 以 图灵 命名 的
它 被 称为 计算机领域 里面 的 诺贝尔奖
那么 还有 一个 重要 的 年代 就是 1956 年
在 1956 年 的 时候
有 这个 两位 计算机 科学家
一个 叫做 马文 · 明斯基
还有 一个 叫做 约翰 · 麦卡锡
那么 这 两个 人 又 拽 上 了 这个 信息论 的 奠基者
著名 大佬 香农
他们 几个 召集 了 一个 会议
这个 会议 就是 著名 的 达特茅斯 会议
达特茅斯 会议 上 主要 的 议题
就是 机器 是否 能够 像 人类 一样 思考 是 吧
并且 在 这次 会议 上 人们 发明 了 一个 词
这个 词 就是 人工智能
也 就是 我们 经常 听说 到 的 AI 是 吧
从 那 一次 会议 开始
这个 人工智能 就 进入 了 第一次 大 发展 时代
而 这个 明斯基 和 麦卡锡
就 因为 他们 在 人工智能 领域 的 贡献
而 获得 了 图灵奖 是 吧
香农 是 不 需要 图灵奖 了
因为 香农 的 名字 被 用来 命名
通信 领域 的 诺贝尔奖
那 就是 香农 奖 是 吧
好 那么 人工智能 在历史上
其实 也 经历 了 几次 涨落 有三涨 两落
那 现在 我们 是 处于 第三次 大 发展 的 时代
这个 事件 的 起源 是 在 1997 年 的 时候
1997 年 那 段时间
这个 人工智能 陷入 了 低谷
不过 那 一段时间 出 了 一个 事
就是 IBM 公司 造 了 一个 机器人
这个 机器人 名字 叫做 深蓝
它 干 了 什么 事 想必 很多 人 还 记得 吧
就是 它 下象棋
结果 战胜 了 12 年 的 国际象棋 冠军 卡斯帕罗夫
因为 深蓝 战胜 了 卡斯帕罗夫
所以 人工智能 再次 复苏 了
当然 这 一次 的 人工智能 复苏 和 发展
是 得益于 最近 几十年 计算机科学
以及 各种 算法 的 改进
尤其 是 在 人工智能 算法 领域
涌现出 很多 的 灵魂 人物
比如说 像 加拿大多伦多大学 的 这个 辛顿 是 吧
他 的 著名 的 贡献 就是 将 反向 传播 算法 BP
引入 到 人工智能 当中
这个 我们 后面 会 介绍
还有 叫 纽约大学 的 杨立 坤
他 的 这个 著名 的 贡献 就是 卷积 神经网络
这个 我们 也 会 介绍
还有 比如说
像 加拿大 的 这个 蒙特利尔 大学 的 这个 本 吉奥
他们 三个 也 因为 在 人工智能 领域 的 贡献
获得 了 2018 年 的 图灵奖
经过 几十年 的 发展
这个 人工智能 已经 有 了 长足 的 进步
在 特定 领域 比如说 像 图像识别 领域
人工智能 甚至 已经 超过 了 人类
而 在 机器翻译 和 语音 识别 方面
人工智能 也 已经 有 了 长足 的 应用
比如 现在 我们 上网
看到 一个 网页 英文 的 我们 看不懂
看到 一个 网页 英文 的 我们 看不懂
我们 可以 右键 选择 翻译成 中文
它 就 能 直接 把 网页 给 我们 翻译 过来
我们 出国 旅游
遇到 外国人 我们 不会 说话 怎么办
我们 用 一个 手机软件 就 可以 了
比如说 我 遇到 一个 英国人
我 想 问问 他
我 说 这个 英国 的 伦敦 火车站 怎么 走
你 看 我 跟 你 说
请问 伦敦 火车站 怎么 走
How can I get to the London railway station
它 就 翻译 过来 了
比如 我 去 韩国 旅游 是 吧
我 去 韩国 旅游
请问 最近 的 厕所 在 哪里
가장 가까운 화장실이 어디예요 ?
你 看 它 就 可以 翻译 过来 是 吧
当然 了 外国人 说话
我们 也 可以 通过 这个 软件 翻译 回来
这 其实 都 是 人工智能 的 一个 应用
那么 计算机 是 如何 做到 这 一点 呢
这 其实 本质 上 是 一个 数学 问题
咱们 来 一步 一步 给 大家 做 一个 解释
首先 我们 需要 大家 了解 一个 概念
叫做 梯度 下降 算法
梯度 下降 是 人工智能 最 核心 的 一个 算法 是 吧
这个 梯度 下降 算法
可以 帮助 我们 去 处理 分类 问题 还有 回归 问题
我们 以 回归 问题 为例 吧
比如说 我们 想 让 人工智能 帮 我们 干 一件 事
就是 预测 房价
咱们 说 这个 预测 房价
就是 你 给 我 一个 房子
然后 机器 判断 出来 这 房子 大概 值 多少钱 是 吧
那 怎么 做 呢
你 首先 得 给 我 一些 数据
你 告诉 我 说 房价 取决于 什么 呢
我们 知道 房价 取决于 它 是 城市 的 还是 乡村 的
它 面积 大小 楼层
它 的 小区 环境 等等 一系列 因素 对 吧
我们 先 简化 一下
比如说 这个 房价 我们 认为
它 就 取决于 一个 因素 就是 面积
我们 就 简单 一点
面积 我们 叫 它 x
那么 纵坐标 这个 是 房屋 的 价格
价格 叫做 y
你 给 了 我 一大堆 的 数据
每 一个 房屋 的 价格 对应 着 它 的 这个 面积
给 了 我 这么 一个 数据
比如说 有 m 个 数据
我们 把 这 m 个 数据 我 放在 这张 图上
大概 是 这样
比如说 这个 房子 在 这
这个 房子 价格 是 这样
这个 房子 是 这样
这 房子 是 这样 是 吧
大概 来讲 是 面积 越大 的 房子 价格 越高
当然 它会 有 一定 的 起伏
现在 我 就 问 我 说 你 能 不能 告诉 我 一个 函数
这个 价格 和 面积 之间 到底 是 什么 关系 呢
当然 最 简单 的 函数 就是 直线
所以 我们 就 可以 说 我们 假设 这个 关系
就是 y=wx+b
我 引入 了 两个 参数
大家 看 这 一个 参数 是 w
相当于 是 斜率
还有 一个 参数 是 b 是 截距
于是 我们 就 用 一条 直线 来 描述 y 和 x 的 关系
当然 大家 会 发现 这个 直线 不 可能 会过 所有 的 点
甚至于 可能 每 一个点 它 都 不过 是 吧
它 和 实际 的 情况 是 有 差别 的
比如说 第一个 房子
它 的 价格 在 这
但是 我 预测 你 价格 在 这
你 就 出现 了 一个 差别 叫 Δy₁
这 就是 你 预测 的 误差 对 吧
第二个 房子 你 也 出现 了 一个 误差 Δy₂
只不过 这个 误差 是 负 的 是 吧
第三个 房子 又 有 一个 误差 叫 Δy₃
第四个 房子 又 有 一个 误差 Δy₄
第五个 房子 又 有 一个 误差 Δy₅
你 可能 有 很多 个 房子 都 出现 了 误差
此时 我 要说 你 这个 预测 是 精准 的
什么 意思 呢
就是 要 让 所有 的 误差 综合 来讲 是 最小 的
这个 我们 管它 叫 损失 函数
它 的 损失 函数 叫 J
J 等于 什么 呢 等于 1/(2m)...
m 就是 有 多少 个 数据
1/(2m) 然后 加 和 每 一个 误差 的 平方
说 误差 为什么 要 平方 加 和 呢
因为 你 如果 直接 加 和 的话 正负 会 抵消
我 为了 不让 它 抵消 我 把 它 给 平方 加 和
我 是 希望 这个 损失 函数 它 最小 对 不 对
我 也 可以 换 一个 写法
说 这个 损失 函数 J 等于 什么 呢
等于 (1/(2m))Σ(yᵢ-(wxᵢ+b))²
我 引入 的 参数 是 w 和 b
我 希望 使得 这个 误差 函数 最小
误差 函数 最小 就 说明
这 条 直线 最 符合 房价 的 价格 和 面积 关系
它 不 可能 完全符合
因为 每 一个 房价 它 可能 也 不能 满足 同一个 函数
但 它 最 符合
我 就 希望 能够 找到 这样 的 w 和 这样 的 b
但 问题 是 你 怎么 找到 这个 合适 的 参数 w 和 b
使得 损失 函数 最小 呢
上 过 大学 的 同学 都 知道
这 叫做 最小 二 乘法
这个 方法 其实 在 高斯 和 勒 让 德 的 时代
人们 就 已经 弄清楚 了
只不过 有 两个 参数 你好 算
如果 你 参数 非常 多
用 高斯 和 勒 让 德 的 方法 就 会 非常 的 复杂
于是 人们 就 想 我们 能 不能 有 一个 更好 的 方法
来 优化 这个 参数 呢
那么 这种 方法 就 称之为 梯度 下降 算法
什么 意思 啊
我们 举个 例子
比如 我 想 优化 这个 参数 w
我 想 看看 w 取 什么 值 能够 让 这个 损失 函数 最小
我 最 容易 能够 预测 这个 房价 是 吧
怎么 做 呢
我们 首先 把 这个 参数 w 作为 横坐标
然后 我们 再 把 这个 损失 函数
就是 你 的 预测 和 实际 的 差别 作为 纵坐标
你 把 它 画出 一个 图像 来
你 会 发现 这个 图像 有 可能 是 这个 样子 的
我们 希望 找到 一个 w 让 这个 损失 函数 最小
那 是 在 哪
那 是不是 在 这
我 就 希望 找到 这个 点
这个 就是 最好 的 w
但是 你 最 开始 给 它 一个 w 的 时候
你 可能 给 的 是 这个 数 w₁
所以 这个 值 它 并不等于 我们 最优 的 参数
于是 怎么办
我们 就 需要 用 梯度 下降 算法 了
这个 梯度 下降 算法 的 过程 是 这样 的
首先 我们 求 一个 函数 叫做 ∂J/∂w
偏 导数 是 大学 的 一个 概念
大概 的 意思 就是说
你 这个 损失 函数 是 如何 随着 w 而 变化 的
它 表示 的 是 这个 函数 的 倾斜 程度
如果 这个 点 它 离 最低点 越远 的话
它 的 斜率 就 越 大
倾斜 得 越 厉害
这个 数就会 越大 对 不 对
你 先 把 这个 数求 出来
求 完 了 之后
我们 说 你 进行 迭代
怎么 迭代 呢
就是 新 的 w 就 wₙ₊₁
机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1)
||||||||||||neural networks
Können Maschinen wie Menschen denken?Künstliche Intelligenz (I) Maschinelles Lernen und neuronale Netze (1)
Can machines think like humans? Artificial Intelligence (I) Machine Learning and Neural Networks (1)
Le macchine possono pensare come gli esseri umani? Intelligenza artificiale (I) Apprendimento automatico e reti neurali (1)
各位 同学 大家 好
我 是 李永乐 老师
前 一段时间 我 为 大家 介绍 了
创造 未来 的 新 技术 5G
create||||technology|
有个 小朋友 就 跟 我 说
他 对 人工智能 的 话题 特别 感兴趣
小 的 时候 就 特别 喜欢 看 科幻片
|||||||sci-fi movies
比如说 像 《 终结者 》
||The Terminator
《 机械公敌 》 这样 的 电影
I Robot|||movies like I Robot
Movies like "Machine Enemy"
但 他 始终 不 明白
||always||
为什么 机器 能够 像 人 一样 思考 呢
其实 人工智能 早就 不是 科学幻想 了
actually||long ago||science fiction|
而是 已经 应用 到 生活 的 方方面面 了
||application||||every aspect|
比如说 为了 应对 新冠 肺炎
||respond to|COVID-19|pneumonia
For example, in response to new coronary pneumonia
很多 公司 都 加装 了 人脸识别 系统
|||added||facial recognition|
它 能够 区分 你 是不是 这个 公司 的 员工
|can|distinguish||||||employee
用 的 就是 人工智能
在 进行 新冠 肺炎 筛查 的 时候
|conducting|COVID-19|pneumonia|screening||
肺部 影像 CT 是 一个 很 重要 的 指标
Lung area|imaging|lung imaging CT||||||indicator
人工智能 就 可以 帮助 医生
快速 判断 这个 人 的 肺部 是不是 感染 了
|||||lungs||infection|
同时 人工智能 也 可以 判断 肿瘤 的 类型
|||||tumor||
当 我们 在 路上 开车 被 电子眼 抓拍 的 时候
||||||speed camera|snap shot||
人工智能 可以 帮助 我们 识别 车牌
||||recognize|license plate
除了 图像识别 之外
|image recognition|
人工智能 还 可以 用 在 语音 识别 上
|||||voice recognition|recognition|
比如说 各种 语音 助手 智能 音箱
|||assistant|smart|smart speaker
For example, various voice assistant smart speakers
都 用到 了 人工智能 的 原理
|||||principle
再 比如 我们 手机 中 的 美颜 软件
||||||beautifying software|
短 视频 平台 的 推荐 系统
short||platform||recommendation|system
邮件系统 中 的 反垃圾 系统
mail system|||anti-spam|
其实 用到 的 都 是 人工智能
还有 自动 驾驶 智慧 工业
|automatic|driving|smart technology|smart industry
There is also autonomous driving smart industry
也 离不开 人工智能
今天 我们 就 来 聊 一聊 人工智能 的 相关 话题
希望 通过 今天 的 讲解
||||explanation
大家 能够 对 人工智能 和 神经网络
|||||neural networks
有 一个 基本 的 认识
我们 首先 先来 聊 一聊 人工智能 的 发展史
|||||||history of development
人工智能 其实 并 不是 一个 新 出现 的 事物
在 上古时代 不管 是 东方 还是 西方
|ancient times|||||
其实 都 有 人造 人 的 神话
|||artificial|||myth
In fact, there are myths of artificial people
而 到 了 上 世纪 的 30 到 50 年代
随着 计算机科学 这个 神经科学
With the|computer science||neuroscience
还有 数学 的 发展
人工智能 才 第一次 进入 到 了 科学家 的 视野
||||||||scientists' perspective
在 1950 年 的 时候
at in|||
英国 的 著名 的 这个 计算机 科学家 叫 图灵
||||||||Turing
他 提出 了 一个 问题
他 说 机器 能够 像 人类 一样 思考 吗
||machine|can|||||
并且 为了 这个 问题
图灵 还 提出 了 一种 测试方法
Turing|||||
也 就是 我们 今天 所说 的 图灵 测试
||||||Turing|Turing test
图灵 测试 是 说 我们 可以 让 一个 人
通过 文字 的 方法 和 两个 东西 进行 交流
这有 一个 里边 是 个人
另外 它 是 一个 电脑 是 个 机器 是 吧
他 通过 文字 的 方法 进行 交流
然后 能 不能 通过 一系列 的 提问 和 回答
||||a series||||
让 左边 的 这个 人 判断 哪 一个 才 是 真人
||||||||||real person
哪 一个 才 是 机器 呢
如果 经过 判断
这个 人 没有 办法 区分 真人 和 机器 的话
就 说明 这个 机器 通过 了 图灵 测试
|indicates||the machine|||Turing|Turing test
图灵 预测 到 2000 年 的 时候
|predicted||||
将会 有 一台 机器
它 能够 使 30% 以上 的 人 相信 它 是 一个 人
这 就 通过 了 图灵 测试
图灵 测试 每 一年 都 会 举行
|test|||||
那 在 2014 年 的 时候
终于 有 一台 机器 它 骗过 了 33% 的 人
让 别人 相信 它 是 一个 小男孩
是 一个 13 岁 的 男孩
算是 通过 了 图灵 测试
|||Turing|Turing test
那么 计算机领域 的 最高 奖项 叫 图灵奖
|computer science|||Turing Award||Turing Award
就是 以 图灵 命名 的
|||named after Turing|
它 被 称为 计算机领域 里面 的 诺贝尔奖
|||Nobel Prize in Computing|||Nobel Prize
那么 还有 一个 重要 的 年代 就是 1956 年
在 1956 年 的 时候
有 这个 两位 计算机 科学家
一个 叫做 马文 · 明斯基
||Mawen|Minsky
还有 一个 叫做 约翰 · 麦卡锡
|||John McCarthy|John McCarthy
那么 这 两个 人 又 拽 上 了 这个 信息论 的 奠基者
|||||argued||||Information Theory||founder
著名 大佬 香农
famous|big shot|Shannon
他们 几个 召集 了 一个 会议
||called a meeting|||
这个 会议 就是 著名 的 达特茅斯 会议
|||||Dartmouth Conference|
达特茅斯 会议 上 主要 的 议题
|||||main topic
就是 机器 是否 能够 像 人类 一样 思考 是 吧
并且 在 这次 会议 上 人们 发明 了 一个 词
||||||invented|||
这个 词 就是 人工智能
也 就是 我们 经常 听说 到 的 AI 是 吧
从 那 一次 会议 开始
这个 人工智能 就 进入 了 第一次 大 发展 时代
|||entered|||||
而 这个 明斯基 和 麦卡锡
||Minsky||McCarthy
就 因为 他们 在 人工智能 领域 的 贡献
|||||||contribution
而 获得 了 图灵奖 是 吧
|won||||
香农 是 不 需要 图灵奖 了
Shannon|||||
因为 香农 的 名字 被 用来 命名
|Shannon|||||naming
通信 领域 的 诺贝尔奖
communication|||
那 就是 香农 奖 是 吧
好 那么 人工智能 在历史上
其实 也 经历 了 几次 涨落 有三涨 两落
||experienced|||fluctuations|three rises|two declines
In fact, it has experienced several fluctuations, three fluctuations and two fluctuations.
那 现在 我们 是 处于 第三次 大 发展 的 时代
||||in the midst of|||||
这个 事件 的 起源 是 在 1997 年 的 时候
|event||origin|||||
1997 年 那 段时间
这个 人工智能 陷入 了 低谷
||fell into||low point
不过 那 一段时间 出 了 一个 事
就是 IBM 公司 造 了 一个 机器人
|||made|||
这个 机器人 名字 叫做 深蓝
||||Deep Blue
它 干 了 什么 事 想必 很多 人 还 记得 吧
|||||probably|||||
就是 它 下象棋
||play chess
It's playing chess
结果 战胜 了 12 年 的 国际象棋 冠军 卡斯帕罗夫
|defeated||||chess|champion|Kasparov
因为 深蓝 战胜 了 卡斯帕罗夫
|Deep Blue|defeated||Kasparov
所以 人工智能 再次 复苏 了
|||revived again|
当然 这 一次 的 人工智能 复苏 和 发展
是 得益于 最近 几十年 计算机科学
|thanks to|||
以及 各种 算法 的 改进
||||improvement
尤其 是 在 人工智能 算法 领域
especially in||||algorithm|
涌现出 很多 的 灵魂 人物
emerged|||soul characters|
Many souls have emerged
比如说 像 加拿大多伦多大学 的 这个 辛顿 是 吧
||University of Toronto|||Hinton||
他 的 著名 的 贡献 就是 将 反向 传播 算法 BP
||famous||contribution||to apply|backpropagation|backpropagation|algorithm|backpropagation algorithm
His famous contribution is the back propagation algorithm BP
引入 到 人工智能 当中
introduce into|||
这个 我们 后面 会 介绍
还有 叫 纽约大学 的 杨立 坤
||||Yang Li|Kun
他 的 这个 著名 的 贡献 就是 卷积 神经网络
|||||contribution||convolution|convolutional neural network
这个 我们 也 会 介绍
还有 比如说
像 加拿大 的 这个 蒙特利尔 大学 的 这个 本 吉奥
||||Montreal|||this||Gio
他们 三个 也 因为 在 人工智能 领域 的 贡献
||||||||contribution
获得 了 2018 年 的 图灵奖
经过 几十年 的 发展
这个 人工智能 已经 有 了 长足 的 进步
|||||great progress||
在 特定 领域 比如说 像 图像识别 领域
|specific|||||
人工智能 甚至 已经 超过 了 人类
|even||||
而 在 机器翻译 和 语音 识别 方面
||machine translation||||
人工智能 也 已经 有 了 长足 的 应用
比如 现在 我们 上网
看到 一个 网页 英文 的 我们 看不懂
||webpage||||
看到 一个 网页 英文 的 我们 看不懂
我们 可以 右键 选择 翻译成 中文
||right-click|||
它 就 能 直接 把 网页 给 我们 翻译 过来
我们 出国 旅游
||travel
遇到 外国人 我们 不会 说话 怎么办
我们 用 一个 手机软件 就 可以 了
|||mobile app|||
比如说 我 遇到 一个 英国人
我 想 问问 他
我 说 这个 英国 的 伦敦 火车站 怎么 走
|||||London|||
你 看 我 跟 你 说
请问 伦敦 火车站 怎么 走
|London|||
How can I get to the London railway station
||||||London railway station|railway station|London railway station
它 就 翻译 过来 了
比如 我 去 韩国 旅游 是 吧
我 去 韩国 旅游
请问 最近 的 厕所 在 哪里
가장 가까운 화장실이 어디예요 ?
the closest|nearest|the nearest restroom|Where is it
你 看 它 就 可以 翻译 过来 是 吧
当然 了 外国人 说话
我们 也 可以 通过 这个 软件 翻译 回来
|||||||back
这 其实 都 是 人工智能 的 一个 应用
||all|||||
那么 计算机 是 如何 做到 这 一点 呢
|computer||||||
这 其实 本质 上 是 一个 数学 问题
||essence|||||
咱们 来 一步 一步 给 大家 做 一个 解释
首先 我们 需要 大家 了解 一个 概念
叫做 梯度 下降 算法
|gradient|descent|Gradient Descent Algorithm
梯度 下降 是 人工智能 最 核心 的 一个 算法 是 吧
gradient|gradient descent|||||||algorithm||
这个 梯度 下降 算法
|||algorithm
可以 帮助 我们 去 处理 分类 问题 还有 回归 问题
||||||||regression|
我们 以 回归 问题 为例 吧
||returning to||as an example|
比如说 我们 想 让 人工智能 帮 我们 干 一件 事
就是 预测 房价
|predicting|housing prices
咱们 说 这个 预测 房价
|||prediction|
就是 你 给 我 一个 房子
然后 机器 判断 出来 这 房子 大概 值 多少钱 是 吧
|||||||worth|||
那 怎么 做 呢
你 首先 得 给 我 一些 数据
你 告诉 我 说 房价 取决于 什么 呢
|||||depends on||
我们 知道 房价 取决于 它 是 城市 的 还是 乡村 的
它 面积 大小 楼层
它 的 小区 环境 等等 一系列 因素 对 吧
||||||factors||
我们 先 简化 一下
比如说 这个 房价 我们 认为
它 就 取决于 一个 因素 就是 面积
||||factor||
我们 就 简单 一点
面积 我们 叫 它 x
area||||
那么 纵坐标 这个 是 房屋 的 价格
|vertical axis|||||
价格 叫做 y
你 给 了 我 一大堆 的 数据
||||a lot of||data
每 一个 房屋 的 价格 对应 着 它 的 这个 面积
||house||||||||
给 了 我 这么 一个 数据
比如说 有 m 个 数据
||||data
我们 把 这 m 个 数据 我 放在 这张 图上
大概 是 这样
比如说 这个 房子 在 这
这个 房子 价格 是 这样
||price||
这个 房子 是 这样
这 房子 是 这样 是 吧
|the house||||
大概 来讲 是 面积 越大 的 房子 价格 越高
|||area|||||
当然 它会 有 一定 的 起伏
|||||ups and downs
现在 我 就 问 我 说 你 能 不能 告诉 我 一个 函数
||||||||||||function
这个 价格 和 面积 之间 到底 是 什么 关系 呢
当然 最 简单 的 函数 就是 直线
||||||line
所以 我们 就 可以 说 我们 假设 这个 关系
||||||assume||
就是 y=wx+b
||weight vector|
我 引入 了 两个 参数
|introduced|||parameters
大家 看 这 一个 参数 是 w
相当于 是 斜率
||slope
还有 一个 参数 是 b 是 截距
||||||intercept
于是 我们 就 用 一条 直线 来 描述 y 和 x 的 关系
|||||straight line|||||||
当然 大家 会 发现 这个 直线 不 可能 会过 所有 的 点
甚至于 可能 每 一个点 它 都 不过 是 吧
even||||||||
它 和 实际 的 情况 是 有 差别 的
比如说 第一个 房子
它 的 价格 在 这
但是 我 预测 你 价格 在 这
||predict||||
你 就 出现 了 一个 差别 叫 Δy₁
这 就是 你 预测 的 误差 对 吧
|||||error||
第二个 房子 你 也 出现 了 一个 误差 Δy₂
只不过 这个 误差 是 负 的 是 吧
just that||error|||||
第三个 房子 又 有 一个 误差 叫 Δy₃
第四个 房子 又 有 一个 误差 Δy₄
||||||error Δy
第五个 房子 又 有 一个 误差 Δy₅
|||||error|
你 可能 有 很多 个 房子 都 出现 了 误差
此时 我 要说 你 这个 预测 是 精准 的
At this moment|||||||accurate|
什么 意思 呢
就是 要 让 所有 的 误差 综合 来讲 是 最小 的
||||||overall||||
这个 我们 管它 叫 损失 函数
||call it||loss function|
We call it the loss function
它 的 损失 函数 叫 J
||loss function|||
J 等于 什么 呢 等于 1/(2m)...
m 就是 有 多少 个 数据
|||how many||
1/(2m) 然后 加 和 每 一个 误差 的 平方
||||||error||squared
说 误差 为什么 要 平方 加 和 呢
|error||||||
因为 你 如果 直接 加 和 的话 正负 会 抵消
|||directly||plus||positive and negative||cancel out
我 为了 不让 它 抵消 我 把 它 给 平方 加 和
||||cancel out|||||||
我 是 希望 这个 损失 函数 它 最小 对 不 对
我 也 可以 换 一个 写法
说 这个 损失 函数 J 等于 什么 呢
||loss function|||||
等于 (1/(2m))Σ(yᵢ-(wxᵢ+b))²
||summation symbol|predicted value|predicted value|
我 引入 的 参数 是 w 和 b
|introduced||||||
我 希望 使得 这个 误差 函数 最小
||to make||error||
误差 函数 最小 就 说明
error|function|||
这 条 直线 最 符合 房价 的 价格 和 面积 关系
||line||best fits||||||
它 不 可能 完全符合
|||completely matches
因为 每 一个 房价 它 可能 也 不能 满足 同一个 函数
||||||||||function
但 它 最 符合
我 就 希望 能够 找到 这样 的 w 和 这样 的 b
但 问题 是 你 怎么 找到 这个 合适 的 参数 w 和 b
|||||||suitable|||||
使得 损失 函数 最小 呢
to make|loss|||
上 过 大学 的 同学 都 知道
这 叫做 最小 二 乘法
||||multiplication
This is called the least squares method
这个 方法 其实 在 高斯 和 勒 让 德 的 时代
||||Gauss||Le||||
人们 就 已经 弄清楚 了
|||figured out|
只不过 有 两个 参数 你好 算
only|||||
如果 你 参数 非常 多
用 高斯 和 勒 让 德 的 方法 就 会 非常 的 复杂
|||||||method|||||
于是 人们 就 想 我们 能 不能 有 一个 更好 的 方法
来 优化 这个 参数 呢
|optimize|||
那么 这种 方法 就 称之为 梯度 下降 算法
什么 意思 啊
我们 举个 例子
|give an example|
比如 我 想 优化 这个 参数 w
|||optimize|||
我 想 看看 w 取 什么 值 能够 让 这个 损失 函数 最小
||||||||||loss|function|
我 最 容易 能够 预测 这个 房价 是 吧
||||predict||||
怎么 做 呢
我们 首先 把 这个 参数 w 作为 横坐标
|||||||horizontal axis
然后 我们 再 把 这个 损失 函数
||||this||
就是 你 的 预测 和 实际 的 差别 作为 纵坐标
|||prediction||actual situation||||
你 把 它 画出 一个 图像 来
|||||image|
你 会 发现 这个 图像 有 可能 是 这个 样子 的
我们 希望 找到 一个 w 让 这个 损失 函数 最小
|||||||loss||
那 是 在 哪
那 是不是 在 这
我 就 希望 找到 这个 点
这个 就是 最好 的 w
但是 你 最 开始 给 它 一个 w 的 时候
你 可能 给 的 是 这个 数 w₁
所以 这个 值 它 并不等于 我们 最优 的 参数
||||not equal to||||parameter
于是 怎么办
我们 就 需要 用 梯度 下降 算法 了
这个 梯度 下降 算法 的 过程 是 这样 的
|gradient|||||||
首先 我们 求 一个 函数 叫做 ∂J/∂w
||find|||||
偏 导数 是 大学 的 一个 概念
partial|partial derivative|||||
大概 的 意思 就是说
你 这个 损失 函数 是 如何 随着 w 而 变化 的
||||||with||||
它 表示 的 是 这个 函数 的 倾斜 程度
|||||||slope|
如果 这个 点 它 离 最低点 越远 的话
|||||lowest point||
它 的 斜率 就 越 大
||slope|||
倾斜 得 越 厉害
more tilted|||
这个 数就会 越大 对 不 对
|the number||||
你 先 把 这个 数求 出来
||||calculate the number|
求 完 了 之后
我们 说 你 进行 迭代
||||iteration
怎么 迭代 呢
|iteration|
就是 新 的 w 就 wₙ₊₁