×
Usamos cookies para ayudar a mejorar LingQ. Al visitar este sitio, aceptas nuestras
politicas de cookie.
李永乐老师 Youtube, 机器能像人一样思考吗?人工智能(一)机器学习和神经网络 (1)
机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1)
各位 同学 大家 好
我 是 李永乐 老师
前 一段时间 我 为 大家 介绍 了
创造 未来 的 新 技术 5G
有个 小朋友 就 跟 我 说
他 对 人工智能 的 话题 特别 感兴趣
小 的 时候 就 特别 喜欢 看 科幻片
比如说 像 《 终结者 》
《 机械公敌 》 这样 的 电影
但 他 始终 不 明白
为什么 机器 能够 像 人 一样 思考 呢
其实 人工智能 早就 不是 科学幻想 了
而是 已经 应用 到 生活 的 方方面面 了
比如说 为了 应对 新冠 肺炎
很多 公司 都 加装 了 人脸识别 系统
它 能够 区分 你 是不是 这个 公司 的 员工
用 的 就是 人工智能
在 进行 新冠 肺炎 筛查 的 时候
肺部 影像 CT 是 一个 很 重要 的 指标
人工智能 就 可以 帮助 医生
快速 判断 这个 人 的 肺部 是不是 感染 了
同时 人工智能 也 可以 判断 肿瘤 的 类型
当 我们 在 路上 开车 被 电子眼 抓拍 的 时候
人工智能 可以 帮助 我们 识别 车牌
除了 图像识别 之外
人工智能 还 可以 用 在 语音 识别 上
比如说 各种 语音 助手 智能 音箱
都 用到 了 人工智能 的 原理
再 比如 我们 手机 中 的 美颜 软件
短 视频 平台 的 推荐 系统
邮件系统 中 的 反垃圾 系统
其实 用到 的 都 是 人工智能
还有 自动 驾驶 智慧 工业
也 离不开 人工智能
今天 我们 就 来 聊 一聊 人工智能 的 相关 话题
希望 通过 今天 的 讲解
大家 能够 对 人工智能 和 神经网络
有 一个 基本 的 认识
我们 首先 先来 聊 一聊 人工智能 的 发展史
人工智能 其实 并 不是 一个 新 出现 的 事物
在 上古时代 不管 是 东方 还是 西方
其实 都 有 人造 人 的 神话
而 到 了 上 世纪 的 30 到 50 年代
随着 计算机科学 这个 神经科学
还有 数学 的 发展
人工智能 才 第一次 进入 到 了 科学家 的 视野
在 1950 年 的 时候
英国 的 著名 的 这个 计算机 科学家 叫 图灵
他 提出 了 一个 问题
他 说 机器 能够 像 人类 一样 思考 吗
并且 为了 这个 问题
图灵 还 提出 了 一种 测试方法
也 就是 我们 今天 所说 的 图灵 测试
图灵 测试 是 说 我们 可以 让 一个 人
通过 文字 的 方法 和 两个 东西 进行 交流
这有 一个 里边 是 个人
另外 它 是 一个 电脑 是 个 机器 是 吧
他 通过 文字 的 方法 进行 交流
然后 能 不能 通过 一系列 的 提问 和 回答
让 左边 的 这个 人 判断 哪 一个 才 是 真人
哪 一个 才 是 机器 呢
如果 经过 判断
这个 人 没有 办法 区分 真人 和 机器 的话
就 说明 这个 机器 通过 了 图灵 测试
图灵 预测 到 2000 年 的 时候
将会 有 一台 机器
它 能够 使 30% 以上 的 人 相信 它 是 一个 人
这 就 通过 了 图灵 测试
图灵 测试 每 一年 都 会 举行
那 在 2014 年 的 时候
终于 有 一台 机器 它 骗过 了 33% 的 人
让 别人 相信 它 是 一个 小男孩
是 一个 13 岁 的 男孩
算是 通过 了 图灵 测试
那么 计算机领域 的 最高 奖项 叫 图灵奖
就是 以 图灵 命名 的
它 被 称为 计算机领域 里面 的 诺贝尔奖
那么 还有 一个 重要 的 年代 就是 1956 年
在 1956 年 的 时候
有 这个 两位 计算机 科学家
一个 叫做 马文 · 明斯基
还有 一个 叫做 约翰 · 麦卡锡
那么 这 两个 人 又 拽 上 了 这个 信息论 的 奠基者
著名 大佬 香农
他们 几个 召集 了 一个 会议
这个 会议 就是 著名 的 达特茅斯 会议
达特茅斯 会议 上 主要 的 议题
就是 机器 是否 能够 像 人类 一样 思考 是 吧
并且 在 这次 会议 上 人们 发明 了 一个 词
这个 词 就是 人工智能
也 就是 我们 经常 听说 到 的 AI 是 吧
从 那 一次 会议 开始
这个 人工智能 就 进入 了 第一次 大 发展 时代
而 这个 明斯基 和 麦卡锡
就 因为 他们 在 人工智能 领域 的 贡献
而 获得 了 图灵奖 是 吧
香农 是 不 需要 图灵奖 了
因为 香农 的 名字 被 用来 命名
通信 领域 的 诺贝尔奖
那 就是 香农 奖 是 吧
好 那么 人工智能 在历史上
其实 也 经历 了 几次 涨落 有三涨 两落
那 现在 我们 是 处于 第三次 大 发展 的 时代
这个 事件 的 起源 是 在 1997 年 的 时候
1997 年 那 段时间
这个 人工智能 陷入 了 低谷
不过 那 一段时间 出 了 一个 事
就是 IBM 公司 造 了 一个 机器人
这个 机器人 名字 叫做 深蓝
它 干 了 什么 事 想必 很多 人 还 记得 吧
就是 它 下象棋
结果 战胜 了 12 年 的 国际象棋 冠军 卡斯帕罗夫
因为 深蓝 战胜 了 卡斯帕罗夫
所以 人工智能 再次 复苏 了
当然 这 一次 的 人工智能 复苏 和 发展
是 得益于 最近 几十年 计算机科学
以及 各种 算法 的 改进
尤其 是 在 人工智能 算法 领域
涌现出 很多 的 灵魂 人物
比如说 像 加拿大多伦多大学 的 这个 辛顿 是 吧
他 的 著名 的 贡献 就是 将 反向 传播 算法 BP
引入 到 人工智能 当中
这个 我们 后面 会 介绍
还有 叫 纽约大学 的 杨立 坤
他 的 这个 著名 的 贡献 就是 卷积 神经网络
这个 我们 也 会 介绍
还有 比如说
像 加拿大 的 这个 蒙特利尔 大学 的 这个 本 吉奥
他们 三个 也 因为 在 人工智能 领域 的 贡献
获得 了 2018 年 的 图灵奖
经过 几十年 的 发展
这个 人工智能 已经 有 了 长足 的 进步
在 特定 领域 比如说 像 图像识别 领域
人工智能 甚至 已经 超过 了 人类
而 在 机器翻译 和 语音 识别 方面
人工智能 也 已经 有 了 长足 的 应用
比如 现在 我们 上网
看到 一个 网页 英文 的 我们 看不懂
看到 一个 网页 英文 的 我们 看不懂
我们 可以 右键 选择 翻译成 中文
它 就 能 直接 把 网页 给 我们 翻译 过来
我们 出国 旅游
遇到 外国人 我们 不会 说话 怎么办
我们 用 一个 手机软件 就 可以 了
比如说 我 遇到 一个 英国人
我 想 问问 他
我 说 这个 英国 的 伦敦 火车站 怎么 走
你 看 我 跟 你 说
请问 伦敦 火车站 怎么 走
How can I get to the London railway station
它 就 翻译 过来 了
比如 我 去 韩国 旅游 是 吧
我 去 韩国 旅游
请问 最近 的 厕所 在 哪里
가장 가까운 화장실이 어디예요 ?
你 看 它 就 可以 翻译 过来 是 吧
当然 了 外国人 说话
我们 也 可以 通过 这个 软件 翻译 回来
这 其实 都 是 人工智能 的 一个 应用
那么 计算机 是 如何 做到 这 一点 呢
这 其实 本质 上 是 一个 数学 问题
咱们 来 一步 一步 给 大家 做 一个 解释
首先 我们 需要 大家 了解 一个 概念
叫做 梯度 下降 算法
梯度 下降 是 人工智能 最 核心 的 一个 算法 是 吧
这个 梯度 下降 算法
可以 帮助 我们 去 处理 分类 问题 还有 回归 问题
我们 以 回归 问题 为例 吧
比如说 我们 想 让 人工智能 帮 我们 干 一件 事
就是 预测 房价
咱们 说 这个 预测 房价
就是 你 给 我 一个 房子
然后 机器 判断 出来 这 房子 大概 值 多少钱 是 吧
那 怎么 做 呢
你 首先 得 给 我 一些 数据
你 告诉 我 说 房价 取决于 什么 呢
我们 知道 房价 取决于 它 是 城市 的 还是 乡村 的
它 面积 大小 楼层
它 的 小区 环境 等等 一系列 因素 对 吧
我们 先 简化 一下
比如说 这个 房价 我们 认为
它 就 取决于 一个 因素 就是 面积
我们 就 简单 一点
面积 我们 叫 它 x
那么 纵坐标 这个 是 房屋 的 价格
价格 叫做 y
你 给 了 我 一大堆 的 数据
每 一个 房屋 的 价格 对应 着 它 的 这个 面积
给 了 我 这么 一个 数据
比如说 有 m 个 数据
我们 把 这 m 个 数据 我 放在 这张 图上
大概 是 这样
比如说 这个 房子 在 这
这个 房子 价格 是 这样
这个 房子 是 这样
这 房子 是 这样 是 吧
大概 来讲 是 面积 越大 的 房子 价格 越高
当然 它会 有 一定 的 起伏
现在 我 就 问 我 说 你 能 不能 告诉 我 一个 函数
这个 价格 和 面积 之间 到底 是 什么 关系 呢
当然 最 简单 的 函数 就是 直线
所以 我们 就 可以 说 我们 假设 这个 关系
就是 y=wx+b
我 引入 了 两个 参数
大家 看 这 一个 参数 是 w
相当于 是 斜率
还有 一个 参数 是 b 是 截距
于是 我们 就 用 一条 直线 来 描述 y 和 x 的 关系
当然 大家 会 发现 这个 直线 不 可能 会过 所有 的 点
甚至于 可能 每 一个点 它 都 不过 是 吧
它 和 实际 的 情况 是 有 差别 的
比如说 第一个 房子
它 的 价格 在 这
但是 我 预测 你 价格 在 这
你 就 出现 了 一个 差别 叫 Δy₁
这 就是 你 预测 的 误差 对 吧
第二个 房子 你 也 出现 了 一个 误差 Δy₂
只不过 这个 误差 是 负 的 是 吧
第三个 房子 又 有 一个 误差 叫 Δy₃
第四个 房子 又 有 一个 误差 Δy₄
第五个 房子 又 有 一个 误差 Δy₅
你 可能 有 很多 个 房子 都 出现 了 误差
此时 我 要说 你 这个 预测 是 精准 的
什么 意思 呢
就是 要 让 所有 的 误差 综合 来讲 是 最小 的
这个 我们 管它 叫 损失 函数
它 的 损失 函数 叫 J
J 等于 什么 呢 等于 1/(2m)...
m 就是 有 多少 个 数据
1/(2m) 然后 加 和 每 一个 误差 的 平方
说 误差 为什么 要 平方 加 和 呢
因为 你 如果 直接 加 和 的话 正负 会 抵消
我 为了 不让 它 抵消 我 把 它 给 平方 加 和
我 是 希望 这个 损失 函数 它 最小 对 不 对
我 也 可以 换 一个 写法
说 这个 损失 函数 J 等于 什么 呢
等于 (1/(2m))Σ(yᵢ-(wxᵢ+b))²
我 引入 的 参数 是 w 和 b
我 希望 使得 这个 误差 函数 最小
误差 函数 最小 就 说明
这 条 直线 最 符合 房价 的 价格 和 面积 关系
它 不 可能 完全符合
因为 每 一个 房价 它 可能 也 不能 满足 同一个 函数
但 它 最 符合
我 就 希望 能够 找到 这样 的 w 和 这样 的 b
但 问题 是 你 怎么 找到 这个 合适 的 参数 w 和 b
使得 损失 函数 最小 呢
上 过 大学 的 同学 都 知道
这 叫做 最小 二 乘法
这个 方法 其实 在 高斯 和 勒 让 德 的 时代
人们 就 已经 弄清楚 了
只不过 有 两个 参数 你好 算
如果 你 参数 非常 多
用 高斯 和 勒 让 德 的 方法 就 会 非常 的 复杂
于是 人们 就 想 我们 能 不能 有 一个 更好 的 方法
来 优化 这个 参数 呢
那么 这种 方法 就 称之为 梯度 下降 算法
什么 意思 啊
我们 举个 例子
比如 我 想 优化 这个 参数 w
我 想 看看 w 取 什么 值 能够 让 这个 损失 函数 最小
我 最 容易 能够 预测 这个 房价 是 吧
怎么 做 呢
我们 首先 把 这个 参数 w 作为 横坐标
然后 我们 再 把 这个 损失 函数
就是 你 的 预测 和 实际 的 差别 作为 纵坐标
你 把 它 画出 一个 图像 来
你 会 发现 这个 图像 有 可能 是 这个 样子 的
我们 希望 找到 一个 w 让 这个 损失 函数 最小
那 是 在 哪
那 是不是 在 这
我 就 希望 找到 这个 点
这个 就是 最好 的 w
但是 你 最 开始 给 它 一个 w 的 时候
你 可能 给 的 是 这个 数 w₁
所以 这个 值 它 并不等于 我们 最优 的 参数
于是 怎么办
我们 就 需要 用 梯度 下降 算法 了
这个 梯度 下降 算法 的 过程 是 这样 的
首先 我们 求 一个 函数 叫做 ∂J/∂w
偏 导数 是 大学 的 一个 概念
大概 的 意思 就是说
你 这个 损失 函数 是 如何 随着 w 而 变化 的
它 表示 的 是 这个 函数 的 倾斜 程度
如果 这个 点 它 离 最低点 越远 的话
它 的 斜率 就 越 大
倾斜 得 越 厉害
这个 数就会 越大 对 不 对
你 先 把 这个 数求 出来
求 完 了 之后
我们 说 你 进行 迭代
怎么 迭代 呢
就是 新 的 w 就 wₙ₊₁
机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1)
Can machines think like humans? Artificial Intelligence (I) Machine Learning and Neural Networks (1)
各位 同学 大家 好
我 是 李永乐 老师
前 一段时间 我 为 大家 介绍 了
创造 未来 的 新 技术 5G
有个 小朋友 就 跟 我 说
他 对 人工智能 的 话题 特别 感兴趣
小 的 时候 就 特别 喜欢 看 科幻片
比如说 像 《 终结者 》
《 机械公敌 》 这样 的 电影
Movies like "Machine Enemy"
但 他 始终 不 明白
为什么 机器 能够 像 人 一样 思考 呢
其实 人工智能 早就 不是 科学幻想 了
而是 已经 应用 到 生活 的 方方面面 了
比如说 为了 应对 新冠 肺炎
For example, in response to new coronary pneumonia
很多 公司 都 加装 了 人脸识别 系统
它 能够 区分 你 是不是 这个 公司 的 员工
用 的 就是 人工智能
在 进行 新冠 肺炎 筛查 的 时候
肺部 影像 CT 是 一个 很 重要 的 指标
人工智能 就 可以 帮助 医生
快速 判断 这个 人 的 肺部 是不是 感染 了
同时 人工智能 也 可以 判断 肿瘤 的 类型
当 我们 在 路上 开车 被 电子眼 抓拍 的 时候
人工智能 可以 帮助 我们 识别 车牌
除了 图像识别 之外
人工智能 还 可以 用 在 语音 识别 上
比如说 各种 语音 助手 智能 音箱
For example, various voice assistant smart speakers
都 用到 了 人工智能 的 原理
再 比如 我们 手机 中 的 美颜 软件
短 视频 平台 的 推荐 系统
邮件系统 中 的 反垃圾 系统
其实 用到 的 都 是 人工智能
还有 自动 驾驶 智慧 工业
There is also autonomous driving smart industry
也 离不开 人工智能
今天 我们 就 来 聊 一聊 人工智能 的 相关 话题
希望 通过 今天 的 讲解
大家 能够 对 人工智能 和 神经网络
有 一个 基本 的 认识
我们 首先 先来 聊 一聊 人工智能 的 发展史
人工智能 其实 并 不是 一个 新 出现 的 事物
在 上古时代 不管 是 东方 还是 西方
其实 都 有 人造 人 的 神话
In fact, there are myths of artificial people
而 到 了 上 世纪 的 30 到 50 年代
随着 计算机科学 这个 神经科学
还有 数学 的 发展
人工智能 才 第一次 进入 到 了 科学家 的 视野
在 1950 年 的 时候
英国 的 著名 的 这个 计算机 科学家 叫 图灵
他 提出 了 一个 问题
他 说 机器 能够 像 人类 一样 思考 吗
并且 为了 这个 问题
图灵 还 提出 了 一种 测试方法
也 就是 我们 今天 所说 的 图灵 测试
图灵 测试 是 说 我们 可以 让 一个 人
通过 文字 的 方法 和 两个 东西 进行 交流
这有 一个 里边 是 个人
另外 它 是 一个 电脑 是 个 机器 是 吧
他 通过 文字 的 方法 进行 交流
然后 能 不能 通过 一系列 的 提问 和 回答
让 左边 的 这个 人 判断 哪 一个 才 是 真人
哪 一个 才 是 机器 呢
如果 经过 判断
这个 人 没有 办法 区分 真人 和 机器 的话
就 说明 这个 机器 通过 了 图灵 测试
图灵 预测 到 2000 年 的 时候
将会 有 一台 机器
它 能够 使 30% 以上 的 人 相信 它 是 一个 人
这 就 通过 了 图灵 测试
图灵 测试 每 一年 都 会 举行
那 在 2014 年 的 时候
终于 有 一台 机器 它 骗过 了 33% 的 人
让 别人 相信 它 是 一个 小男孩
是 一个 13 岁 的 男孩
算是 通过 了 图灵 测试
那么 计算机领域 的 最高 奖项 叫 图灵奖
就是 以 图灵 命名 的
它 被 称为 计算机领域 里面 的 诺贝尔奖
那么 还有 一个 重要 的 年代 就是 1956 年
在 1956 年 的 时候
有 这个 两位 计算机 科学家
一个 叫做 马文 · 明斯基
还有 一个 叫做 约翰 · 麦卡锡
那么 这 两个 人 又 拽 上 了 这个 信息论 的 奠基者
著名 大佬 香农
他们 几个 召集 了 一个 会议
这个 会议 就是 著名 的 达特茅斯 会议
达特茅斯 会议 上 主要 的 议题
就是 机器 是否 能够 像 人类 一样 思考 是 吧
并且 在 这次 会议 上 人们 发明 了 一个 词
这个 词 就是 人工智能
也 就是 我们 经常 听说 到 的 AI 是 吧
从 那 一次 会议 开始
这个 人工智能 就 进入 了 第一次 大 发展 时代
而 这个 明斯基 和 麦卡锡
就 因为 他们 在 人工智能 领域 的 贡献
而 获得 了 图灵奖 是 吧
香农 是 不 需要 图灵奖 了
因为 香农 的 名字 被 用来 命名
通信 领域 的 诺贝尔奖
那 就是 香农 奖 是 吧
好 那么 人工智能 在历史上
其实 也 经历 了 几次 涨落 有三涨 两落
In fact, it has experienced several fluctuations, three fluctuations and two fluctuations.
那 现在 我们 是 处于 第三次 大 发展 的 时代
这个 事件 的 起源 是 在 1997 年 的 时候
1997 年 那 段时间
这个 人工智能 陷入 了 低谷
不过 那 一段时间 出 了 一个 事
就是 IBM 公司 造 了 一个 机器人
这个 机器人 名字 叫做 深蓝
它 干 了 什么 事 想必 很多 人 还 记得 吧
就是 它 下象棋
It's playing chess
结果 战胜 了 12 年 的 国际象棋 冠军 卡斯帕罗夫
因为 深蓝 战胜 了 卡斯帕罗夫
所以 人工智能 再次 复苏 了
当然 这 一次 的 人工智能 复苏 和 发展
是 得益于 最近 几十年 计算机科学
以及 各种 算法 的 改进
尤其 是 在 人工智能 算法 领域
涌现出 很多 的 灵魂 人物
Many souls have emerged
比如说 像 加拿大多伦多大学 的 这个 辛顿 是 吧
他 的 著名 的 贡献 就是 将 反向 传播 算法 BP
His famous contribution is the back propagation algorithm BP
引入 到 人工智能 当中
这个 我们 后面 会 介绍
还有 叫 纽约大学 的 杨立 坤
他 的 这个 著名 的 贡献 就是 卷积 神经网络
这个 我们 也 会 介绍
还有 比如说
像 加拿大 的 这个 蒙特利尔 大学 的 这个 本 吉奥
他们 三个 也 因为 在 人工智能 领域 的 贡献
获得 了 2018 年 的 图灵奖
经过 几十年 的 发展
这个 人工智能 已经 有 了 长足 的 进步
在 特定 领域 比如说 像 图像识别 领域
人工智能 甚至 已经 超过 了 人类
而 在 机器翻译 和 语音 识别 方面
人工智能 也 已经 有 了 长足 的 应用
比如 现在 我们 上网
看到 一个 网页 英文 的 我们 看不懂
看到 一个 网页 英文 的 我们 看不懂
我们 可以 右键 选择 翻译成 中文
它 就 能 直接 把 网页 给 我们 翻译 过来
我们 出国 旅游
遇到 外国人 我们 不会 说话 怎么办
我们 用 一个 手机软件 就 可以 了
比如说 我 遇到 一个 英国人
我 想 问问 他
我 说 这个 英国 的 伦敦 火车站 怎么 走
你 看 我 跟 你 说
请问 伦敦 火车站 怎么 走
How can I get to the London railway station
它 就 翻译 过来 了
比如 我 去 韩国 旅游 是 吧
我 去 韩国 旅游
请问 最近 的 厕所 在 哪里
가장 가까운 화장실이 어디예요 ?
你 看 它 就 可以 翻译 过来 是 吧
当然 了 外国人 说话
我们 也 可以 通过 这个 软件 翻译 回来
这 其实 都 是 人工智能 的 一个 应用
那么 计算机 是 如何 做到 这 一点 呢
这 其实 本质 上 是 一个 数学 问题
咱们 来 一步 一步 给 大家 做 一个 解释
首先 我们 需要 大家 了解 一个 概念
叫做 梯度 下降 算法
梯度 下降 是 人工智能 最 核心 的 一个 算法 是 吧
这个 梯度 下降 算法
可以 帮助 我们 去 处理 分类 问题 还有 回归 问题
我们 以 回归 问题 为例 吧
比如说 我们 想 让 人工智能 帮 我们 干 一件 事
就是 预测 房价
咱们 说 这个 预测 房价
就是 你 给 我 一个 房子
然后 机器 判断 出来 这 房子 大概 值 多少钱 是 吧
那 怎么 做 呢
你 首先 得 给 我 一些 数据
你 告诉 我 说 房价 取决于 什么 呢
我们 知道 房价 取决于 它 是 城市 的 还是 乡村 的
它 面积 大小 楼层
它 的 小区 环境 等等 一系列 因素 对 吧
我们 先 简化 一下
比如说 这个 房价 我们 认为
它 就 取决于 一个 因素 就是 面积
我们 就 简单 一点
面积 我们 叫 它 x
那么 纵坐标 这个 是 房屋 的 价格
价格 叫做 y
你 给 了 我 一大堆 的 数据
每 一个 房屋 的 价格 对应 着 它 的 这个 面积
给 了 我 这么 一个 数据
比如说 有 m 个 数据
我们 把 这 m 个 数据 我 放在 这张 图上
大概 是 这样
比如说 这个 房子 在 这
这个 房子 价格 是 这样
这个 房子 是 这样
这 房子 是 这样 是 吧
大概 来讲 是 面积 越大 的 房子 价格 越高
当然 它会 有 一定 的 起伏
现在 我 就 问 我 说 你 能 不能 告诉 我 一个 函数
这个 价格 和 面积 之间 到底 是 什么 关系 呢
当然 最 简单 的 函数 就是 直线
所以 我们 就 可以 说 我们 假设 这个 关系
就是 y=wx+b
我 引入 了 两个 参数
大家 看 这 一个 参数 是 w
相当于 是 斜率
还有 一个 参数 是 b 是 截距
于是 我们 就 用 一条 直线 来 描述 y 和 x 的 关系
当然 大家 会 发现 这个 直线 不 可能 会过 所有 的 点
甚至于 可能 每 一个点 它 都 不过 是 吧
它 和 实际 的 情况 是 有 差别 的
比如说 第一个 房子
它 的 价格 在 这
但是 我 预测 你 价格 在 这
你 就 出现 了 一个 差别 叫 Δy₁
这 就是 你 预测 的 误差 对 吧
第二个 房子 你 也 出现 了 一个 误差 Δy₂
只不过 这个 误差 是 负 的 是 吧
第三个 房子 又 有 一个 误差 叫 Δy₃
第四个 房子 又 有 一个 误差 Δy₄
第五个 房子 又 有 一个 误差 Δy₅
你 可能 有 很多 个 房子 都 出现 了 误差
此时 我 要说 你 这个 预测 是 精准 的
什么 意思 呢
就是 要 让 所有 的 误差 综合 来讲 是 最小 的
这个 我们 管它 叫 损失 函数
We call it the loss function
它 的 损失 函数 叫 J
J 等于 什么 呢 等于 1/(2m)...
m 就是 有 多少 个 数据
1/(2m) 然后 加 和 每 一个 误差 的 平方
说 误差 为什么 要 平方 加 和 呢
因为 你 如果 直接 加 和 的话 正负 会 抵消
我 为了 不让 它 抵消 我 把 它 给 平方 加 和
我 是 希望 这个 损失 函数 它 最小 对 不 对
我 也 可以 换 一个 写法
说 这个 损失 函数 J 等于 什么 呢
等于 (1/(2m))Σ(yᵢ-(wxᵢ+b))²
我 引入 的 参数 是 w 和 b
我 希望 使得 这个 误差 函数 最小
误差 函数 最小 就 说明
这 条 直线 最 符合 房价 的 价格 和 面积 关系
它 不 可能 完全符合
因为 每 一个 房价 它 可能 也 不能 满足 同一个 函数
但 它 最 符合
我 就 希望 能够 找到 这样 的 w 和 这样 的 b
但 问题 是 你 怎么 找到 这个 合适 的 参数 w 和 b
使得 损失 函数 最小 呢
上 过 大学 的 同学 都 知道
这 叫做 最小 二 乘法
This is called the least squares method
这个 方法 其实 在 高斯 和 勒 让 德 的 时代
人们 就 已经 弄清楚 了
只不过 有 两个 参数 你好 算
如果 你 参数 非常 多
用 高斯 和 勒 让 德 的 方法 就 会 非常 的 复杂
于是 人们 就 想 我们 能 不能 有 一个 更好 的 方法
来 优化 这个 参数 呢
那么 这种 方法 就 称之为 梯度 下降 算法
什么 意思 啊
我们 举个 例子
比如 我 想 优化 这个 参数 w
我 想 看看 w 取 什么 值 能够 让 这个 损失 函数 最小
我 最 容易 能够 预测 这个 房价 是 吧
怎么 做 呢
我们 首先 把 这个 参数 w 作为 横坐标
然后 我们 再 把 这个 损失 函数
就是 你 的 预测 和 实际 的 差别 作为 纵坐标
你 把 它 画出 一个 图像 来
你 会 发现 这个 图像 有 可能 是 这个 样子 的
我们 希望 找到 一个 w 让 这个 损失 函数 最小
那 是 在 哪
那 是不是 在 这
我 就 希望 找到 这个 点
这个 就是 最好 的 w
但是 你 最 开始 给 它 一个 w 的 时候
你 可能 给 的 是 这个 数 w₁
所以 这个 值 它 并不等于 我们 最优 的 参数
于是 怎么办
我们 就 需要 用 梯度 下降 算法 了
这个 梯度 下降 算法 的 过程 是 这样 的
首先 我们 求 一个 函数 叫做 ∂J/∂w
偏 导数 是 大学 的 一个 概念
大概 的 意思 就是说
你 这个 损失 函数 是 如何 随着 w 而 变化 的
它 表示 的 是 这个 函数 的 倾斜 程度
如果 这个 点 它 离 最低点 越远 的话
它 的 斜率 就 越 大
倾斜 得 越 厉害
这个 数就会 越大 对 不 对
你 先 把 这个 数求 出来
求 完 了 之后
我们 说 你 进行 迭代
怎么 迭代 呢
就是 新 的 w 就 wₙ₊₁
BLACK FRIDAY SALE
Save 40%
Learn
a New Languagefrom
YouTube
Music
Podcasts
News
Books
Register and Save