×

Χρησιμοποιούμε cookies για να βελτιώσουμε τη λειτουργία του LingQ. Επισκέπτοντας τον ιστότοπο, συμφωνείς στην πολιτική για τα cookies.


image

李永樂老師, 机器能像人一样思考吗?人工智能(一)机器学习和神经网络 (1)

机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1)

各位 同學 大家 好

我 是 李永樂 老師

前 一段時間 我 為 大家 介紹 了

創造 未來 的 新 技術 5G

有個 小朋友 就 跟 我 說

他 對 人工智能 的 話題 特別 感興趣

小 的 時候 就 特別 喜歡 看 科幻片

比如說 像 《 終結者 》

《 機械公敵 》 這樣 的 電影

但 他 始終 不 明白

為什 麽 機器 能夠 像 人 一樣 思考 呢

其實 人工智能 早就 不是 科學幻想 了

而是 已經 應用 到 生活 的 方方面面 了

比如說 為 了 應對 新冠 肺炎

很多 公司 都 加裝 了 人臉識別 系統

它 能夠 區分 你 是不是 這個 公司 的 員工

用 的 就是 人工智能

在 進行 新冠 肺炎 篩查 的 時候

肺部 影像 CT 是 一個 很 重要 的 指標

人工智能 就 可以 幫助 醫生

快速 判斷 這個 人 的 肺部 是不是 感染 了

同時 人工智能 也 可以 判斷 腫瘤 的 類型

當 我們 在 路上 開車 被 電子眼 抓拍 的 時候

人工智能 可以 幫助 我們 識別 車牌

除了 圖像識別 之外

人工智能 還 可以 用 在 語音 識別 上

比如說 各種 語音 助手 智能 音箱

都 用到 了 人工智能 的 原理

再 比如 我們 手機 中 的 美顏 軟件

短 視頻 平臺 的 推薦 系統

郵件系統 中 的 反垃圾 系統

其實 用到 的 都 是 人工智能

還有 自動 駕駛 智慧 工業

也 離不開 人工智能

今天 我們 就 來 聊 一聊 人工智能 的 相關 話題

希望 通過 今天 的 講解

大家 能夠 對 人工智能 和 神經網絡

有 一個 基本 的 認識

我們 首先 先來 聊一聊 人工智能 的 發展史

人工智能 其實 並 不是 一個 新 出現 的 事物

在 上古時代 不管 是 東方 還是 西方

其實 都 有 人造 人 的 神話

而 到 了 上 世紀 的 30 到 50 年代

隨著 計算機科學 這個 神經科學

還有 數學 的 發展

人工智能 才 第一次 進入 到 了 科學家 的 視野

在 1950 年 的 時候

英國 的 著名 的 這個 計算機 科學家 叫 圖靈

他 提出 了 一個 問題

他 說 機器 能夠 像 人類 一樣 思考 嗎

並且 為 了 這個 問題

圖靈 還 提出 了 一種 測試方法

也 就是 我們 今天 所說 的 圖靈 測試

圖靈 測試 是 說 我們 可以 讓 一個 人

通過 文字 的 方法 和 兩個 東西 進行 交流

這有 一個 裏邊 是 個人

另外 它 是 一個 電腦 是 個 機器 是 吧

他 通過 文字 的 方法 進行 交流

然後 能 不能 通過 一系列 的 提問 和 回答

讓 左邊 的 這個 人 判斷 哪 一個 才 是 真人

哪 一個 才 是 機器 呢

如果 經過 判斷

這個 人 沒有 辦法 區分 真人 和 機器 的話

就 說明 這個 機器 通過 了 圖靈 測試

圖靈 預測 到 2000 年 的 時候

將會 有 一臺 機器

它 能夠 使 30% 以上 的 人 相信 它 是 一個 人

這就 通過 了 圖靈 測試

圖靈 測試 每 一年 都 會 舉行

那 在 2014 年 的 時候

終於 有 一臺 機器 它 騙過 了 33% 的 人

讓 別人 相信 它 是 一個 小男孩

是 一個 13 歲 的 男孩

算是 通過 了 圖靈 測試

那 麽 計算機領域 的 最高 獎項 叫 圖靈獎

就是 以 圖靈 命名 的

它 被 稱 為 計算機領域 裏面 的 諾貝爾獎

那 麽 還有 一個 重要 的 年代 就是 1956 年

在 1956 年 的 時候

有 這個 兩位 計算機 科學家

一個 叫做 馬 文 · 明斯基

還有 一個 叫做 約翰 · 麥卡錫

那 麽 這 兩個 人 又 拽 上 了 這個 信息論 的 奠基者

著名 大佬 香農

他們 幾個 召集 了 一個 會議

這個 會議 就是 著名 的 達特茅斯 會議

達特茅斯 會議 上 主要 的 議題

就是 機器 是否 能夠 像 人類 一樣 思考 是 吧

並且 在 這次 會議 上 人們 發明 了 一個 詞

這個 詞 就是 人工智能

也 就是 我們 經常 聽說 到 的 AI 是 吧

從 那 一次 會議 開始

這個 人工智能 就 進入 了 第一次 大 發展 時代

而 這個 明斯基 和 麥卡錫

就 因為 他們 在 人工智能 領域 的 貢獻

而 獲得 了 圖靈獎 是 吧

香農 是 不 需要 圖靈獎 了

因為 香農 的 名字 被 用來 命名

通信 領域 的 諾貝爾獎

那 就是 香農 獎 是 吧

好 那 麽 人工智能 在歷史上

其實 也 經歷 了 幾次 漲落 有三漲 兩落

那 現在 我們 是 處於 第三次 大 發展 的 時代

這個 事件 的 起源 是 在 1997 年 的 時候

1997 年 那 段時間

這個 人工智能 陷入 了 低谷

不過 那 一段時間 出 了 一個 事

就是 IBM 公司 造 了 一個 機器人

這個 機器人 名字 叫做 深藍

它 幹 了 什 麽 事 想必 很多 人還 記得 吧

就是 它 下象棋

結果 戰勝 了 12 年 的 國際象棋 冠軍 卡斯帕羅夫

因為 深藍 戰勝 了 卡斯帕羅夫

所以 人工智能 再次 復 蘇 了

當然 這 一次 的 人工智能 復 蘇 和 發展

是 得益於 最近 幾十年 計算機科學

以及 各種 算法 的 改進

尤其 是 在 人工智能 算法 領域

湧 現出 很多 的 靈魂 人物

比如說 像 加拿大多倫多大學 的 這個 辛頓 是 吧

他 的 著名 的 貢獻 就是 將 反向 傳播 算法 BP

引入 到 人工智能 當中

這個 我們 後面 會 介紹

還有 叫 紐約大學 的 楊立 坤

他 的 這個 著名 的 貢獻 就是 卷積 神經網絡

這個 我們 也 會 介紹

還有 比如說

像 加拿大 的 這個 蒙特利爾 大學 的 這個 本 吉奧

他們 三個 也 因為 在 人工智能 領域 的 貢獻

獲得 了 2018 年 的 圖靈獎

經過 幾十年 的 發展

這個 人工智能 已經 有 了 長足 的 進步

在 特定 領域 比如說 像 圖像識別 領域

人工智能 甚至 已經 超過 了 人類

而 在 機器翻譯 和 語音 識別 方面

人工智能 也 已經 有 了 長足 的 應用

比如 現在 我們 上網

看到 一個 網頁 英文 的 我們 看不懂

看到 一個 網頁 英文 的 我們 看不懂

我們 可以 右鍵 選擇 翻譯成 中文

它 就 能 直接 把 網頁 給 我們 翻譯 過來

我們 出國 旅遊

遇到 外國人 我們 不會 說話 怎 麽 辦

我們 用 一個 手機軟件 就 可以 了

比如說 我 遇到 一個 英國人

我 想 問問 他

我 說 這個 英國 的 倫敦 火車站 怎 麽 走

你 看 我 跟 你 說

請問 倫敦 火車站 怎 麽 走

How can I get to the London railway station

它 就 翻譯 過來 了

比如 我 去 韓國 旅遊 是 吧

我 去 韓國 旅遊

請問 最近 的 廁所 在 哪裏

가장 가까운 화장실이 어디예요 ?

你 看 它 就 可以 翻譯 過來 是 吧

當然 了 外國人 說話

我們 也 可以 通過 這個 軟件 翻譯 回來

這 其實 都 是 人工智能 的 一個 應用

那 麽 計算機 是 如何 做到 這 一點 呢

這 其實 本質 上 是 一個 數學 問題

咱們 來 一步 一步 給 大家 做 一個 解釋

首先 我們 需要 大家 了解 一個 概念

叫做 梯度 下降 算法

梯度 下降 是 人工智能 最 核心 的 一個 算法 是 吧

這個 梯度 下降 算法

可以 幫助 我們 去 處理 分類 問題 還有 回歸 問題

我們 以回 歸 問題 為例 吧

比如說 我們 想 讓 人工智能 幫 我們 幹 一件 事

就是 預測 房價

咱們 說 這個 預測 房價

就是 你給 我 一個 房子

然後 機器 判斷 出來 這 房子 大概 值 多少錢 是 吧

那 怎 麽 做 呢

你 首先 得給 我 一些 數據

你 告訴 我 說 房價 取決於 什 麽 呢

我們 知道 房價 取決於 它 是 城市 的 還是 鄉村 的

它 面積 大小 樓層

它 的 小區 環境 等等 一系列 因素 對 吧

我們 先 簡化 一下

比如說 這個 房價 我們 認為

它 就 取決於 一個 因素 就是 面積

我們 就 簡單 一點

面積 我們 叫 它 x

那 麽 縱 坐標 這個 是 房屋 的 價格

價格 叫做 y

你給 了 我 一大堆 的 數據

每 一個 房屋 的 價格 對應 著 它 的 這個 面積

給了 我 這 麽 一個 數據

比如說 有 m 個數 據

我們 把 這 m 個數 據 我 放在 這張 圖上

大概 是 這樣

比如說 這個 房子 在 這

這個 房子 價格 是 這樣

這個 房子 是 這樣

這 房子 是 這樣 是 吧

大概 來講 是 面積 越大 的 房子 價格 越高

當然 它會 有 一定 的 起伏

現在 我 就問 我 說 你 能 不能 告訴 我 一個 函數

這個 價格 和 面積 之間 到底 是 什 麽 關系 呢

當然 最 簡單 的 函數 就是 直線

所以 我們 就 可以 說 我們 假設 這個 關系

就是 y=wx+b

我 引入 了 兩個 參數

大家 看 這 一個 參數 是 w

相當於 是 斜率

還有 一個 參數 是 b 是 截距

於是 我們 就 用 一條 直線 來 描述 y 和 x 的 關系

當然 大家 會 發現 這個 直線 不 可能 會過 所有 的點

甚至於 可能 每 一個點 它 都 不過 是 吧

它 和 實際 的 情況 是 有 差別 的

比如說 第一個 房子

它 的 價格 在 這

但是 我 預測 你 價格 在 這

你 就 出現 了 一個 差別 叫 Δy₁

這 就是 你 預測 的 誤差 對 吧

第二個 房子 你 也 出現 了 一個 誤差 Δy₂

只不過 這個 誤差 是負 的 是 吧

第三個 房子 又 有 一個 誤差 叫 Δy₃

第四個 房子 又 有 一個 誤差 Δy₄

第五個 房子 又 有 一個 誤差 Δy₅

你 可能 有 很 多個 房子 都 出現 了 誤差

此時 我 要說 你 這個 預測 是 精準 的

什 麽 意思 呢

就是 要 讓 所有 的 誤差 綜合 來講 是 最小 的

這個 我們 管它 叫 損失 函數

它 的 損失 函數 叫 J

J 等於 什 麽 呢 等於 1/(2m)...

m 就是 有 多少 個數 據

1/(2m) 然後 加 和 每 一個 誤差 的 平方

說 誤差 為什 麽 要 平方 加 和 呢

因為 你 如果 直接 加 和 的話 正負 會 抵消

我 為 了 不讓 它 抵消 我 把 它給 平方 加 和

我 是 希望 這個 損失 函數 它 最小 對 不 對

我 也 可以 換 一個 寫法

說 這個 損失 函數 J 等於 什 麽 呢

等於 (1/(2m))Σ(yᵢ-(wxᵢ+b))²

我 引入 的 參數 是 w 和 b

我 希望 使得 這個 誤差 函數 最小

誤差 函數 最小 就 說明

這條 直線 最 符合 房價 的 價格 和 面積 關系

它 不 可能 完全符合

因為 每 一個 房價 它 可能 也 不能 滿足 同一個 函數

但 它 最 符合

我 就 希望 能夠 找到 這樣 的 w 和 這樣 的 b

但 問題 是 你 怎 麽 找到 這個 合適 的 參數 w 和 b

使得 損失 函數 最小 呢

上 過 大學 的 同學 都 知道

這 叫做 最小 二 乘法

這個 方法 其實 在 高斯 和 勒 讓 德 的 時代

人們 就 已經 弄清楚 了

只不過 有 兩個 參數 你好 算

如果 你 參數 非常 多

用 高斯 和 勒 讓 德 的 方法 就 會 非常 的 復 雜

於是 人們 就 想 我們 能 不能 有 一個 更好 的 方法

來 優化 這個 參數 呢

那 麽 這種 方法 就 稱 之 為 梯度 下降 算法

什 麽 意思 啊

我們 舉 個例 子

比如 我 想 優化 這個 參數 w

我 想 看看 w 取什 麽 值 能夠 讓 這個 損失 函數 最小

我 最 容易 能夠 預測 這個 房價 是 吧

怎 麽 做 呢

我們 首先 把 這個 參數 w 作為 橫坐標

然後 我們 再 把 這個 損失 函數

就是 你 的 預測 和 實際 的 差別 作為 縱 坐標

你 把 它 畫出 一個 圖像 來

你 會 發現 這個 圖像 有 可能 是 這個 樣子 的

我們 希望 找到 一個 w 讓 這個 損失 函數 最小

那 是 在 哪

那 是不是 在 這

我 就 希望 找到 這個 點

這個 就是 最好 的 w

但是 你 最 開始 給它 一個 w 的 時候

你 可能 給的 是 這個 數 w₁

所以 這個 值 它 並不等於 我們 最優 的 參數

於是 怎 麽 辦

我們 就 需要 用 梯度 下降 算法 了

這個 梯度 下降 算法 的 過程 是 這樣 的

首先 我們 求 一個 函數 叫做 ∂J/∂w

偏 導數 是 大學 的 一個 概念

大概 的 意思 就是說

你 這個 損失 函數 是 如何 隨著 w 而 變化 的

它 表示 的 是 這個 函數 的 傾斜 程度

如果 這個 點它 離 最低點 越遠 的話

它 的 斜率 就 越 大

傾斜 得 越 厲害

這個 數就會 越大 對 不 對

机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1) Can machines think like humans? Artificial Intelligence (1) Machine Learning and Neural Networks (1)

各位 同學 大家 好

我 是 李永樂 老師

前 一段時間 我 為 大家 介紹 了

創造 未來 的 新 技術 5G

有個 小朋友 就 跟 我 說

他 對 人工智能 的 話題 特別 感興趣

小 的 時候 就 特別 喜歡 看 科幻片

比如說 像 《 終結者 》

《 機械公敵 》 這樣 的 電影

但 他 始終 不 明白

為什 麽 機器 能夠 像 人 一樣 思考 呢

其實 人工智能 早就 不是 科學幻想 了

而是 已經 應用 到 生活 的 方方面面 了

比如說 為 了 應對 新冠 肺炎

很多 公司 都 加裝 了 人臉識別 系統

它 能夠 區分 你 是不是 這個 公司 的 員工

用 的 就是 人工智能

在 進行 新冠 肺炎 篩查 的 時候

肺部 影像 CT 是 一個 很 重要 的 指標

人工智能 就 可以 幫助 醫生

快速 判斷 這個 人 的 肺部 是不是 感染 了

同時 人工智能 也 可以 判斷 腫瘤 的 類型

當 我們 在 路上 開車 被 電子眼 抓拍 的 時候

人工智能 可以 幫助 我們 識別 車牌

除了 圖像識別 之外

人工智能 還 可以 用 在 語音 識別 上

比如說 各種 語音 助手 智能 音箱

都 用到 了 人工智能 的 原理

再 比如 我們 手機 中 的 美顏 軟件

短 視頻 平臺 的 推薦 系統

郵件系統 中 的 反垃圾 系統

其實 用到 的 都 是 人工智能

還有 自動 駕駛 智慧 工業

也 離不開 人工智能

今天 我們 就 來 聊 一聊 人工智能 的 相關 話題

希望 通過 今天 的 講解

大家 能夠 對 人工智能 和 神經網絡

有 一個 基本 的 認識

我們 首先 先來 聊一聊 人工智能 的 發展史

人工智能 其實 並 不是 一個 新 出現 的 事物

在 上古時代 不管 是 東方 還是 西方

其實 都 有 人造 人 的 神話

而 到 了 上 世紀 的 30 到 50 年代

隨著 計算機科學 這個 神經科學

還有 數學 的 發展

人工智能 才 第一次 進入 到 了 科學家 的 視野

在 1950 年 的 時候

英國 的 著名 的 這個 計算機 科學家 叫 圖靈

他 提出 了 一個 問題

他 說 機器 能夠 像 人類 一樣 思考 嗎

並且 為 了 這個 問題

圖靈 還 提出 了 一種 測試方法

也 就是 我們 今天 所說 的 圖靈 測試

圖靈 測試 是 說 我們 可以 讓 一個 人

通過 文字 的 方法 和 兩個 東西 進行 交流

這有 一個 裏邊 是 個人

另外 它 是 一個 電腦 是 個 機器 是 吧

他 通過 文字 的 方法 進行 交流

然後 能 不能 通過 一系列 的 提問 和 回答

讓 左邊 的 這個 人 判斷 哪 一個 才 是 真人

哪 一個 才 是 機器 呢

如果 經過 判斷

這個 人 沒有 辦法 區分 真人 和 機器 的話

就 說明 這個 機器 通過 了 圖靈 測試

圖靈 預測 到 2000 年 的 時候

將會 有 一臺 機器

它 能夠 使 30% 以上 的 人 相信 它 是 一個 人

這就 通過 了 圖靈 測試

圖靈 測試 每 一年 都 會 舉行

那 在 2014 年 的 時候

終於 有 一臺 機器 它 騙過 了 33% 的 人

讓 別人 相信 它 是 一個 小男孩

是 一個 13 歲 的 男孩

算是 通過 了 圖靈 測試

那 麽 計算機領域 的 最高 獎項 叫 圖靈獎

就是 以 圖靈 命名 的

它 被 稱 為 計算機領域 裏面 的 諾貝爾獎

那 麽 還有 一個 重要 的 年代 就是 1956 年

在 1956 年 的 時候

有 這個 兩位 計算機 科學家

一個 叫做 馬 文 · 明斯基

還有 一個 叫做 約翰 · 麥卡錫

那 麽 這 兩個 人 又 拽 上 了 這個 信息論 的 奠基者

著名 大佬 香農

他們 幾個 召集 了 一個 會議

這個 會議 就是 著名 的 達特茅斯 會議

達特茅斯 會議 上 主要 的 議題

就是 機器 是否 能夠 像 人類 一樣 思考 是 吧

並且 在 這次 會議 上 人們 發明 了 一個 詞

這個 詞 就是 人工智能

也 就是 我們 經常 聽說 到 的 AI 是 吧

從 那 一次 會議 開始

這個 人工智能 就 進入 了 第一次 大 發展 時代

而 這個 明斯基 和 麥卡錫

就 因為 他們 在 人工智能 領域 的 貢獻

而 獲得 了 圖靈獎 是 吧

香農 是 不 需要 圖靈獎 了

因為 香農 的 名字 被 用來 命名

通信 領域 的 諾貝爾獎

那 就是 香農 獎 是 吧

好 那 麽 人工智能 在歷史上

其實 也 經歷 了 幾次 漲落 有三漲 兩落

那 現在 我們 是 處於 第三次 大 發展 的 時代

這個 事件 的 起源 是 在 1997 年 的 時候

1997 年 那 段時間

這個 人工智能 陷入 了 低谷

不過 那 一段時間 出 了 一個 事

就是 IBM 公司 造 了 一個 機器人

這個 機器人 名字 叫做 深藍

它 幹 了 什 麽 事 想必 很多 人還 記得 吧

就是 它 下象棋

結果 戰勝 了 12 年 的 國際象棋 冠軍 卡斯帕羅夫

因為 深藍 戰勝 了 卡斯帕羅夫

所以 人工智能 再次 復 蘇 了

當然 這 一次 的 人工智能 復 蘇 和 發展

是 得益於 最近 幾十年 計算機科學

以及 各種 算法 的 改進

尤其 是 在 人工智能 算法 領域

湧 現出 很多 的 靈魂 人物

比如說 像 加拿大多倫多大學 的 這個 辛頓 是 吧

他 的 著名 的 貢獻 就是 將 反向 傳播 算法 BP

引入 到 人工智能 當中

這個 我們 後面 會 介紹

還有 叫 紐約大學 的 楊立 坤

他 的 這個 著名 的 貢獻 就是 卷積 神經網絡

這個 我們 也 會 介紹

還有 比如說

像 加拿大 的 這個 蒙特利爾 大學 的 這個 本 吉奧

他們 三個 也 因為 在 人工智能 領域 的 貢獻

獲得 了 2018 年 的 圖靈獎

經過 幾十年 的 發展

這個 人工智能 已經 有 了 長足 的 進步

在 特定 領域 比如說 像 圖像識別 領域

人工智能 甚至 已經 超過 了 人類

而 在 機器翻譯 和 語音 識別 方面

人工智能 也 已經 有 了 長足 的 應用

比如 現在 我們 上網

看到 一個 網頁 英文 的 我們 看不懂

看到 一個 網頁 英文 的 我們 看不懂

我們 可以 右鍵 選擇 翻譯成 中文

它 就 能 直接 把 網頁 給 我們 翻譯 過來

我們 出國 旅遊

遇到 外國人 我們 不會 說話 怎 麽 辦

我們 用 一個 手機軟件 就 可以 了

比如說 我 遇到 一個 英國人

我 想 問問 他

我 說 這個 英國 的 倫敦 火車站 怎 麽 走

你 看 我 跟 你 說

請問 倫敦 火車站 怎 麽 走

How can I get to the London railway station

它 就 翻譯 過來 了

比如 我 去 韓國 旅遊 是 吧

我 去 韓國 旅遊

請問 最近 的 廁所 在 哪裏

가장 가까운 화장실이 어디예요 ?

你 看 它 就 可以 翻譯 過來 是 吧

當然 了 外國人 說話

我們 也 可以 通過 這個 軟件 翻譯 回來

這 其實 都 是 人工智能 的 一個 應用

那 麽 計算機 是 如何 做到 這 一點 呢

這 其實 本質 上 是 一個 數學 問題

咱們 來 一步 一步 給 大家 做 一個 解釋

首先 我們 需要 大家 了解 一個 概念

叫做 梯度 下降 算法

梯度 下降 是 人工智能 最 核心 的 一個 算法 是 吧

這個 梯度 下降 算法

可以 幫助 我們 去 處理 分類 問題 還有 回歸 問題

我們 以回 歸 問題 為例 吧

比如說 我們 想 讓 人工智能 幫 我們 幹 一件 事

就是 預測 房價

咱們 說 這個 預測 房價

就是 你給 我 一個 房子

然後 機器 判斷 出來 這 房子 大概 值 多少錢 是 吧

那 怎 麽 做 呢

你 首先 得給 我 一些 數據

你 告訴 我 說 房價 取決於 什 麽 呢

我們 知道 房價 取決於 它 是 城市 的 還是 鄉村 的

它 面積 大小 樓層

它 的 小區 環境 等等 一系列 因素 對 吧

我們 先 簡化 一下

比如說 這個 房價 我們 認為

它 就 取決於 一個 因素 就是 面積

我們 就 簡單 一點

面積 我們 叫 它 x

那 麽 縱 坐標 這個 是 房屋 的 價格

價格 叫做 y

你給 了 我 一大堆 的 數據

每 一個 房屋 的 價格 對應 著 它 的 這個 面積

給了 我 這 麽 一個 數據

比如說 有 m 個數 據

我們 把 這 m 個數 據 我 放在 這張 圖上

大概 是 這樣

比如說 這個 房子 在 這

這個 房子 價格 是 這樣

這個 房子 是 這樣

這 房子 是 這樣 是 吧

大概 來講 是 面積 越大 的 房子 價格 越高

當然 它會 有 一定 的 起伏

現在 我 就問 我 說 你 能 不能 告訴 我 一個 函數

這個 價格 和 面積 之間 到底 是 什 麽 關系 呢

當然 最 簡單 的 函數 就是 直線

所以 我們 就 可以 說 我們 假設 這個 關系

就是 y=wx+b

我 引入 了 兩個 參數

大家 看 這 一個 參數 是 w

相當於 是 斜率

還有 一個 參數 是 b 是 截距

於是 我們 就 用 一條 直線 來 描述 y 和 x 的 關系

當然 大家 會 發現 這個 直線 不 可能 會過 所有 的點

甚至於 可能 每 一個點 它 都 不過 是 吧

它 和 實際 的 情況 是 有 差別 的

比如說 第一個 房子

它 的 價格 在 這

但是 我 預測 你 價格 在 這

你 就 出現 了 一個 差別 叫 Δy₁

這 就是 你 預測 的 誤差 對 吧

第二個 房子 你 也 出現 了 一個 誤差 Δy₂

只不過 這個 誤差 是負 的 是 吧

第三個 房子 又 有 一個 誤差 叫 Δy₃

第四個 房子 又 有 一個 誤差 Δy₄

第五個 房子 又 有 一個 誤差 Δy₅

你 可能 有 很 多個 房子 都 出現 了 誤差

此時 我 要說 你 這個 預測 是 精準 的

什 麽 意思 呢

就是 要 讓 所有 的 誤差 綜合 來講 是 最小 的

這個 我們 管它 叫 損失 函數

它 的 損失 函數 叫 J

J 等於 什 麽 呢 等於 1/(2m)...

m 就是 有 多少 個數 據

1/(2m) 然後 加 和 每 一個 誤差 的 平方

說 誤差 為什 麽 要 平方 加 和 呢

因為 你 如果 直接 加 和 的話 正負 會 抵消

我 為 了 不讓 它 抵消 我 把 它給 平方 加 和

我 是 希望 這個 損失 函數 它 最小 對 不 對

我 也 可以 換 一個 寫法

說 這個 損失 函數 J 等於 什 麽 呢

等於 (1/(2m))Σ(yᵢ-(wxᵢ+b))²

我 引入 的 參數 是 w 和 b

我 希望 使得 這個 誤差 函數 最小

誤差 函數 最小 就 說明

這條 直線 最 符合 房價 的 價格 和 面積 關系

它 不 可能 完全符合

因為 每 一個 房價 它 可能 也 不能 滿足 同一個 函數

但 它 最 符合

我 就 希望 能夠 找到 這樣 的 w 和 這樣 的 b

但 問題 是 你 怎 麽 找到 這個 合適 的 參數 w 和 b

使得 損失 函數 最小 呢

上 過 大學 的 同學 都 知道

這 叫做 最小 二 乘法

這個 方法 其實 在 高斯 和 勒 讓 德 的 時代

人們 就 已經 弄清楚 了

只不過 有 兩個 參數 你好 算

如果 你 參數 非常 多

用 高斯 和 勒 讓 德 的 方法 就 會 非常 的 復 雜

於是 人們 就 想 我們 能 不能 有 一個 更好 的 方法

來 優化 這個 參數 呢

那 麽 這種 方法 就 稱 之 為 梯度 下降 算法

什 麽 意思 啊

我們 舉 個例 子

比如 我 想 優化 這個 參數 w

我 想 看看 w 取什 麽 值 能夠 讓 這個 損失 函數 最小

我 最 容易 能夠 預測 這個 房價 是 吧

怎 麽 做 呢

我們 首先 把 這個 參數 w 作為 橫坐標

然後 我們 再 把 這個 損失 函數

就是 你 的 預測 和 實際 的 差別 作為 縱 坐標

你 把 它 畫出 一個 圖像 來

你 會 發現 這個 圖像 有 可能 是 這個 樣子 的

我們 希望 找到 一個 w 讓 這個 損失 函數 最小

那 是 在 哪

那 是不是 在 這

我 就 希望 找到 這個 點

這個 就是 最好 的 w

但是 你 最 開始 給它 一個 w 的 時候

你 可能 給的 是 這個 數 w₁

所以 這個 值 它 並不等於 我們 最優 的 參數

於是 怎 麽 辦

我們 就 需要 用 梯度 下降 算法 了

這個 梯度 下降 算法 的 過程 是 這樣 的

首先 我們 求 一個 函數 叫做 ∂J/∂w

偏 導數 是 大學 的 一個 概念

大概 的 意思 就是說

你 這個 損失 函數 是 如何 隨著 w 而 變化 的

它 表示 的 是 這個 函數 的 傾斜 程度

如果 這個 點它 離 最低點 越遠 的話

它 的 斜率 就 越 大

傾斜 得 越 厲害

這個 數就會 越大 對 不 對