机器 能 像 人 一样 思考 吗 ?人工智能 (一 )机器 学习 和 神经网络 (1)
各位 同學 大家 好
我 是 李永樂 老師
前 一段時間 我 為 大家 介紹 了
創造 未來 的 新 技術 5G
有個 小朋友 就 跟 我 說
他 對 人工智能 的 話題 特別 感興趣
小 的 時候 就 特別 喜歡 看 科幻片
比如說 像 《 終結者 》
《 機械公敵 》 這樣 的 電影
但 他 始終 不 明白
為什 麽 機器 能夠 像 人 一樣 思考 呢
其實 人工智能 早就 不是 科學幻想 了
而是 已經 應用 到 生活 的 方方面面 了
比如說 為 了 應對 新冠 肺炎
很多 公司 都 加裝 了 人臉識別 系統
它 能夠 區分 你 是不是 這個 公司 的 員工
用 的 就是 人工智能
在 進行 新冠 肺炎 篩查 的 時候
肺部 影像 CT 是 一個 很 重要 的 指標
人工智能 就 可以 幫助 醫生
快速 判斷 這個 人 的 肺部 是不是 感染 了
同時 人工智能 也 可以 判斷 腫瘤 的 類型
當 我們 在 路上 開車 被 電子眼 抓拍 的 時候
人工智能 可以 幫助 我們 識別 車牌
除了 圖像識別 之外
人工智能 還 可以 用 在 語音 識別 上
比如說 各種 語音 助手 智能 音箱
都 用到 了 人工智能 的 原理
再 比如 我們 手機 中 的 美顏 軟件
短 視頻 平臺 的 推薦 系統
郵件系統 中 的 反垃圾 系統
其實 用到 的 都 是 人工智能
還有 自動 駕駛 智慧 工業
也 離不開 人工智能
今天 我們 就 來 聊 一聊 人工智能 的 相關 話題
希望 通過 今天 的 講解
大家 能夠 對 人工智能 和 神經網絡
有 一個 基本 的 認識
我們 首先 先來 聊一聊 人工智能 的 發展史
人工智能 其實 並 不是 一個 新 出現 的 事物
在 上古時代 不管 是 東方 還是 西方
其實 都 有 人造 人 的 神話
而 到 了 上 世紀 的 30 到 50 年代
隨著 計算機科學 這個 神經科學
還有 數學 的 發展
人工智能 才 第一次 進入 到 了 科學家 的 視野
在 1950 年 的 時候
英國 的 著名 的 這個 計算機 科學家 叫 圖靈
他 提出 了 一個 問題
他 說 機器 能夠 像 人類 一樣 思考 嗎
並且 為 了 這個 問題
圖靈 還 提出 了 一種 測試方法
也 就是 我們 今天 所說 的 圖靈 測試
圖靈 測試 是 說 我們 可以 讓 一個 人
通過 文字 的 方法 和 兩個 東西 進行 交流
這有 一個 裏邊 是 個人
另外 它 是 一個 電腦 是 個 機器 是 吧
他 通過 文字 的 方法 進行 交流
然後 能 不能 通過 一系列 的 提問 和 回答
讓 左邊 的 這個 人 判斷 哪 一個 才 是 真人
哪 一個 才 是 機器 呢
如果 經過 判斷
這個 人 沒有 辦法 區分 真人 和 機器 的話
就 說明 這個 機器 通過 了 圖靈 測試
圖靈 預測 到 2000 年 的 時候
將會 有 一臺 機器
它 能夠 使 30% 以上 的 人 相信 它 是 一個 人
這就 通過 了 圖靈 測試
圖靈 測試 每 一年 都 會 舉行
那 在 2014 年 的 時候
終於 有 一臺 機器 它 騙過 了 33% 的 人
讓 別人 相信 它 是 一個 小男孩
是 一個 13 歲 的 男孩
算是 通過 了 圖靈 測試
那 麽 計算機領域 的 最高 獎項 叫 圖靈獎
就是 以 圖靈 命名 的
它 被 稱 為 計算機領域 裏面 的 諾貝爾獎
那 麽 還有 一個 重要 的 年代 就是 1956 年
在 1956 年 的 時候
有 這個 兩位 計算機 科學家
一個 叫做 馬 文 · 明斯基
還有 一個 叫做 約翰 · 麥卡錫
那 麽 這 兩個 人 又 拽 上 了 這個 信息論 的 奠基者
著名 大佬 香農
他們 幾個 召集 了 一個 會議
這個 會議 就是 著名 的 達特茅斯 會議
達特茅斯 會議 上 主要 的 議題
就是 機器 是否 能夠 像 人類 一樣 思考 是 吧
並且 在 這次 會議 上 人們 發明 了 一個 詞
這個 詞 就是 人工智能
也 就是 我們 經常 聽說 到 的 AI 是 吧
從 那 一次 會議 開始
這個 人工智能 就 進入 了 第一次 大 發展 時代
而 這個 明斯基 和 麥卡錫
就 因為 他們 在 人工智能 領域 的 貢獻
而 獲得 了 圖靈獎 是 吧
香農 是 不 需要 圖靈獎 了
因為 香農 的 名字 被 用來 命名
通信 領域 的 諾貝爾獎
那 就是 香農 獎 是 吧
好 那 麽 人工智能 在歷史上
其實 也 經歷 了 幾次 漲落 有三漲 兩落
那 現在 我們 是 處於 第三次 大 發展 的 時代
這個 事件 的 起源 是 在 1997 年 的 時候
1997 年 那 段時間
這個 人工智能 陷入 了 低谷
不過 那 一段時間 出 了 一個 事
就是 IBM 公司 造 了 一個 機器人
這個 機器人 名字 叫做 深藍
它 幹 了 什 麽 事 想必 很多 人還 記得 吧
就是 它 下象棋
結果 戰勝 了 12 年 的 國際象棋 冠軍 卡斯帕羅夫
因為 深藍 戰勝 了 卡斯帕羅夫
所以 人工智能 再次 復 蘇 了
當然 這 一次 的 人工智能 復 蘇 和 發展
是 得益於 最近 幾十年 計算機科學
以及 各種 算法 的 改進
尤其 是 在 人工智能 算法 領域
湧 現出 很多 的 靈魂 人物
比如說 像 加拿大多倫多大學 的 這個 辛頓 是 吧
他 的 著名 的 貢獻 就是 將 反向 傳播 算法 BP
引入 到 人工智能 當中
這個 我們 後面 會 介紹
還有 叫 紐約大學 的 楊立 坤
他 的 這個 著名 的 貢獻 就是 卷積 神經網絡
這個 我們 也 會 介紹
還有 比如說
像 加拿大 的 這個 蒙特利爾 大學 的 這個 本 吉奧
他們 三個 也 因為 在 人工智能 領域 的 貢獻
獲得 了 2018 年 的 圖靈獎
經過 幾十年 的 發展
這個 人工智能 已經 有 了 長足 的 進步
在 特定 領域 比如說 像 圖像識別 領域
人工智能 甚至 已經 超過 了 人類
而 在 機器翻譯 和 語音 識別 方面
人工智能 也 已經 有 了 長足 的 應用
比如 現在 我們 上網
看到 一個 網頁 英文 的 我們 看不懂
看到 一個 網頁 英文 的 我們 看不懂
我們 可以 右鍵 選擇 翻譯成 中文
它 就 能 直接 把 網頁 給 我們 翻譯 過來
我們 出國 旅遊
遇到 外國人 我們 不會 說話 怎 麽 辦
我們 用 一個 手機軟件 就 可以 了
比如說 我 遇到 一個 英國人
我 想 問問 他
我 說 這個 英國 的 倫敦 火車站 怎 麽 走
你 看 我 跟 你 說
請問 倫敦 火車站 怎 麽 走
How can I get to the London railway station
它 就 翻譯 過來 了
比如 我 去 韓國 旅遊 是 吧
我 去 韓國 旅遊
請問 最近 的 廁所 在 哪裏
가장 가까운 화장실이 어디예요 ?
你 看 它 就 可以 翻譯 過來 是 吧
當然 了 外國人 說話
我們 也 可以 通過 這個 軟件 翻譯 回來
這 其實 都 是 人工智能 的 一個 應用
那 麽 計算機 是 如何 做到 這 一點 呢
這 其實 本質 上 是 一個 數學 問題
咱們 來 一步 一步 給 大家 做 一個 解釋
首先 我們 需要 大家 了解 一個 概念
叫做 梯度 下降 算法
梯度 下降 是 人工智能 最 核心 的 一個 算法 是 吧
這個 梯度 下降 算法
可以 幫助 我們 去 處理 分類 問題 還有 回歸 問題
我們 以回 歸 問題 為例 吧
比如說 我們 想 讓 人工智能 幫 我們 幹 一件 事
就是 預測 房價
咱們 說 這個 預測 房價
就是 你給 我 一個 房子
然後 機器 判斷 出來 這 房子 大概 值 多少錢 是 吧
那 怎 麽 做 呢
你 首先 得給 我 一些 數據
你 告訴 我 說 房價 取決於 什 麽 呢
我們 知道 房價 取決於 它 是 城市 的 還是 鄉村 的
它 面積 大小 樓層
它 的 小區 環境 等等 一系列 因素 對 吧
我們 先 簡化 一下
比如說 這個 房價 我們 認為
它 就 取決於 一個 因素 就是 面積
我們 就 簡單 一點
面積 我們 叫 它 x
那 麽 縱 坐標 這個 是 房屋 的 價格
價格 叫做 y
你給 了 我 一大堆 的 數據
每 一個 房屋 的 價格 對應 著 它 的 這個 面積
給了 我 這 麽 一個 數據
比如說 有 m 個數 據
我們 把 這 m 個數 據 我 放在 這張 圖上
大概 是 這樣
比如說 這個 房子 在 這
這個 房子 價格 是 這樣
這個 房子 是 這樣
這 房子 是 這樣 是 吧
大概 來講 是 面積 越大 的 房子 價格 越高
當然 它會 有 一定 的 起伏
現在 我 就問 我 說 你 能 不能 告訴 我 一個 函數
這個 價格 和 面積 之間 到底 是 什 麽 關系 呢
當然 最 簡單 的 函數 就是 直線
所以 我們 就 可以 說 我們 假設 這個 關系
就是 y=wx+b
我 引入 了 兩個 參數
大家 看 這 一個 參數 是 w
相當於 是 斜率
還有 一個 參數 是 b 是 截距
於是 我們 就 用 一條 直線 來 描述 y 和 x 的 關系
當然 大家 會 發現 這個 直線 不 可能 會過 所有 的點
甚至於 可能 每 一個點 它 都 不過 是 吧
它 和 實際 的 情況 是 有 差別 的
比如說 第一個 房子
它 的 價格 在 這
但是 我 預測 你 價格 在 這
你 就 出現 了 一個 差別 叫 Δy₁
這 就是 你 預測 的 誤差 對 吧
第二個 房子 你 也 出現 了 一個 誤差 Δy₂
只不過 這個 誤差 是負 的 是 吧
第三個 房子 又 有 一個 誤差 叫 Δy₃
第四個 房子 又 有 一個 誤差 Δy₄
第五個 房子 又 有 一個 誤差 Δy₅
你 可能 有 很 多個 房子 都 出現 了 誤差
此時 我 要說 你 這個 預測 是 精準 的
什 麽 意思 呢
就是 要 讓 所有 的 誤差 綜合 來講 是 最小 的
這個 我們 管它 叫 損失 函數
它 的 損失 函數 叫 J
J 等於 什 麽 呢 等於 1/(2m)...
m 就是 有 多少 個數 據
1/(2m) 然後 加 和 每 一個 誤差 的 平方
說 誤差 為什 麽 要 平方 加 和 呢
因為 你 如果 直接 加 和 的話 正負 會 抵消
我 為 了 不讓 它 抵消 我 把 它給 平方 加 和
我 是 希望 這個 損失 函數 它 最小 對 不 對
我 也 可以 換 一個 寫法
說 這個 損失 函數 J 等於 什 麽 呢
等於 (1/(2m))Σ(yᵢ-(wxᵢ+b))²
我 引入 的 參數 是 w 和 b
我 希望 使得 這個 誤差 函數 最小
誤差 函數 最小 就 說明
這條 直線 最 符合 房價 的 價格 和 面積 關系
它 不 可能 完全符合
因為 每 一個 房價 它 可能 也 不能 滿足 同一個 函數
但 它 最 符合
我 就 希望 能夠 找到 這樣 的 w 和 這樣 的 b
但 問題 是 你 怎 麽 找到 這個 合適 的 參數 w 和 b
使得 損失 函數 最小 呢
上 過 大學 的 同學 都 知道
這 叫做 最小 二 乘法
這個 方法 其實 在 高斯 和 勒 讓 德 的 時代
人們 就 已經 弄清楚 了
只不過 有 兩個 參數 你好 算
如果 你 參數 非常 多
用 高斯 和 勒 讓 德 的 方法 就 會 非常 的 復 雜
於是 人們 就 想 我們 能 不能 有 一個 更好 的 方法
來 優化 這個 參數 呢
那 麽 這種 方法 就 稱 之 為 梯度 下降 算法
什 麽 意思 啊
我們 舉 個例 子
比如 我 想 優化 這個 參數 w
我 想 看看 w 取什 麽 值 能夠 讓 這個 損失 函數 最小
我 最 容易 能夠 預測 這個 房價 是 吧
怎 麽 做 呢
我們 首先 把 這個 參數 w 作為 橫坐標
然後 我們 再 把 這個 損失 函數
就是 你 的 預測 和 實際 的 差別 作為 縱 坐標
你 把 它 畫出 一個 圖像 來
你 會 發現 這個 圖像 有 可能 是 這個 樣子 的
我們 希望 找到 一個 w 讓 這個 損失 函數 最小
那 是 在 哪
那 是不是 在 這
我 就 希望 找到 這個 點
這個 就是 最好 的 w
但是 你 最 開始 給它 一個 w 的 時候
你 可能 給的 是 這個 數 w₁
所以 這個 值 它 並不等於 我們 最優 的 參數
於是 怎 麽 辦
我們 就 需要 用 梯度 下降 算法 了
這個 梯度 下降 算法 的 過程 是 這樣 的
首先 我們 求 一個 函數 叫做 ∂J/∂w
偏 導數 是 大學 的 一個 概念
大概 的 意思 就是說
你 這個 損失 函數 是 如何 隨著 w 而 變化 的
它 表示 的 是 這個 函數 的 傾斜 程度
如果 這個 點它 離 最低點 越遠 的話
它 的 斜率 就 越 大
傾斜 得 越 厲害
這個 數就會 越大 對 不 對