人脸识别 啥 原理 ?人工智能 (二 )卷积 神经网络 (2)
它 有 對 吧
這個 2 這個 3 就 說明 它 已經 有 了
這 兩個 0 其實 意義 不是 很大
所以 我們 可以 進行 簡化
把 這個 特征 圖中 有 特征 的 那個 部分 放大
沒有 特征 的 我 就 不管 了
我們 可以 采用 一個 最大 池化 的 方法
也就是說
把 這 4 個數 裏邊 最大 的 數填 在 這個 格子 中
這個 4 個數 2 0 0 3 對 吧
它 最大 的 數字 應該 是 幾 啊
應該 是 3
所以 我 就 把 3 填到 這個 格子 裏 填到 這 格子 裏
然後 往 後邊 看 這 4 個數 中 最大 的 數字 是 幾
是 1 我 把 這 填過來
然後 我們 再 看 這 4 個數 字
最大 的 數字 是 1 對 吧
這 4 個數 最大 數字 是 3
這 2 個 1 然後 這 2 個 1
這 2 個 1 這個 2 是不是
好 於是 我們 就 把 這個 特征 圖
變成 了 一個 比較 小 的 特征 圖
但 這個 比較 小 的 特征 圖
其實 依然 保留 了 原來 特征 圖 的 很 重要 的 信息
這個 信息 就是 右下方 的 線條
大約 在 這樣 的 位置 上 對 不 對
好 就 說完 了
池化 過程 結束 了 之後
我們 還要 進行 激活
大家 還 記得 Sigmoid 函數 嗎
我們 上次 講過 的 是 吧
這個 函數 的 表達式
叫做 1/(1+e⁻ˣ)
函數 圖像 長 的 樣子
大概 是 這個 樣子 的
自變量 是 在負 無窮 到 正 無窮 之間
而 函數 值 是 在 0 到 1 之間
自變量 越大 函數 值越 接 近於 1
自變量 越小 函數 值越 接 近於 0
函數 值為 1 就 說明 它 被 激活 了
會 向下 遊 傳遞 信號 是 吧
函數 值 是 0 就 說明 它 不 向下 遊 傳遞 信號
上次 我們 講過 這個 問題
那 麽 我們 需要 對 這個 池化 之後 的 結果 做 激活
於是 就 會 把 這個 新 的 特征 圖
變到 一個 0 到 1 之間 的 這 麽 一個 特征 圖 是 吧
變到 0 到 1 之間
這 數字 是 0.95 0.95 0.88
其他 的 都 是 0.73 0.73
這樣 一張 圖 才 依然 代表 了 圖像 的 特征
就是 數字 越接 近於 1
就 說明 這個 地方 越 滿足 卷積 核 的 特性
就是 有 一個 往 右下方 的 線條
所以 這個 地方 這個 地方
就 有 往右 下 的 線條
這個 地方 也 比較 有
其它 地方 就 不太有 對 不 對
這 就是 一個 卷積 池化 和 激活 的 過程
用 數學 的 方法 提取 了 特征
那有 同學 可能 會問
你 這個 卷積 核是 怎 麽 選 的 呢
最 開始 的 卷積 核 可能 是 人 為 設定 的
但是 後來 在 機器 學習 的 過程 中
它會 根據 自己 的 數據 去 反向 調節 這個 卷積 核
跟 我們 上次 講的
利用 訓練 的 方法 去 調節 參數 沒有 什 麽 區別
它 最終 會 找到 那個 最合適 的 卷積 核
而且 我們 剛才 說過 卷積 核有 好幾個
它 可能 不是 一個 對 不 對
所以 一幅 圖片 它 經過 一次 ...
比如說 這是 一幅 圖 上面 寫 了 個 X
這幅 圖片 經過 一次 卷積 之後
它 有 可能 會 有 三個 卷積 核
如果 有 三個 卷積 核 的話
它 就 會 變出 一個三維 的 這樣 的 一個 圖片 來
變成 一個三維 的 圖片
它 的 這個 x 和 y
跟 原來 的 這個 x 和 y 是 一致 的
那 麽 還有 一個 高 z 方向
這個 z 方向 就 表示 每 一個 核
會 對應 出 一張 特征 圖來
這 三張 特征 圖 挪到 一塊
這 就是 一個三維 的 圖像 對 不 對
這 就是 一次 卷積 之後 的 結果
有 幾個 卷積 核 你 就 會 有 幾張 特征 圖
這 幾張 特征 圖 挪到 一塊
就 變成 了 一個三維 立體 的 這 麽 一個 圖形 是 吧
卷積 之後 我們 要 進行 池化
而剛 才 我們 說過 了
這個 池化 和 激活 的 這個 過程
實際上 是 可以 把 這個 數據 變小 的 對 不 對
它 就 會 變成 比較 小 的 這 三張 圖
但是 你 一次 卷積 和 池化
可能 有些 問題 處理 不了
所以 它 有 可能 會 進行 二次 卷積
在 二次 進行 卷積 的 時候
每 一個 卷積 核 就 必須 得 是 三維 的 了
因為 你 原來 這張 圖 變成 三維 的 了 對 不 對
比如說 第二次 卷積 的 時候 你 有 四個 核
剛才 卷積 是 三個 核
所以 變成 了 一個三層 的 這 麽 一個 圖
如果 第二次 卷積 你 有 四個 核
你 要 註 意 每 一個 卷積 核 現在 都 是 三維 的
用 這個 三維 的 核 和 這個 圖片 進行 內積
內積 完 了 之後 就是 一個 特征 圖
但 你 有 四個 核
所以 出來 之後 有 幾張 圖
有 四張 圖 是 吧
出來 了 之後
你 會 變成 四張 圖
然後 你 繼續 進行 卷積 池化 等等
激活 這樣 的 一個 過程
所以 經過 多次 卷積 和 多次 池化 之後
你 就 可以 找到 很多很多 的 特征
比如說 這個 圖像 的 水平 線條 豎直 線條
傾斜 的 線條 是 吧
它 的 輪廓 它 的 顏色 特征 等等
我們 把 這些 足夠 多 的 信息
再 接入 這個 全 連接 網絡 進行 訓練
最後 我們 就 可以 判斷 這個 圖像 到底 是 什 麽 了
這 就是 一個 卷積 神經網絡 的 全貌
怎 麽 樣
科學家 的 設計 是不是 非常 讓 人 驚嘆
幾乎 完美 地 模擬 了 人類 的 認知 過程
我們 小 的 時候 媽媽 帶 我們 去 公園 玩
看到 楊樹 和 柳樹
告訴 我們 這是 楊樹 那 是 柳樹
經過 一段時間 的 訓練
我們 幾乎 可以 一眼 地 分辨 出 楊樹 和 柳樹
雖然 我們 並不知道 大腦 是 如何 運作 的 對 吧
同樣 道理 我們 把 一大堆 數據 給到 人工智能
然後 人工智能 通過 一定 的 方法
去 調整 自己 的 卷積 核 和 參數
最終 就 可以 分辨 出來
每 一種 不同 的 物體 到底 是 什 麽 了
雖然 我們 並不知道
它 是 如何 去 設計 卷積 核 以及 這些 參數 的
回想 一下
在 我們 通過 人臉識別 機器 的 時候
有時候 我們 戴著 口罩 它 也 能 認出 我們 來
為什 麽 呢
因為 它 已經 提取 了 足夠 多 的 特征 了
不過 在 前 幾年
人工智能 還 不是 那 麽 完美 的 時候
我 把 眼鏡 摘掉
我 的 手機 就 認不出來 是 我 了
那一刻 我 感覺 我 可能 是 超人
我們 剛才 花 了 很多 的 時間 去講 人工智能 的 算法
其實 人工智能 有 三個 核心 的 概念
一個 叫做 算法
還有 一個 叫做 數據
還有 一個 叫做 算力
這 三個 是 缺一不可 的
算法 咱們 介紹 完 了
咱們 來說 一下 數據 吧
俗話說 巧婦 難為 無米之炊 是 吧
如果 你 不能 給 這個 機器 大量 的 數據 的話
它連 一張 簡單 的 圖 它 也 不 認識
其實 我們 每 一個 人
都 可能 給 人工智能 系統 貢獻 過 數據
比如說 你 曾經 填過 驗證碼 吧
有 的 時候 驗證碼 是 個數 字
有 的 時候 驗證碼 是 讓 你 找 一個 機構 或者 東西
你 有 可能 認為 是 網站 在 刁難 你
但是 也 有 可能
它 是 利用 你 這個 數據 進行 機器 學習 的
你 再 比如說 你 在 網絡 上 搜索 一些 關鍵詞
那 麽 它 就 可能 會 把 你 這些 習慣 進行 歸類
然後 發現 兩個 關鍵詞 之間
可能 會 存在 一定 的 關系 是 吧
這 就是 所謂 的 數據
人工智能 還有 一個 重要 基礎 那 就是 算力
比如說 剛才 我們 做 的 這種 卷積 神經網絡 的 算法
其實 每 一種 計算 並不 復 雜
那 就是 加法 和 乘法
但是 就是 運算量 特別 大
比如說 有 一張 圖
這個 是 800x600 的 一張 圖片
因為 它 是 RGB 三種 顏色 的
所以 還要 乘個 3 三種 顏色
那 麽 一共 有 多少 個 像素點 呢
有 144 萬個 對 吧
有 144 萬個 像素點
那 麽 如果 我們 用 一個 3x3x3
為什 麽 還要 乘個 3
因為 它 不是 三層 嘛
RGB 三層 紅綠藍 三種 顏色 是 吧
如果 用 這樣 的 一個 卷積 核去 做 一個 卷積 的話
大概 需要 多少次 加法 呢
大概 需要 1300 萬次 的 乘法
還有 大約 1200 萬次 的 加法 是 吧
它 雖然 只是 簡單 的 加法 和 乘法
但是 它 運算 次數 特別 多
而且 這 僅僅 是 用 一個 卷積 核
對 一個 簡單 圖片 進行 處理
實際上 你 在 進行 訓練 的 過程 中
你 要 有 成千上萬 張 圖片
進行 成千上萬 次 的 卷積 處理 對 不 對
所以 這個 運算量 就 非常 大
所以 幾年 以前
那個 美顏 軟件 它 是 不能 實時處理 的
你 必須 把 圖片 拍下來 它 才 能夠 處理
但是 現在 我們 算力 提高 了
就 可以 實時處理 這個 美顏 的 過程 了
人們 用什 麽 來 進行 計算 呢
那 當然 是 用 芯片 了 對 吧 處理器
比如說 人們 可以 利用 CPU 來 進行 處理
CPU 叫什 麽 叫 中央處理器
中央處理器 它 的 特征 是 什 麽 呢
就是 它 的 通用性 特別 強
通用性 強 它什 麽 都 能算 是不是
但是 它 並行 能力差
並行 能力差 它 只能 串行
什 麽 叫 串行 呢
就是 你 算 完 了 第一道 題 再算 第二道 題
算 完 第二道 題 再算 第三道 題
你 不能 同時 計算 一大堆 的 問題 是 吧
這 就是 CPU 的 一個 缺點
後來 人們 發現 了 一種
比 CPU 更 適合 算 人工智能 的 東西
是 什 麽 呢
就 叫做 GPU
GPU 叫做 圖形 處理器
圖形 處理器 它 最 開始 是 用來 幹嘛 的 呢
就是 用來 這個
把 計算機 中 的 這個 圖像 能夠 投影 到 這個 屏幕 上
稱之為 渲染 是 吧
這種 處理器 的 代表 廠商 就是 英 偉達 嘛
開始 的 時候 它 就是 用 這個 GPU 來 處理 圖形
來 做 一些 遊戲機 這些 東西
結果 後來 發現
這個 東西 可以 用來 處理 人工智能 是 吧
所以 這個 英 偉達 就 一下子 流行起來 了
它 的 特點 是 什 麽 呢
就是 它 的 專用性 強
專用性 強的 意思 就是說 它 不 像 這個 CPU
CPU 是 一個 教授 什 麽 都 能算 是 吧
GPU 是 小學生
它 就 會算 加法 和 乘法
但是 它 的 並行 能力 強
並行 力強 的 意思 就是
它 不是 一個 小學生
它 是 一萬個 小學生
它 可以 同時 算 一大堆 的 加法 和 乘法 是不是
所以 這個 GPU 算 人工智能 的 問題
它 比 CPU 就要 快 一些
那 現在 我們 還有 了 更 快 的 這個 人工智能 處理器
叫做 NPU
NPU 它 的 名字 叫做 神經網絡 處理器
神經網絡 處理器
你 聽 這 名字 就 知道
它 是 用來 專門 計算 人工智能 的 處理器
它 的 專用性 和 並行 能力 都 比 GPU 更強 一些
就 好像 說 NPU 不光 是 一個 萬個 小學生
這 一萬個 小學生 會算 加法 乘法
而且 還有 超能力
它 可以 同時 計算 很多 道 加法 和 乘法 是 吧
什 麽 意思 呢
舉 個例 子
比如說 華為 出 了 一個 芯片
叫做 華為昇騰 910 AI 處理器
這個 處理器 就是 華為 制造 的
這個 NPU 的 神經網絡 處理器
它 有 什 麽 特征 呢
就是 它 有 32 個 AI 的 核 32 個 核
每 一個 核 都 是 一個 立方體
我們 稱之為 Cube
這個 Cube 它 是 一個 長寬 高
都 是 16 的 這樣 的 一個 矩陣
當它 進行 卷積 計算 的 時候
它會 同時 計算 16×16×16
等於 4096 個數 字 的 加法 和 乘法
也 就是 它 可以 同時 處理 4096 個數 據 的 內積
把 它們 對應 元素 相乘
然後 再 把 它們 加 起來
一次 就 能夠 算 出來
而 CPU 要算 多少次 啊
CPU 要算 的話 只能 一個 一個 算
大約 要算 1 萬次 是 吧
也 因為 這個 原因
這個 昇 騰 910 處理器
成為 同等 功耗 下 世界 最快 的
人工智能 訓練 處理器
所以 現在 很多 手機軟件 都 能夠 進行 實時 美顏 了
你 進到 一個 直播間 裏 你 看到 的 主播
你 在 現實生活 中 可能 根本 都 不 認識
除了 處理器 以外 昇 騰全棧 的 AI 軟硬件
還 包括 一系列 的 硬件
基礎 軟件 和 應用 使能 軟件
這張 圖 就是 昇 騰 計算 產業 的 全貌
人工智能 是 一種 通用 技術
它 可以 讓 計算機 幫助 人類 完成 許多 繁重 的 工作
從而 極大 的 解放 生產力