×

Nous utilisons des cookies pour rendre LingQ meilleur. En visitant le site vous acceptez nos Politique des cookies.

image

李永樂老師, 手机拍照为啥这么好看?都是AI算出来的! (1)

手机 拍照 为啥 这么 好看 ?都 是 AI算 出来 的! (1)

各位 同學 大家 好 我 是 李永樂 老師 最近 有 一個 小朋友 跟 我 說 他 新 買 了 一臺 手機 這個 手機 的 拍照 功能 特別 強大 簡直 可以 媲美 單反 還有 很多 附加 的 神奇 功能 他 想問 我 這些 功能 到底 是 如何 實現 的 呢 為此 我還 特意 買 了 一臺 小米 11 Pro 我們 來體 會 一下 它 的 拍照 功能 首先 是 神奇 夜景 模式 它 能夠 在 夜晚 拍 到 特別 清晰 的 照片 再 比如說 還有 120 倍 的 超大 變焦 能夠 拍攝 到 很遠 的 物體 還有 人像 模式 能夠 對 背景 進行 虛化 凸顯出 人像 還 可以 進行 魔法 換天 把 天空 換成 你 想要 的 樣子 還 可以 進行 魔法 消除 把 圖片 上 你 不 想要 的 人 去掉 等等等等 那麼 一個 小小的 手機 是 如何 具有 這麼 強大 的 功能 的 呢 我 在 拍照 的 時候 發現 有 一個 AI 的 標誌 這就 表示 的 是 是否 啟用 人工智能 系統 來 處理 照片 原本 需要 在 雲端 進行 的 許多 人工智能 操作 現在 在 小小的 手機 上 就 可以 完成 了 目前 最為 普及 的 就是 在 拍攝 影像 方面 它 可以 極大 地 提升 用戶 的 體驗 今天 我們 就 來 聊 一聊 人工智能 在 攝影 上 的 應用 聊一聊 AI 計算 攝影 AI 也 就是 人工智能 計算 攝影 什麼 叫 計算 攝影 呢 首先 我來 放 兩張 圖 這個 是 沒有 經過 AI 處理 的 圖片 然後 我們 經過 AI 處理 之後 大家 比較 一下 這個 也 是 沒有 經過 AI 處理 的 我們 再 把 它 處理 一下 大家 比較 比較 大家 看 了 之後 是不是 感覺 到 非常 震撼 呢 看 了 AI 處理 的 圖 之後 就 不 願意 再 看 原圖 了 對 不 對 因為 差別 實在 是 太大 了 那麼 在 幾年 以前 我們 還不 具有 這種 技術 那 主要 是 因為 什麼 呢 主要 是 因為 那個 時候 AI 的 算力還 不夠 那個 時候 我們 使用 的 是 傳統相機 傳統 的 相機 不管 是 數碼相機 還是 光學 相機 它 的 基本原理 其實 都 很 簡單 那 就是 物體 發出 或者 是 反射 的 光線 經過 了 這個 相機 的 鏡頭 進入 到 這個 相機 之中 然後 通過 鏡頭 進入 到 感光 的 元件 上 這個 感光片 可能 是 膠片 也 可能 是 像 CCD 或者 CMOS 之類 的 電子元件 那麼 就 可以 把 一幅 圖 成像 在 這個 感光片 上 但是 傳統相機 其實 是 有 一些 問題 的 首先 傳統相機 有 一些 復 雜的 參數 比如說 光圈 焦距 什麼 光 這些 曝光 時間 等等 這些 東西 那麼 你 如果 讓 它 自動 調節 的話 效果 可能 就 不太好 如果 你 想 拍出 高質量 的 照片 的話 就 必須 學習 很 復 雜的 攝影 技術 對 吧 對於 我 這種 外行 來講 太 復 雜了 也就是說 在 這 過程 中 我 可能 需要 手動 調節 一些 東西 這個 調節 的 過程 是 比較 復 雜的 如果 調 不好 效果 就 一般般 那麼 第二個 就是 傳統 的 這種 相機 它 是 存在 物理 極限 的 它 過於 真實 存在 物理 極限 什麼 叫 過於 真實 存在 物理 極限 呢 就是說 因為 鏡頭 或者 感光片 的 一些 原因 它 不可避免 地會 出現 一些 模糊 以及 其他 的 一些 問題 我們 來 簡單 地 介紹 一下 說 這個 相機 出現 了 模糊 原因 是 什麼 比如說 有 一個 原因 叫做 光 的 衍射 光 的 衍射 我們 知道 這個 相機 成像 就是 依靠 鏡頭 這個 凸透鏡 對 吧 那麼 光線 經過 凸透鏡 之後 其實 並 不是 成為 一個點 而是 成 一個 光斑 這 叫做 艾裏 斑 鏡頭 越小 這個 艾裏 斑越 大 那 如果 兩個 艾裏 斑 重疊 到 一塊 我們 就 沒有 辦法 區分 這 兩條 光線 了 對 吧 所以 因為 艾裏 斑 的 存在 底片 上 呈現 的 像 就 會 出現 一定 的 模糊 所以 你 要 想 減小 的 這種 模糊 你 必須 提高 這個 照相機 的 口徑 對 吧 所以 天文 望遠鏡 造得 特別 大 但是 我們 的 相機 不 可能 造得 特別 大 第二個 就是 因為 它 的 感光片 比如說 像 CCD 或者 是 CMOS 這種 感光片 它 有 一個 分辨率 的 限 製 分辨率 的 限 製 什麼 意思 呢 比如說 這個 小米 11 Pro 這個 手機 它 的 分辨率 是 5000 萬 像素 是 怎麼回事 呢 就是 它 的 這個 感光片 是 1/1.12 英寸 也 就 表示 這個 感光片 的 對角線 長度 是 16/1.12 毫米 這 16 毫米 的 出現 是 歷史 原因 然後 這個 長寬 之 比 又 是 4:3 所以 我們 就 可以 知道 它 的 這個 長 和 寬 大約 都 是 11.4 毫米 和 8.6 毫米 你 就 可以 計算 出 它 的 感光片 有效 的 面積 了 然後 它 一個 像素點 的 面積 是 1.4 微米 x1.4 微米 的 一個 方 塊兒 你 這麼 一算 你 就 知道 它 一共 有 多少 個 大約 5000 萬個 這個 方 塊兒 所以 說 就 有 5000 萬個 像素點 像素點 的 密度 越高 對 外界 信息 的 描述 就 會 越 準確 但是 這個 像素點 不 可能 做 得 無限小 對於 外界 特別 細微 的 結構 因為 分辨率 的 限 製 也 會 出現 模糊 那麼 第三個 原因 就是 運動 模糊 運動 模糊 這個 就 比較 好 理解 了 我們 在 拍照 的 時候 會 讓 一定 的 光 進到 我們 的 這個 鏡頭 裏面 去 那麼 進光 的 時候 我們 這個 手機 不能 運動 對 吧 如果 我 的 手機 一 抖動 了 出現 了 運動 的話 那 就 會 出現 模糊 所以 說 專業 的 相機 你 得 架 到 三腳架 上 不讓 這個 相 機動 才 能夠 拍 得 比較清楚 對 吧 那麼 如果 你 在 拍攝 遠景 的 時候 把 鏡頭 拉得 非常 非常 長 或者 是 在 晚上 的 時候 需要 長 曝光 這個 運動 的 模糊 就 會 更加 明顯 那 第四個 就是 噪點 噪點 什麼 叫 噪點 呢 就是 這個 CCD 也好 CMOS 也好 由於 它 的 這個 物理 特性 比如說 電子 的 這個 無規則 運動 就 會 出現 一些 雜亂 的 膠原 狀的點 而 這些 點就稱 之 為 噪點 或者說 噪聲 那 如果說 外界 的 光 信號 比較 強 的話 有用 的 信息 多 這個 噪聲 的 影響 就 不 明顯 但是 如果 外界 的 信息 比較 少 比如說 在 晚上 的 時候 拍照 本來 有用 的 信息 就 弱 你 就 會 發現 很多 的 噪點 或者 我們 利用 小 光圈 長 焦 鏡頭 來 拍攝 景物 的 時候 你 也 會 發現 這個 噪點 的 影響 是 比較 明顯 的 此外 還有 這個 鏡頭 色差 對焦 不準 等等 會 造成 一定 的 模糊 當然 我們 可以 通過 物理 方法 對 它 進行 改進 你 比如說 我 可以 增大 鏡頭 的 大小 對 吧 我 可以 增大 感光 片兒 我 可以 減小 每 一個 像素點 的 尺寸 讓 像素點 變得 更 多 但是 這些 方法 同時 也 就 意味著 成本 的 上升 以及 功耗 的 變大 或者 是 相機 尺寸 的 變大 而且 有 的 時候 這些 個 改進 方法 是 彼此 矛盾 的 你 比如說 你 讓 每 一個 像素點 越來越 小 那 它 就 越來越 密 你 就 可以 收集 到 更 多 的 這個 外界 的 信息 了 但是 一旦 一個 像素點 小 了 的話 外界 有用 的 信息 少 它 的 噪聲 影響 就 會 變大 對 吧 所以 用 硬件 的 方法 來 提升 分辨率 它 是 存在 極限 的 那麼 我們 該 如何 處理 這個 問題 呢 現在 越來越 多 的 人 使用 手機 進行 拍照 了 因為 手機 比起 單反 不光 不 需要 進行 復 雜的 設置 不 需要 頻繁 的 更換 鏡頭 更 重要 的 是 隨著 手機 移動 平臺 構架 和 計算能力 的 逐代 提升 圖像 信號處理器 和 AI 處理 引擎 越來越 強大 許多 廠商 都 把 人工智能 引入 到 拍攝 當中 我們 一點 開 手機 的 拍照 功能 這個 人工智能 算法 都 在 為 我們 拍 出 一張 好看 的 照片 而 努力 這個 過程 我們 就 稱 之 為 是 計算 攝影 的 過程 計算 攝影 它 是 算 出來 的 一張 照 片兒 具體來講 這個 手機 廠商 選定 了 攝像頭 感光 芯片 操作系統 等等 這些 東西 之後 會 有 算法 廠商 來 設計 人工智能 的 算法 他們 首先 會 用 大量 的 圖片 來 進行 投 餵 這個 系統 首先 我們 先 收集 一大堆 的 圖片 然後 我們 去 投 餵 這個 人工智能 的 系統 就是 告訴 這個 人工智能 的 系統 這個 好 的 圖片 美觀 的 圖片 不 模糊 的 圖片 它長 什麼 樣子 這個 過程 我們 就 叫 它 訓練 過程 對 吧 這是 人工智能 的 第一個 步驟 那麼 訓練 好 了 之後 用戶 拿到 這個 手機 拍 了 一張 照 片兒 然後 這個 人工智能 系統 就 會 對 照片 進行 什麼 呢 進行 修飾 它會 把 這個 照片 進行 一定 的 調整 修飾 的 過程 我們 稱之為 推理 這 就是 一個 人工智能 的 處理 圖像 的 一個 過程 讓 我們 看起來 這張 照片 顏色 更加 鮮艷 飽和度 更好 看起來 細節 更加 清楚 用 業內 的話 說 人工智能 攝影 就是 用 人工智能 來 突破 光學 的 物理 限 製 用 強大 的 算力 來 創造 全新 的 視覺 想象 用 深度 學習 來 超越 人眼 可見 的 細節 那麼 以往 的 手機 為 什麼 沒有 人工智能 攝影 呢 這是 因為 以往 的 手機 它 支持 的 AI 算力 太少 難以 支持 理想 的 人工智能 攝影 效果 當然 你 可以 把 影像 傳到 雲端 利用 雲端 的 計算能力 來 進行 AI 計算 不過 這個 過程 一來 是 浪費時間 浪費 流量 二來 它 有 泄露 隱私 的 問題 所以 手機 終端 側的 AI 算力 就 變得 至關重要 那麼 下面 我們 就 來 具體 說一說 這個 AI 攝影 到底 在 哪些方面 改進 了 傳統 攝影 我們 首先 來說 一下 超 分辨率 技術 超 分辨率 技術 大家 可能 沒有 聽說 過 這個 詞 是 吧 什麼 叫超 分辨率 呢 我們 在 電影 裏面 經常 可能 看到 過 這樣 的 情景 說 這個 警察 拍到 了 一個 嫌疑犯 的 影像 不 清楚 然後 按 了 幾個 按鈕 結果 這個 影像 就 變得 特別 清楚 這 就是 超分 技術 它 可以 從 一個 低分辨率 的 照片 變成 一個 高分辨率 的 照片 有人 說 這 怎麼 能 做到 呢 低分辨率 變 高分辨率 那 這些 細節 你 怎麼 補充 上 呢 其實 答案 就是 一個 字 猜 比如說 大家 看 這張 照片 這張 照片 你 很 顯然 就 知道 它 是 個 足球 的 照片 對 吧 所以 你 腦子 中有 足球 的 影像 你 就 可以 按照 腦子 中 的 這個 形象 把 這個 足球 的 細節 補充 上去 於是 就 把 這個 模糊 的 不 清楚 的 照片 變成 了 一個 清晰 的 信息量 更大 的 照 片兒 這 就是 一個 超分 的 過程 那麼 近年來 隨著 人工智能 和 深度 學習 的 突破 在 2014 年 的 時候 香港大學 的 董超 提出 了 一種 基於 卷積 神經網絡 的 超分 過程 我們 稱之為 SRCNN 那 現在 這個 很多 手機 上 使用 的 這個 超分 技術 大多 都 是 SRCNN 的 一個 變種 我們 就 來 重點 介紹 一下 這個 技術 的 原理 是 什麼 樣子 首先 我們 要 對 這個 人工智能 系統 進行 訓練 我要 告訴 它 給你 一張 低分辨率 圖片 那麼 相應 的 高分辨率 是 什麼樣 的 我得 先給 你 一大堆 高低 分辨 的 對照 圖 讓 你 去 訓練 讓 你 系統 了解 這個 事兒 對 吧 所以 首先 我 有 一張 比如說 一張 圖片 這個 圖片 我們 管它 叫 x 這個 X 是 一張 高分辨率 圖片 比如說 這個 X 是 512x512 的 這麼 一張 圖 512x512 的 那 然後 你 首先 通過 一些 方法 把 它 變成 一個 低分辨率 的 圖片 x' 是 吧 它 比如說 是 128x128 的 那 你 怎麼 變成 低分 變率 圖片 呢 很 簡單 你 就 丟掉 一些 信息 就行了 是不是 它 就 變成 了 一個 低分辨率 的 好 了 我們 有 了 一個 高分辨率 一個 低分辨率 然後 怎麼 進行 訓練 呢 是 這樣 的 一個 過程 首先 這個 董超 說 你 先 把 這個 x' 進行 上 采樣 就是 你 再 把 它 變回 到 一張 512x512 的 這麼 一張 這個 分辨率 比較 高 的 圖片 這個 圖片 叫做 Y 但 大家 註 意

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE

手机 拍照 为啥 这么 好看 ?都 是 AI算 出来 的! (1) Why do cell phone photos look so good? It's all calculated by AI! (1)

各位 同學 大家 好 我 是 李永樂 老師 最近 有 一個 小朋友 跟 我 說 他 新 買 了 一臺 手機 這個 手機 的 拍照 功能 特別 強大 簡直 可以 媲美 單反 還有 很多 附加 的 神奇 功能 他 想問 我 這些 功能 到底 是 如何 實現 的 呢 為此 我還 特意 買 了 一臺 小米 11 Pro 我們 來體 會 一下 它 的 拍照 功能 首先 是 神奇 夜景 模式 它 能夠 在 夜晚 拍 到 特別 清晰 的 照片 再 比如說 還有 120 倍 的 超大 變焦 能夠 拍攝 到 很遠 的 物體 還有 人像 模式 能夠 對 背景 進行 虛化 凸顯出 人像 還 可以 進行 魔法 換天 把 天空 換成 你 想要 的 樣子 還 可以 進行 魔法 消除 把 圖片 上 你 不 想要 的 人 去掉 等等等等 那麼 一個 小小的 手機 是 如何 具有 這麼 強大 的 功能 的 呢 我 在 拍照 的 時候 發現 有 一個 AI 的 標誌 這就 表示 的 是 是否 啟用 人工智能 系統 來 處理 照片 原本 需要 在 雲端 進行 的 許多 人工智能 操作 現在 在 小小的 手機 上 就 可以 完成 了 目前 最為 普及 的 就是 在 拍攝 影像 方面 它 可以 極大 地 提升 用戶 的 體驗 今天 我們 就 來 聊 一聊 人工智能 在 攝影 上 的 應用 聊一聊 AI 計算 攝影 AI 也 就是 人工智能 計算 攝影 什麼 叫 計算 攝影 呢 首先 我來 放 兩張 圖 這個 是 沒有 經過 AI 處理 的 圖片 然後 我們 經過 AI 處理 之後 大家 比較 一下 這個 也 是 沒有 經過 AI 處理 的 我們 再 把 它 處理 一下 大家 比較 比較 大家 看 了 之後 是不是 感覺 到 非常 震撼 呢 看 了 AI 處理 的 圖 之後 就 不 願意 再 看 原圖 了 對 不 對 因為 差別 實在 是 太大 了 那麼 在 幾年 以前 我們 還不 具有 這種 技術 那 主要 是 因為 什麼 呢 主要 是 因為 那個 時候 AI 的 算力還 不夠 那個 時候 我們 使用 的 是 傳統相機 傳統 的 相機 不管 是 數碼相機 還是 光學 相機 它 的 基本原理 其實 都 很 簡單 那 就是 物體 發出 或者 是 反射 的 光線 經過 了 這個 相機 的 鏡頭 進入 到 這個 相機 之中 然後 通過 鏡頭 進入 到 感光 的 元件 上 這個 感光片 可能 是 膠片 也 可能 是 像 CCD 或者 CMOS 之類 的 電子元件 那麼 就 可以 把 一幅 圖 成像 在 這個 感光片 上 但是 傳統相機 其實 是 有 一些 問題 的 首先 傳統相機 有 一些 復 雜的 參數 比如說 光圈 焦距 什麼 光 這些 曝光 時間 等等 這些 東西 那麼 你 如果 讓 它 自動 調節 的話 效果 可能 就 不太好 如果 你 想 拍出 高質量 的 照片 的話 就 必須 學習 很 復 雜的 攝影 技術 對 吧 對於 我 這種 外行 來講 太 復 雜了 也就是說 在 這 過程 中 我 可能 需要 手動 調節 一些 東西 這個 調節 的 過程 是 比較 復 雜的 如果 調 不好 效果 就 一般般 那麼 第二個 就是 傳統 的 這種 相機 它 是 存在 物理 極限 的 它 過於 真實 存在 物理 極限 什麼 叫 過於 真實 存在 物理 極限 呢 就是說 因為 鏡頭 或者 感光片 的 一些 原因 它 不可避免 地會 出現 一些 模糊 以及 其他 的 一些 問題 我們 來 簡單 地 介紹 一下 說 這個 相機 出現 了 模糊 原因 是 什麼 比如說 有 一個 原因 叫做 光 的 衍射 光 的 衍射 我們 知道 這個 相機 成像 就是 依靠 鏡頭 這個 凸透鏡 對 吧 那麼 光線 經過 凸透鏡 之後 其實 並 不是 成為 一個點 而是 成 一個 光斑 這 叫做 艾裏 斑 鏡頭 越小 這個 艾裏 斑越 大 那 如果 兩個 艾裏 斑 重疊 到 一塊 我們 就 沒有 辦法 區分 這 兩條 光線 了 對 吧 所以 因為 艾裏 斑 的 存在 底片 上 呈現 的 像 就 會 出現 一定 的 模糊 所以 你 要 想 減小 的 這種 模糊 你 必須 提高 這個 照相機 的 口徑 對 吧 所以 天文 望遠鏡 造得 特別 大 但是 我們 的 相機 不 可能 造得 特別 大 第二個 就是 因為 它 的 感光片 比如說 像 CCD 或者 是 CMOS 這種 感光片 它 有 一個 分辨率 的 限 製 分辨率 的 限 製 什麼 意思 呢 比如說 這個 小米 11 Pro 這個 手機 它 的 分辨率 是 5000 萬 像素 是 怎麼回事 呢 就是 它 的 這個 感光片 是 1/1.12 英寸 也 就 表示 這個 感光片 的 對角線 長度 是 16/1.12 毫米 這 16 毫米 的 出現 是 歷史 原因 然後 這個 長寬 之 比 又 是 4:3 所以 我們 就 可以 知道 它 的 這個 長 和 寬 大約 都 是 11.4 毫米 和 8.6 毫米 你 就 可以 計算 出 它 的 感光片 有效 的 面積 了 然後 它 一個 像素點 的 面積 是 1.4 微米 x1.4 微米 的 一個 方 塊兒 你 這麼 一算 你 就 知道 它 一共 有 多少 個 大約 5000 萬個 這個 方 塊兒 所以 說 就 有 5000 萬個 像素點 像素點 的 密度 越高 對 外界 信息 的 描述 就 會 越 準確 但是 這個 像素點 不 可能 做 得 無限小 對於 外界 特別 細微 的 結構 因為 分辨率 的 限 製 也 會 出現 模糊 那麼 第三個 原因 就是 運動 模糊 運動 模糊 這個 就 比較 好 理解 了 我們 在 拍照 的 時候 會 讓 一定 的 光 進到 我們 的 這個 鏡頭 裏面 去 那麼 進光 的 時候 我們 這個 手機 不能 運動 對 吧 如果 我 的 手機 一 抖動 了 出現 了 運動 的話 那 就 會 出現 模糊 所以 說 專業 的 相機 你 得 架 到 三腳架 上 不讓 這個 相 機動 才 能夠 拍 得 比較清楚 對 吧 那麼 如果 你 在 拍攝 遠景 的 時候 把 鏡頭 拉得 非常 非常 長 或者 是 在 晚上 的 時候 需要 長 曝光 這個 運動 的 模糊 就 會 更加 明顯 那 第四個 就是 噪點 噪點 什麼 叫 噪點 呢 就是 這個 CCD 也好 CMOS 也好 由於 它 的 這個 物理 特性 比如說 電子 的 這個 無規則 運動 就 會 出現 一些 雜亂 的 膠原 狀的點 而 這些 點就稱 之 為 噪點 或者說 噪聲 那 如果說 外界 的 光 信號 比較 強 的話 有用 的 信息 多 這個 噪聲 的 影響 就 不 明顯 但是 如果 外界 的 信息 比較 少 比如說 在 晚上 的 時候 拍照 本來 有用 的 信息 就 弱 你 就 會 發現 很多 的 噪點 或者 我們 利用 小 光圈 長 焦 鏡頭 來 拍攝 景物 的 時候 你 也 會 發現 這個 噪點 的 影響 是 比較 明顯 的 此外 還有 這個 鏡頭 色差 對焦 不準 等等 會 造成 一定 的 模糊 當然 我們 可以 通過 物理 方法 對 它 進行 改進 你 比如說 我 可以 增大 鏡頭 的 大小 對 吧 我 可以 增大 感光 片兒 我 可以 減小 每 一個 像素點 的 尺寸 讓 像素點 變得 更 多 但是 這些 方法 同時 也 就 意味著 成本 的 上升 以及 功耗 的 變大 或者 是 相機 尺寸 的 變大 而且 有 的 時候 這些 個 改進 方法 是 彼此 矛盾 的 你 比如說 你 讓 每 一個 像素點 越來越 小 那 它 就 越來越 密 你 就 可以 收集 到 更 多 的 這個 外界 的 信息 了 但是 一旦 一個 像素點 小 了 的話 外界 有用 的 信息 少 它 的 噪聲 影響 就 會 變大 對 吧 所以 用 硬件 的 方法 來 提升 分辨率 它 是 存在 極限 的 那麼 我們 該 如何 處理 這個 問題 呢 現在 越來越 多 的 人 使用 手機 進行 拍照 了 因為 手機 比起 單反 不光 不 需要 進行 復 雜的 設置 不 需要 頻繁 的 更換 鏡頭 更 重要 的 是 隨著 手機 移動 平臺 構架 和 計算能力 的 逐代 提升 圖像 信號處理器 和 AI 處理 引擎 越來越 強大 許多 廠商 都 把 人工智能 引入 到 拍攝 當中 我們 一點 開 手機 的 拍照 功能 這個 人工智能 算法 都 在 為 我們 拍 出 一張 好看 的 照片 而 努力 這個 過程 我們 就 稱 之 為 是 計算 攝影 的 過程 計算 攝影 它 是 算 出來 的 一張 照 片兒 具體來講 這個 手機 廠商 選定 了 攝像頭 感光 芯片 操作系統 等等 這些 東西 之後 會 有 算法 廠商 來 設計 人工智能 的 算法 他們 首先 會 用 大量 的 圖片 來 進行 投 餵 這個 系統 首先 我們 先 收集 一大堆 的 圖片 然後 我們 去 投 餵 這個 人工智能 的 系統 就是 告訴 這個 人工智能 的 系統 這個 好 的 圖片 美觀 的 圖片 不 模糊 的 圖片 它長 什麼 樣子 這個 過程 我們 就 叫 它 訓練 過程 對 吧 這是 人工智能 的 第一個 步驟 那麼 訓練 好 了 之後 用戶 拿到 這個 手機 拍 了 一張 照 片兒 然後 這個 人工智能 系統 就 會 對 照片 進行 什麼 呢 進行 修飾 它會 把 這個 照片 進行 一定 的 調整 修飾 的 過程 我們 稱之為 推理 這 就是 一個 人工智能 的 處理 圖像 的 一個 過程 讓 我們 看起來 這張 照片 顏色 更加 鮮艷 飽和度 更好 看起來 細節 更加 清楚 用 業內 的話 說 人工智能 攝影 就是 用 人工智能 來 突破 光學 的 物理 限 製 用 強大 的 算力 來 創造 全新 的 視覺 想象 用 深度 學習 來 超越 人眼 可見 的 細節 那麼 以往 的 手機 為 什麼 沒有 人工智能 攝影 呢 這是 因為 以往 的 手機 它 支持 的 AI 算力 太少 難以 支持 理想 的 人工智能 攝影 效果 當然 你 可以 把 影像 傳到 雲端 利用 雲端 的 計算能力 來 進行 AI 計算 不過 這個 過程 一來 是 浪費時間 浪費 流量 二來 它 有 泄露 隱私 的 問題 所以 手機 終端 側的 AI 算力 就 變得 至關重要 那麼 下面 我們 就 來 具體 說一說 這個 AI 攝影 到底 在 哪些方面 改進 了 傳統 攝影 我們 首先 來說 一下 超 分辨率 技術 超 分辨率 技術 大家 可能 沒有 聽說 過 這個 詞 是 吧 什麼 叫超 分辨率 呢 我們 在 電影 裏面 經常 可能 看到 過 這樣 的 情景 說 這個 警察 拍到 了 一個 嫌疑犯 的 影像 不 清楚 然後 按 了 幾個 按鈕 結果 這個 影像 就 變得 特別 清楚 這 就是 超分 技術 它 可以 從 一個 低分辨率 的 照片 變成 一個 高分辨率 的 照片 有人 說 這 怎麼 能 做到 呢 低分辨率 變 高分辨率 那 這些 細節 你 怎麼 補充 上 呢 其實 答案 就是 一個 字 猜 比如說 大家 看 這張 照片 這張 照片 你 很 顯然 就 知道 它 是 個 足球 的 照片 對 吧 所以 你 腦子 中有 足球 的 影像 你 就 可以 按照 腦子 中 的 這個 形象 把 這個 足球 的 細節 補充 上去 於是 就 把 這個 模糊 的 不 清楚 的 照片 變成 了 一個 清晰 的 信息量 更大 的 照 片兒 這 就是 一個 超分 的 過程 那麼 近年來 隨著 人工智能 和 深度 學習 的 突破 在 2014 年 的 時候 香港大學 的 董超 提出 了 一種 基於 卷積 神經網絡 的 超分 過程 我們 稱之為 SRCNN 那 現在 這個 很多 手機 上 使用 的 這個 超分 技術 大多 都 是 SRCNN 的 一個 變種 我們 就 來 重點 介紹 一下 這個 技術 的 原理 是 什麼 樣子 首先 我們 要 對 這個 人工智能 系統 進行 訓練 我要 告訴 它 給你 一張 低分辨率 圖片 那麼 相應 的 高分辨率 是 什麼樣 的 我得 先給 你 一大堆 高低 分辨 的 對照 圖 讓 你 去 訓練 讓 你 系統 了解 這個 事兒 對 吧 所以 首先 我 有 一張 比如說 一張 圖片 這個 圖片 我們 管它 叫 x 這個 X 是 一張 高分辨率 圖片 比如說 這個 X 是 512x512 的 這麼 一張 圖 512x512 的 那 然後 你 首先 通過 一些 方法 把 它 變成 一個 低分辨率 的 圖片 x' 是 吧 它 比如說 是 128x128 的 那 你 怎麼 變成 低分 變率 圖片 呢 很 簡單 你 就 丟掉 一些 信息 就行了 是不是 它 就 變成 了 一個 低分辨率 的 好 了 我們 有 了 一個 高分辨率 一個 低分辨率 然後 怎麼 進行 訓練 呢 是 這樣 的 一個 過程 首先 這個 董超 說 你 先 把 這個 x' 進行 上 采樣 就是 你 再 把 它 變回 到 一張 512x512 的 這麼 一張 這個 分辨率 比較 高 的 圖片 這個 圖片 叫做 Y 但 大家 註 意