深度學習初體驗: 人工智慧圖片識別實作

日期: 2018/05/26
講師: 洪朝貴

一、 課程目標/課程簡介

本課程帶領學員以一個遷移學習 (transfer learning) 的實作範例來認識人工智慧/深度學習技術。 U. C. Berkeley 的 BVLC (現在改名叫做 BAIR) 所撰寫的人工智慧引擎 caffe 有一個現成、 已訓練好的 bvlc_reference_caffenet 類神經網路模型。 餵一張圖片給它吃, 它會判斷這屬於 (一千種已知類別當中的) 哪一種圖片。 我們拿來來改訓練成 (五到八種) 水果圖片判斷器。

課程後半則試用街道圖片語義分割、 黑白相片著色、 t-SNE 高維度數值資料視覺化、 撞臉偵測器等等現成 (已訓練好) 的 AI 模型。 最後以 「不求甚解工程師的人工智慧學習」 作為結語。

二、 環境安裝準備

本課程採用的環境是 ubuntu 及 docker。 訓練用的圖片資料取自 imagenet 資料庫當中超連結所指到的圖片。 環境準備的步驟詳見: 「電腦教室準備工作」。 這篇是給電腦教室管理員, 或是想要自架相同環境的學員看的。 其他學員可略過。

三、 活動流程

時間 大綱
9:00-10:30
10:40-12:10
午餐 (水果拍照?)
13:30-15:00
15:10-16:40

四、 附錄

  1. 遷移學習指令全記錄
  2. ImageNet 所有圖檔類別的 wordnet 定義
  3. wordnet 名詞從屬關係繪圖
  4. floydhub 上的成功範例