鞋技中心人工智慧課程

洪朝貴 (資訊人權貴)

朝陽科技大學 資訊管理系
軟體自由協會 (SLAT)

[預備事項]

  1. 自製開機隨身碟 或自行在筆電上安裝 linuxmint/*ubuntu/debian 等任何一個版本的 Linux
  2. 申請 TGOS 帳號 (可能要好幾天才會核准)
  3. 註冊 OpenStreetMap 帳號

[7/13 上午] 資料探勘

  1. 一些領域 Data Mining / Knowledge Discovery in Databases (KDD): 從大量資料當中, 運用各種技術, 挖掘出有用資訊與知識甚至預測未來, 這樣的過程。
  2. 應用範例: 精準行銷、 詐騙辨識、 信用評估、 客戶流失分析、 有價證券分析
  3. 可能採用的技術: 傳統統計學、 資料庫查詢、 機器學習
  4. 步驟: 選取資料集、 前置處理、 資料減量與轉換、 套用演算法、 解釋與評估
  5. 談論資料表格的基本名詞: 表格/table/relation/class、 列/row/record/tuple、 欄/column/field/attribute、 數值資料/numerical、 文字資料/categorical
  6. 常見演算法類型: classification、 clustering、 correlation (例如 regression)、 association、 ...
  7. 更多術語
  8. 更多入門參考資料: 趨勢科技MIT lecture notes (Nitin Patel)

[7/13 下午] 資料視覺化

  1. visual variables 導覽: Hans Rosling 演講 長版/短版d3.js工具大賞
  2. 誤用資料視覺化的範例 MacWorld's iPhone Pie Chart, Cumulative iPhone sales chart
  3. 常見圖表類型
  4. Visual Cheatsheet
  5. 顏色: HSL and HSV調色盤類型 ; 選色工具 I Want Hue + Viz Palette色盲無障礙redundant encoding rainbow (jet) color scheme can be misleading
  6. 範例資料檔 「電力能源來源分類」 備料: 三字元 iso 國碼整理與驗證unpivoting/melting
  7. rawgraphs 之 line chart顯示階層式 (hierarchical) 資料
  8. scatplot
  9. 挖掘資料群聚性的高維資料降維工具: t-SNEumap

[7/14 上午] 網路爬蟲

  1. 網頁爬蟲: 何時使用哪種技術? 一個短範例: 查詢個股除權息相關資訊
    wget https://stock.wespai.com/rate112 -O - | grep -v '<!--.*-->' > wespai.html
    echo '代號,名稱,配息,除息日,配股,除權日,發息日' > dpann.csv
    python3 html2csv.py wespai.html | cut -d, -f 1-6,10 | perl -pe 's/"([\d.]+)"/$1/g' >> dpann.csv
  2. 正規表示式
  3. 台中市環保地圖 (可顯示輔助資訊的群聚地圖)
  4. 運輸資料流通服務 tdx 範例 ; 補充: jqzq
  5. 補充: 複利成長的電腦學習策略 / 長線投資的電腦學習策略
  6. 參考資料: 網頁爬蟲終極武器: puppeteerselenium 爬蟲linespector

[其他連結]

  1. 廣播頁面 (noVNC)
  2. 共筆表單
  3. energy-mix.csvelectricity-mix-melted.csv