資料視覺化:數據報表 ~= 電影:歷史文獻
日期: | 2018/8/13 |
講師: | 洪朝貴 |
2006 年的 TED 演講 「 Hans Rosling 用前所未有的方法詮釋數字統計」 啟動了全球的資料視覺化風潮。 在臺灣, 關心政治的駭客團體 g0v 把政府公告的、 枯燥乏味的各種數據報表製作成生動的圖表, 例如 預算支出、 水庫水情 等等。 他們採用的是 d3.js 技術。 資料視覺化之於數據報表, 就像是電影之於歷史文獻, 它能降低理解的門檻, 把複雜的現象或問題以一目瞭然的方式讓更多人看懂。
資料視覺化的圖形分成 很多類, 其中有一些還可以進一步製作出互動式的 apps 而非靜態的圖片。 但在追求美學或電玩特效之前, 或許我們更應該先把握視覺化的初衷: 你這張圖想表達什麼意念? 據此來 選擇適當的呈現方式。
我們拿 udacity 網站 跟 tableau 網站 兩個清單裡的例子, 以及講者個人蒐集的其他例子來說明資料視覺化的常見觀念與技巧。 以下是一些主題及搜尋關鍵詞。 在觀察每個例子時, 特別建議要關注它所對應的那張試算表的欄位屬性: 有幾個數字欄位? 當中有沒有「日期或時刻」性質的欄位? 又有幾個類別欄位?
- pie chart (圓餅圖): iPhone 的成本利潤分佈; 但是請注意: 不要誤用!
- line chart (line graph): 美國各種職業一天的工作時間
- stacked area chart: 第三種 「browser market share」 比較圖
- dual axis chart: 台積電股價 vs 每股淨值:
- 相對的 vs 絕對的 stacked area chart : 各類音樂流行史、 歐巴馬演講時的 twitter 熱門關鍵詞、 美國各年齡層人種組成
- stacked column/row chart: 紐約市各區路樹種類與數量
- bar chart (bar graph) 與 line histogram: 好萊塢影片台詞統計
- 互動的資料視覺呈現: Selfie City、 renting vs buying
注意: infographic 跟 data visualization 不太一樣。 例: 食品添加物、 EFF 分析 google 透明報告、 The Histomap by John Sparks
講者個人偏好資訊呈現量最豐富的 scatter chart 與 bubble chart:
- Every Satellite Orbiting Earth
- 氣溫 vs 人口身高: 第一版、 第二版
- 太陽系行星衛星質量-半徑比較圖: 為何要用 logscale
- 「kepler habitable zone」 兩類圖
- 臺灣50股票觀察: 股價 / ROE與成長
- Hans Rosling 團隊的 bubble chart 精采表演: 200 年 200 個國家簡史
有一類特別的資料視覺化, 以地圖呈現資料。
- 1854 年倫敦霍亂疫情偵探故事
- 基地臺知道你的行蹤
- 曝露各國軍事機地的運動 app Strava
- 輪椅地圖
- heatmap: 接受比特幣交易的商家、 OpenHeatMap
- choropleths: 臺灣人口按年齡區分的統計地圖
- voronoi diagram: 燦坤各分店勢力範圍地圖
設計資料視覺化體驗的重要提醒:
- 簡單明瞭, 功能優先; 特效成本 vs 用戶體驗: OSM buildings vs 未來日蝕事件簿
-
運算思維: 以開放檔案格式的資料檔為思考核心,
例如
阿貴的繪圖工具箱。
- 建議的原始資料格式: .csv 或 .json; 美觀完全不重要、 資料一致性最重要、 可以有 「NA」 欄位 (請與程式設計師討論)
- 建議的圖片資料格式: .svg
- 更多視覺化的建議與技巧: tableau 5 重點、 bigdata-madesimple 10 要點、 geckoboard 14 提示、 lovesdata 14 提示、 columnfivemedia 25 要訣、
同場加映: 兩個特殊的視覺化工具: