資訊視覺化:統計圖表 / Data Visualization: Statistical Charts and Diagrams
這是巨量資料探勘與統計應用課程的投影片「資訊視覺化:統計圖表」。本單元是屬於系列課程中的「資料敘述級」,處理資料類型包括了「類別」跟「連續」兩種。
本單元一開始講述了「資料敘述級」的分析步驟,而這個單元則是步驟中「將資料畫成圖」的一環。本單元跟同學介紹了資訊視覺化的概念、統計圖表及其繪製講述,然後各種資料類型可繪製的統計圖表。這個單元包含了四個實作內容。
單元大綱 / Outline
- 資訊視覺化
- 統計圖表
- 統計圖表繪製原則
- Google試算表技巧
- 單變項敘述分析
- 類別資料:長條圖 (實作)
- 連續資料:直方圖 (實作)
- 雙變項比較分析
- 相關分析:散佈圖 (實作)
- 類別比較:次數分配表(實作)
投影片 / Slide
- 教學投影片: Google Presentation
- 教學投影片其他格式: Power Point、 PDF、 OpenDocument Presnetation
我以Google簡報的檔案匯出成PPTX,再備份到以下位置:
- SlideShare 、 GitHub 、 OneDrive 、 Box 、 Mega 、 MediaFire、Google Drive
學習單 / Worksheets
本單元包含了以下的學習單,請搭配課程投影片一起練習吧。
資料集 / Dataset
本單元用到了以下資料:
- 汽車銷售記錄:修改自「統計學: R-Web分析導論 : 生活中的統計應用14篇」書中的練習。
- 臺灣社會變遷調查:修改自「多變量分析方法: 統計軟體應用」書中的練習。
線上操作平臺 / Online Workplace
本單元的實作不需用到本機端的軟體,全部使用以下雲端服務。建議使用Google Chrome瀏覽器開啟:
測驗 / Examine
本單元最後提供了一份測驗,供同學驗證所學:
小結 / In closing
這一個單元是系列課程中的第三次上課,是正式開始談資料分析的第一個實質單元。到了期末的課程問卷調查中,有許多學生認為這一個單元是他們覺得學習最多、最有趣的部分,這個結果讓我蠻驚訝的。
在設計課程內容的時候,我經過了一番天人交戰。這個單元的內容看起來只是使用Google試算表內建的圖表功能來畫圖而已,但是這麼基礎的圖表就能夠快速地傳達資料的概要,不是非得要有華麗、複雜的圖表才是資訊視覺化,這是我想要教給同學的核心思想。就結果來說,似乎蠻多同學都能認同這個內容,看起來很不錯。
比起數字本身,人類更容易從各種視覺通道接收資訊。如果同學都能把資料敘述級的基本步驟放在心裡,講數字之前都能先畫圖的話,我想聽眾與讀者(特別是你的老闆)應該會很開心吧。