:::
顯示具有 Course 標籤的文章。 顯示所有文章

資料檢定級導論: 從數學到統計 / Inferential Statistics: An Introduction

資料檢定級導論: 從數學到統計 / Inferential Statistics: An Introduction

image

這是巨量資料探勘與統計應用課程的投影片「資料檢定級導論: 從數學到統計」。本單元是屬於系列課程中的「資料檢定級」,是銜接「資料敘述級」之後下一個階段的導言課程。許多人學習統計時,都知道統計分成敘述統計(descriptive statistics)推論統計(inferential statistics),前者很好理解,但為何需要推論統計?而這兩者又跟高中以前學的數學有什麼不一樣呢?

要理解推論統計,必須要先理解母體模型的概念。我們手邊看到的資料,在推論統計的框架中,它僅僅只是眾多樣本中的一次抽樣。因此我們在比較不同的樣本群時,注重的不是樣本的層次,而是樣本背後代表的母體模型。樣本對應到母體模型所計算出的檢定統計量,以及此檢定統計量可能出現的機率,才是推論統計的思維。

老實說,這個概念很難懂。因此我試著用自己的方式來詮釋這套思維,並在之中強調「檢定統計量」的核心概念,希望能讓同學比較容易理解推論統計的運作方式。因為本篇只是導言,並沒有任何練習內容或測驗。

(more...)

最佳化問題:規劃求解 / Optimization Problem: Solver

最佳化問題:規劃求解 / Optimization Problem: Solver

image

這是巨量資料探勘與統計應用課程的投影片「最佳化問題:規劃求解」。本單元雖然被歸類系列課程中的「資料敘述級」,但其實它跟其他的資料分析方法有很大的不同:規劃求解會直接給你明確的答案。在本單元中,處理資料類型為「連續」類型。

「規劃求解」是屬於「最佳化問題」領域中的技術。雖然同樣是處理數字,但「最佳化問題」並非「統計」,而跟「資料探勘」領域比較相近。在大部分資料探勘的工具裡,要解決的問題比較明確、使用者較難以自行控制。而許多資料探勘介紹的基因演算法(Genetic Algorithm, GA)又是「最佳化問題」中的進階技術,一般使用者難以輕易上手。所以我這個單元介紹的是「最佳化問題」中比較基礎的「規劃求解」。

「工廠在有限的物料跟時間內,要選擇生產多少產品,才能賺到最多利潤?」或者是「圖書館有10萬元經費,不同讀者想看不同類型的書,要怎麼買才能在有限經費內滿足讀者需求?」像是這些問題,都可以用規劃求解來找出答案。本單元利用Google試算表Solver來實作規劃求解,學生不用自己動手算喔。這個單元包含了三個實作學習單,供同學邊看邊練習。

(more...)

資料聚類:分群 / Clustering

資料聚類:分群 / Clustering

image

這是巨量資料探勘與統計應用課程的投影片「資料聚類:分群」。本單元是屬於系列課程中的「資料敘述級」,處理資料類型主要是「連續」類型資料,不過其實Weka的K平均法也能處理「類別」資料就是了。

本單元的「分群技術」屬於「資料探勘」(data mining)領域的其中一個主題,而此技術是繼前面統計圖表、資料的中心與離度之上,可用於描述多維度、超大量複雜資料的有效方法。如果你拿到一份複雜的資料,不知道該怎麼解析它的時候,不妨先丟進分群跑看看資料會有什麼特徵吧。

我為了這個單元開發了「Weka分群結果分析器」,可以搭配Weka中K平均法分群一起使用。這個單元包含了四個實作學習單,供同學邊看邊練習。

(more...)

資料的中心與離度 / Measures of Center and Spread

資料的中心與離度 / Measures of Center and Spread

image

這是巨量資料探勘與統計應用課程的投影片「資料的中心與離度」。本單元是屬於系列課程中的「資料敘述級」,處理資料類型主要是「連續」類,但也其中的眾數也可以描述「類別」類型。

這個單元講述的是各位同學國中就學過的均值跟離度的算法,包括平均數、中位數、眾數、最大值、最小值、四分位數、變異數與標準差。這次我們的重點不在於計算,而是要瞭解均值跟離度如何有效地用於描述資料。跟以前大多著重在公式跟按計算機不同,現在我們就用Google試算表的函式計算均值跟離度即可。本單元包括了五個實作學習單,供同學邊看邊練習。

(more...)

資訊視覺化:統計圖表 / Data Visualization: Statistical Charts and Diagrams

資訊視覺化:統計圖表 / Data Visualization: Statistical Charts and Diagrams

image

這是巨量資料探勘與統計應用課程的投影片「資訊視覺化:統計圖表」。本單元是屬於系列課程中的「資料敘述級」,處理資料類型包括了「類別」跟「連續」兩種。

本單元一開始講述了「資料敘述級」的分析步驟,而這個單元則是步驟中「將資料畫成圖」的一環。本單元跟同學介紹了資訊視覺化的概念、統計圖表及其繪製講述,然後各種資料類型可繪製的統計圖表。這個單元包含了四個實作內容。

(more...)

資料的來源與形態 / Data Source and Format

資料的來源與形態 / Data Source and Format

image

這是巨量資料探勘與統計應用課程的投影片「資料的來源與形態」。本單元是屬於系列課程中的導論「資料處理」。本單元先定義資料的形態,包括非結構化資料跟結構化資料,再來講述如何從開放資料(open data)中取得資料來源,以及資料的各種格式。本單元也說明這系列課程所使用的Google試算表的主要操作方式,以及學生填寫和繳交學習單作業的程序。這個單元包含一個測驗、兩個實作內容。

(more...)

數位繪圖開心畫:線稿、上色與遊戲 / Let's Draw on the Computer: Outline, Colour and Gamify

數位繪圖開心畫:線稿、上色與遊戲 / Let's Draw on the Computer: Outline, Colour and Gamify

image

這是2017年我在國立空中大學數位故事研習社講的主題:「數位繪圖開心畫:線稿、上色與遊戲」。這次著重的是借助一些免安裝的免費工具來進行簡單的數位繪圖,是開心畫的課程。而趁著人工智慧風潮的盛行,課程中也加入了Google的AutoDraw繪製線稿Python的PaintsChainer智慧上色等內容。最後再將成品做成滑塊拼圖遊戲,將繪製的成果分享給其他朋友。

(more...)

開放原始碼數位典藏整合平台發展與建置 / Introduce to DSpace-DLLL: an Open Source Digital Archive System

布丁布丁吃布丁

開放原始碼數位典藏整合平台發展與建置 / Introduce to DSpace-DLLL: an Open Source Digital Archive System

image

這是我在2016年到兩個地方介紹DSpace-DLLL的投影片。一個是在政治大學圖書館舉辦的「數位典藏、數位策展暨數位人文學研習班」,內含實作的3小時課程,另一個是在國立師範大學舉辦的「台北市教師研習中心校史研習班」單純講課的課程。這兩個課程都可以搭配我另外製作的VirtualBox版本DSpace-DLLL虛擬機器來使用,以下提供連結讓有需要的人自由下載。

(more...)

試算表應用實務 LibreOffice Calc (第四堂):減肥紀錄表 & 訂購單 & 成績單 / LibreOffice Calc Tutorial (Lesson 4): Food record & Order & Grade Report

試算表應用實務 LibreOffice Calc (第四堂):減肥紀錄表 & 訂購單 & 成績單 / LibreOffice Calc Tutorial (Lesson 4): Food record & Order & Grade Report

image

這是我在去年5月的時候到空中大學講授LibreOffice Calc的內容,這也是這一系列最後一堂課了。這堂課我借用了秋思blog中的減肥紀錄表,將它轉換成LibreOffice的格式,跟同學介紹如何使用一個綜合函式、圖表的複雜表格。此外也介紹了訂購單與成績單兩個例子,剛好用來練習函式計算。

(more...)

試算表應用實務 LibreOffice Calc (第三堂):社團登記卡與計帳表 / LibreOffice Calc Tutorial (Lesson 3): Address book & Accounting Table

試算表應用實務 LibreOffice Calc (第三堂):社團登記卡與計帳表 / LibreOffice Calc Tutorial (Lesson 3): Address book & Accounting Table

image

這是我在去年5月的時候到空中大學教授的LibreOffice Calc投影片。繼第二堂課介紹表格使用,這堂課介紹的是學生社團會用到的社團登記卡,以及大多媽媽輩同學會使用的計帳表。這次在上課之前也宣導一下盜版軟體的議題

(more...)

試算表應用實務 LibreOffice Calc (第二堂):收支平衡表與通訊錄 / LibreOffice Calc Tutorial (Lesson 2): Balance between income and expenses table & Address book

試算表應用實務 LibreOffice Calc (第二堂):收支平衡表與通訊錄 / LibreOffice Calc Tutorial (Lesson 2): Balance between income and expenses table & Address book

image

這是我在去年5月的時候到空中大學跟同學講授LibreOffice Calc的內容。繼前一篇的基礎介面認識之後,這一堂課也從我之前分享的LibreOffice Calc萬用表格作為例子,教授同學實際使用Calc的常見技巧。希望藉此能夠更貼近大家的使用情境,達到學以致用的效果。

(more...)

試算表應用實務 LibreOffice Calc: 第一堂 / LibreOffice Calc Tutorial: Lesson 1

試算表應用實務 LibreOffice Calc: 第一堂 / LibreOffice Calc Tutorial: Lesson 1

image

我在去年5月的時候到空中大學跟同學介紹LibreOffice Calc──一個有別於商用軟體Microsoft Office的自由軟體。Calc跟Excel打對臺,但卻可以免費使用,還能免安裝在隨身碟直接執行!之前一系列的LibreOffice Calc萬用表格也是因為這堂課而整理。本系列課程總共四堂,我一堂一堂整理。第一堂課教的是認識LibreOffice與Office之間的不同、Calc介面介紹、試算表的基本操作、以及檢視大量資料的技巧:結凍、篩選、排序。

(more...)

Google簡報教學:用簡報說故事 / Google Presentation Tutorial: Storytelling

Google簡報教學:用簡報說故事 / Google Presentation Tutorial: Storytelling

image

這是我在去年10月的時候在空大講課的內容,教同學如何用Google簡報來製作一個可以說故事的簡報。Google簡報雖然比起Power Point功能減少許多,但基本該有的功能都有,而且跨平臺容易編輯這點更是方便,只要一個網址就可以把做好的投影片帶著走,不管是在Line或FB上分享投影片都非常簡單!

這份投影片教學的內容著重於製作可以說故事的圖文繪本。裡面用到了圖片、背景、格式、排列、轉場特效、動畫等功能,讓大家可以簡單地製作一個會動的說故事投影片。

(more...)