:::
顯示具有 Software/GoogleDoc 標籤的文章。 顯示所有文章

擺脫PWA的限制,把任意網頁變成電腦的應用程式:客製化網頁應用程式 / Customize Your Web Application: No PWA, Any Favicon

擺脫PWA的限制,把任意網頁變成電腦的應用程式:客製化網頁應用程式 / Customize Your Web Application: No PWA, Any Favicon

1-cover-PWA_Customize_Your_Web_Application.png

哈囉,大家最近吃什麼?這裡是總算有點適應Linux的布丁。

你用過漸進式網路應用程式PWA或網頁應用程式(WebAPP, Web Application)嗎?儘管一直不斷有人主張應該用網頁來取代安裝在作業系統上的原生應用程式,也越來越多原生應用程式改用PWA的形式發佈。然而,對使用者來說卻非常不方便。使用者安裝PWA或網頁應用程式的時候,一般來說只能使用開發者預先設定好的網址、應用程式名稱和圖示。如果你想要把Google試算表中一個你常用的表格建立捷徑、做成應用程式,你會發現其實你只能建立「試算表」應用程式,而不能連到你真正的表格。

為了克服PWA的限制,我開發了工具「PWA-Builder」來產生自訂的網頁<head>內容。以此修改網頁的<head>之後,就能客製化產生自己習慣使用的網頁應用程式囉。如果你也想要自己制訂要使用的網頁應用程式的話,就讓我們繼續看下去吧!

(more...)

如何將試算表裡面的換行和TAB等特殊字元換成空格? / How to Replace Special Characters (Line Breaks and Horizontal Tabs) from Cells by Spaces in Spreadsheets?

如何將試算表裡面的換行和TAB等特殊字元換成空格? / How to Replace Special Characters (Line Breaks and Horizontal Tabs) from Cells by Spaces in Spreadsheets?

ed = 3 =
Er us xX pg». . 5 ﹣ sA气田三~ ~卜~宁~一國回平維
C必S
入A
Ag
SA FILTERED
Go  | LINE
LINE3 LINE 2 E2LihE3 ﹝
」簡倉史g
﹍ oa譚烈茹縹屹
7
8
a E filtered ~ a

我們時常使用LibreOffice CalcGoogle試算表、以及Microsoft Excel等試算表工具來整理資料,但當資料裡面有些「換行」(new lines)、「Tab」(也就是製表鍵(tabulator key)或表格鍵(tabular key)的縮寫)、前後空白、中文空白時,常常會在轉換成CSV、輸入到Weka或其他工具時,造成解讀資料時發生錯誤。

要移除「換行」和「Tab」等特殊字元的話,難道還要寫Python程式嗎?不用,我們只要在試算表工具裡面加入一個函數,就可以輕鬆將「換行」和「Tab」等特殊字元轉換成空白字元囉。讓我們來看看怎麼做吧。

(more...)

Google簡報製作一頁二張投影片的PDF列印講義 / Create Hangout PDF on 2 Slides per Page from Google Slides

Google簡報製作一頁二張投影片的PDF列印講義 / Create Hangout PDF on 2 Slides per Page from Google Slides

簡報1

我之前介紹過如何將4張投影片8張投影片濃縮在一頁中,製作成方便列印的講義。這次我們要從Google簡報開始,教大家如何製作2張投影片印在同一頁中,並且為講義加上頁碼喔!

(more...)

如何將SVG向量圖插入到Google文件中? / How to insert SVG vector images into Google Doc?

如何將SVG向量圖插入到Google文件中? / How to insert SVG vector images into Google Doc?

image

繼前一篇我們介紹了如何將SVG向量圖插入到桌面版辦公室工具軟體Office Word中之後,接下來我們換來挑戰現在最知名的辦公室工具軟體:Google文件(包含Google文件、Google試算表與Google簡報)。整體做法前半部跟前一篇很像,也是將SVG轉換成EMF格式,但後半部則是要藉助Google Drawings的功能才能EMF插入Google文件中。這篇的做法來自於Hacker's ramblings,但其實網路上相關教學早已多不勝數,不過中文的教學卻還是十分欠缺。所以特別整理成這一篇供大家參考。

(more...)

將Google試算表的圖表匯出成SVG向量圖檔 / Guide to Export Charts in Google Spreadsheet

將Google試算表的圖表匯出成SVG向量圖檔 / Guide to Export Charts in Google Spreadsheet

image23

如何從Google文件中的繪圖匯出高解析度的圖片之後,這篇要來講怎麽將Google試算表中的圖表輸出成SVG向量圖檔,以便轉換成高解析度的PNG圖片。雖然Google試算表的圖表可以輕易跟Google Docs結合,但很遺憾的是,它跟Google Docs中的繪圖一樣只能輸出72dpi的低解析度圖片,遠不及列印所需的高解析度300dpi,最後列印的時候將會看起來非常模糊。這篇將教你如何將Google試算表變成發佈網頁,然後再用我寫的書籤小工具Google-Spreadsheet-Chart-to-SVG將網頁上的圖表轉換成SVG並直接下載,這樣就可以取得圖表的SVG向量格式檔案了。

(more...)

如何從Google文件中的繪圖匯出高解析度的圖片 / Get High-Resolution Images from Drawing in Google Docs

如何從Google文件中的繪圖匯出高解析度的圖片 / Get High-Resolution Images from Drawing in Google Docs

image

我現在常常會在Google Docs (Google文件)上編輯文件,不僅方便與其他人協同作業,Google Docs內建的一些功能也足夠讓我寫入想要的內容,包括繪圖功能(Drawing)。然而Google Docs中使用繪圖功能畫出來的圖片,通常在下載成其他格式的檔案、發佈到網頁上的時候會有問題,特別是繪圖功能儘管是向量圖片,但卻預設是以72dpi的低解析度來呈現圖片,因此列印繪圖功能繪製的圖片時,看起總是慘不忍睹。

若要從Google Docs的低解析度繪圖中取得高解析度的圖片,我們需要將繪圖另存成SVG,然後使用InkScape之類的SVG編輯器來匯出高解析度的圖片。以下我就將這個方法整理一下,希望對與Google Docs使用者有所幫助。

(more...)

超簡單!文本機器分類入門 / Text Classification with Weka

超簡單!文本機器分類入門 / Text Classification with Weka

image

這篇「超簡單!文本機器分類入門」是我在2017年3月於政大圖檔所資料探勘課程中的演講內容,之後演化成後來我在巨量資料探勘與統計應用課程中「非結構化資料分析:文本分類」單元的內容。如果想要看比較完整的文本分類介紹,請看「非結構化資料分析:文本分類」這篇。不過想要看獨立的文本分類課程的話,那也可以從這篇開始看起喔。

(more...)

非結構化資料分析:文本分類 / Unstructured Text Analytics: Text Classification

非結構化資料分析:文本分類 / Unstructured Text Analytics: Text Classification

image

這是巨量資料探勘與統計應用課程的投影片「非結構化資料分析:文本分類」。本單元是屬於系列課程中的「資料預測級」中最後一個單元。處理資料類型是為非結構化的資料進行分類,也就是使用類別資料。這邊使用了Jieba斷詞來作文本語義分析,然後使用樸素貝氏多項式文本分類器(NaiveBayesMultinomialText)來為文本進行分類,最後還用特徵篩選(Select attributes)找出關鍵字。到底圖書館員分類編目的核心技能會不會被這篇所講的自動化文本分類機器所取代呢?看完這個單元你就可以知道結果了。本單元使用了二個我自製的工具來搭配Weka實作文本分類,單元內包含了四份實作學習單跟一份測驗,供同學邊看邊練習。這個單元包含了四個實作學習單跟一份測驗,供同學邊看邊練習。

(more...)

分類與預測:貝氏網路 / Classification and Prediction: BayesNet

分類與預測:貝氏網路 / Classification and Prediction: BayesNet

image

這是巨量資料探勘與統計應用課程的投影片「分類與預測:貝氏網路」。本單元是屬於系列課程中「資料預測級」的第一個單元,處理資料類型是從「類別」來預測「類別」類型的資料。貝式網路(BayesNet)是一種能夠表示變項間因果關係的機率模型,原理簡單、計算速度快,不僅可以用來預測結果,還能推理可能的原因。貝式網路是早期專家決策支持系統最常使用的模型,例如可以用來協助醫生找尋病因。本單元先用簡單「吸菸可能造成生病」的例子來說明貝式網路的運作方式,再來使用Weka來建立貝式網路結構、準備訓練集跟測試集、顯示貝式網路模型以及預測結果。本單元使用了四個我自製的工具來搭配Weka實作貝式網路預測,單元內包含了三個實作學習單跟一份測驗,供同學邊看邊練習。

(more...)

行為順序檢定:滯後序列分析 / Behavior Analysis: Lag Sequential Analysis

行為順序檢定:滯後序列分析 / Behavior Analysis: Lag Sequential Analysis

image

這是巨量資料探勘與統計應用課程的投影片「行為順序檢定:序列分析」。本單元是屬於系列課程中的「資料檢定級」的最後一個單元,處理資料類型也是在行為的「類別」類型資料,使用的分析技術就是以前我常常提到的滯後序列探勘(lag sequential analysis)。滯後序列分析是延伸前一單元列聯表的檢定方式,但是不像卡方統計量是用於檢定整體列聯表,它使用Allison與Liker(1982)的調整後殘差計算方式來做細格檢定。雖然資料類型都以列聯表呈現,不過計算方法可是差很多的喔。跟以前我介紹滯後序列分析的內容相比,這次不僅採用比較嚴謹的Allison與Liker的計算方法,還加入了相關係數Yule'Q的計算,並直接用jsPlumb畫出了事件轉移圖。本單元使用我所開發的滯後序列分析計算器來作計算,包含兩個實作學習單跟一份測驗,供同學邊看邊練習。

(more...)

類別變項的相關檢定:卡方獨立性檢定 / Correlations with Categorical Variables: Chi-Square Test of Independence

類別變項的相關檢定:卡方獨立性檢定 / Correlations with Categorical Variables: Chi-Square Test of Independence

image

這是巨量資料探勘與統計應用課程的投影片「類別變項的相關檢定:卡方獨立性檢定」。本單元是屬於系列課程中的「資料檢定級」中的第三個單元,處理資料類型是「類別」類型的資料,可以檢測出兩兩類別資料之間的關係。本單元要講的分析技術是推論統計的卡方獨立性檢定(Chi-Square Test of Independence),相當適合質性研究所蒐集的類別資料或行為分析。本單元的分析工具是我額外開發的「卡方獨立性檢定計算器」,在投影片裡面還談到了隱含在卡方檢定之後的陷阱:辛普森詭論(Simpson's paradox)。這個單元包含了四個實作學習單,供同學邊看邊練習。

(more...)

連續變項的相關檢定:皮爾森積差相關分析 / Bivariate Correlation Analysis: Pearson Correlation Coefficient

連續變項的相關檢定:皮爾森積差相關分析 / Bivariate Correlation Analysis: Pearson Correlation Coefficient

image

這是巨量資料探勘與統計應用課程的投影片「連續變項的相關檢定:皮爾森積差相關分析」。本單元是屬於系列課程中的「資料檢定級」的第二個單元,處理資料類型是分析兩兩「連續」資料之間的關係。本單元將會教同學推論統計另外一個很常見的分析技術:皮爾森積差相關分析,它可以用來檢測兩個連續變項之間的相關程度與相關的方向。本單元使用我撰寫的皮爾森積差相關分析計算器,並不需要同學用手算。這個單元包含了二個實作學習單跟一份測驗,供同學邊看邊練習。

(more...)

連續變項的差異檢定:獨立樣本t檢定 / Testing Differences Between Means: Independent t-test

連續變項的差異檢定:獨立樣本t檢定 / Testing Differences Between Means: Independent t-test

image

這是巨量資料探勘與統計應用課程的投影片「連續變項的差異檢定:獨立樣本t檢定」。本單元是屬於系列課程中的「資料檢定級」的第一個單元,處理資料類型是從「類別」分類的「連續」資料。本單元主要教的是推論統計最常見的分析技術:獨立樣本t檢定,可以用來檢測兩組不同樣本的平均值是否有顯著差異。t檢定是由健力士的統計學家William Sealy Gosset博士發表的經典分析方法。在喝健力士啤酒的時候,可別忘了統計的t檢定喔。本單元使用了R-Web跟我撰寫的獨立樣本t檢定計算器,並不需要同學用手算。這個單元包含了二個實作學習單,供同學邊看邊練習。

(more...)

最佳化問題:規劃求解 / Optimization Problem: Solver

最佳化問題:規劃求解 / Optimization Problem: Solver

image

這是巨量資料探勘與統計應用課程的投影片「最佳化問題:規劃求解」。本單元雖然被歸類系列課程中的「資料敘述級」,但其實它跟其他的資料分析方法有很大的不同:規劃求解會直接給你明確的答案。在本單元中,處理資料類型為「連續」類型。

「規劃求解」是屬於「最佳化問題」領域中的技術。雖然同樣是處理數字,但「最佳化問題」並非「統計」,而跟「資料探勘」領域比較相近。在大部分資料探勘的工具裡,要解決的問題比較明確、使用者較難以自行控制。而許多資料探勘介紹的基因演算法(Genetic Algorithm, GA)又是「最佳化問題」中的進階技術,一般使用者難以輕易上手。所以我這個單元介紹的是「最佳化問題」中比較基礎的「規劃求解」。

「工廠在有限的物料跟時間內,要選擇生產多少產品,才能賺到最多利潤?」或者是「圖書館有10萬元經費,不同讀者想看不同類型的書,要怎麼買才能在有限經費內滿足讀者需求?」像是這些問題,都可以用規劃求解來找出答案。本單元利用Google試算表Solver來實作規劃求解,學生不用自己動手算喔。這個單元包含了三個實作學習單,供同學邊看邊練習。

(more...)

AI解籤不用1秒,廟公要失業了嗎?Weka的中文自動評分:預測詩籤的等第 / Automatic Chinese Text Scoring in Weka: Rating Fortune Slips

AI解籤不用1秒,廟公要失業了嗎?Weka的中文自動評分:預測詩籤的等第 / Automatic Chinese Text Scoring in Weka: Rating Fortune Slips

image

人工智慧要為非結構性的文本型資料評分,要評到精準是很難,但如果只是簡單地給個評分的話,其實是非常簡單的事情,不需要寫任何程式碼。繼我之前寫的「Weka試跑文本評分」,這次我一樣直接使用Weka來為「雷雨詩籤百首」中的籤文與等第建模,做到Weka看到「一舟行貨好招邀 積少成多自富饒 常把他人比自己 管須日後勝今朝」就知道是「上吉」。此外,還能透過特徵選取(select attributes)功能來篩選出影響等第的籤文關鍵字喔。

(more...)

資料聚類:分群 / Clustering

資料聚類:分群 / Clustering

image

這是巨量資料探勘與統計應用課程的投影片「資料聚類:分群」。本單元是屬於系列課程中的「資料敘述級」,處理資料類型主要是「連續」類型資料,不過其實Weka的K平均法也能處理「類別」資料就是了。

本單元的「分群技術」屬於「資料探勘」(data mining)領域的其中一個主題,而此技術是繼前面統計圖表、資料的中心與離度之上,可用於描述多維度、超大量複雜資料的有效方法。如果你拿到一份複雜的資料,不知道該怎麼解析它的時候,不妨先丟進分群跑看看資料會有什麼特徵吧。

我為了這個單元開發了「Weka分群結果分析器」,可以搭配Weka中K平均法分群一起使用。這個單元包含了四個實作學習單,供同學邊看邊練習。

(more...)

資料的中心與離度 / Measures of Center and Spread

資料的中心與離度 / Measures of Center and Spread

image

這是巨量資料探勘與統計應用課程的投影片「資料的中心與離度」。本單元是屬於系列課程中的「資料敘述級」,處理資料類型主要是「連續」類,但也其中的眾數也可以描述「類別」類型。

這個單元講述的是各位同學國中就學過的均值跟離度的算法,包括平均數、中位數、眾數、最大值、最小值、四分位數、變異數與標準差。這次我們的重點不在於計算,而是要瞭解均值跟離度如何有效地用於描述資料。跟以前大多著重在公式跟按計算機不同,現在我們就用Google試算表的函式計算均值跟離度即可。本單元包括了五個實作學習單,供同學邊看邊練習。

(more...)

數位繪圖開心畫:線稿、上色與遊戲 / Let's Draw on the Computer: Outline, Colour and Gamify

數位繪圖開心畫:線稿、上色與遊戲 / Let's Draw on the Computer: Outline, Colour and Gamify

image

這是2017年我在國立空中大學數位故事研習社講的主題:「數位繪圖開心畫:線稿、上色與遊戲」。這次著重的是借助一些免安裝的免費工具來進行簡單的數位繪圖,是開心畫的課程。而趁著人工智慧風潮的盛行,課程中也加入了Google的AutoDraw繪製線稿Python的PaintsChainer智慧上色等內容。最後再將成品做成滑塊拼圖遊戲,將繪製的成果分享給其他朋友。

(more...)

Google試算表也能算推論統計:XLMiner Analysis ToolPak之獨立樣本t檢定 / Student’s t-test in Google Spreadsheet: XLMiner Analysis ToolPak

布丁布丁吃布丁

Google試算表也能算推論統計:XLMiner Analysis ToolPak之獨立樣本t檢定 / Student’s t-test in Google Spreadsheet: XLMiner Analysis ToolPak

image

算統計一定要SPSS嗎?這可是大大的認知錯誤。除了SPSS之外,ExcelR-Web都有許多統計工具。不僅如此,就連Google試算表的外掛程式也有統計工具XLMiner Analysis ToolPak可以用。今天這篇就要帶大家來用Google試算表計算推論統計中最常用的獨立樣本t檢定,步驟簡單又實用。

(more...)

不寫程式也能預測未知!用Weka分類模型來預測未知案例 / Make predictions with Saved Machine Learning Model in Weka

不寫程式也能預測未知!用Weka分類模型來預測未知案例 / Make predictions with Saved Machine Learning Model in Weka

image

雖然Weka有很多用來預測的分類演算法,但真正用Weka來進行預測的教學卻很少。這篇將參考「How to Save Your Machine Learning Model and Make Predictions in Weka」的教學,從比較容易為大家編輯的試算表檔案開始,如何利用Weka的分類功能來為未知案例進行預測。

(more...)