:::

「布丁布丁吃?」與讀者的互動

布丁布丁吃布丁

「布丁布丁吃?」與讀者的互動

在回答這一問之前,我必須先承認,我並沒特別積極地有想要跟讀者或是其他人互動。我只是單純地把一些資料記錄在這邊,讀者要看、要做什麼,請各自隨意。不過既然這是一個Blog,它也就具備許多跟讀者互動的功能。我之前也心血來潮地為「布丁布丁吃?」加上了反應與投票功能,不過結果怎樣,倒也沒什麼在看。

不管怎麼說,還是先整理一下關於讀者互動的資料吧。


互動管道

目前為止,「布丁布丁吃?」的互動管道有「張貼意見」、「訪客留言板」、「Facebook讚」、「反應」與「星號評等」等三個類別。各別介紹如下:

張貼意見

image

「布丁布丁吃?」最主要的互動管道是Blog的「意見」功能(response),這是作為一個blog最基本、也是最重要的功能。讀者可以在文章下方張貼意見,「布丁布丁吃?」允許Google帳號、OpenID、甚至是匿名使用者來發表各自的意見。為了防止廣告機器人,我還設置了留言驗證詞與垃圾留言過濾的功能。

大部分讀者會張貼意見詢問這篇文章的問題,或是表示感謝、有用等意見。張貼意見的訊息會即時送到我的e-mail,而我也會儘快地給予回應。至於太複雜的問題,我可能會先暫時放著,待稍後有空處理完再來回答。

不過也有部分讀者的意見跟文章本身沒有關係,只是想跟我講講話、或是詢問一些問題。後來我設計了一個訪客留言板,供讀者發表那些沒有針對特定文章的意見。

除了讀者之外,我自己偶爾也會使用張貼意見來補充文章內容的不足。像是這個yam天空影音下載器IE版已經不能使用了,我是在張貼意見處提示讀者。但其實這不是很好的作法,只是純粹懶得開啟文章來編輯而已。題外話,這篇已經不能使用的文章卻是「布丁布丁吃?」點閱量最高的一篇文章。

訪客留言板

image

訪客留言板其實是我利用其中一篇blog文章的張貼意見修改而成。雖然它看起來像是掛在右邊側欄上的小工具,但實際上它仍是針對某一篇文章的張貼意見功能。

如果讀者想要詢問問題,卻又不知道要去哪裡問的話,我會建議它使用訪客留言板這個功能。不過如果是私密的問題,那我會請讀者寫信來詢問。這兩種方式都是將意見寄信到我信箱而已,對我來說並不會有什麼差別。

Facebook讚、星等評分與反應

image

image

Facebook的「讚」(like)按鈕是社交平台上常見的功能,我也不免俗地讓「布丁布丁吃?」加入Facebook的行列。

「星等評分」與「反應」這兩個功能是Blogger內建的功能。基於嘗鮮的心態,我也將之加入「布丁布丁吃?」當中。每篇文章都有星等評分與反應可以記錄讀者的回饋,讀者可以針對這篇文章給予1到5顆星的評價,1顆星表示非常討厭這篇文章、5顆星表示非常喜歡這篇文章;反應是由我來設計,因為不知道要設什麼反應比較好,目前只有「加油」、「好玩」、「有趣」、「實用」這四種反應可供表達。每位讀者只能做一次星等評分,或是選擇任一種反應一次,不能重複評分或重複表達同一種反應。

然而很遺憾的是,這三個功能的背後還沒有任何統計管理功能,目前只能一篇一篇文章去查看各自的評分與反應。與其說這是讀者給我的互動,不如說這是讀者給其他讀者的互動還比較合適。

與讀者互動的感想

我覺得讀者的互動中大致上可以分成兩種,一種是禮貌上的招呼,另一種是問題。

有些讀者受惠於「布丁布丁吃?」的文章之後,會利用張貼意見功能來表達感謝之意,或是告訴我他要轉載到其他地方,也有完全看不懂文章,只是回一個「我都看不懂」的意見出現。這些偏向閒聊的意見,我大多都會禮貌性地回應一下。

另一種是不懂我文章內容、需要更進一步詢問細節的讀者。因為「布丁布丁吃?」有些文章介紹的技術與工具並不是這麼容易上手,或是在不同情況下又會遇到我本來撰寫時不曾遇過的問題,遇到這種意見常常讓我難以處理。

其實我是比較樂意讀者提出後者這種問題,這不僅表示有讀者受惠於這篇文章(雖然還沒完全解決問題),當我幫助讀者解決問題時,這些資訊都是可以改善這篇文章的內容。然而有時候太過困難的問題,我往往難以在短時間內處理,就只能先放著等以後有空。事實上,現在還有三個我想要處理、但是還沒有時間去研究的問題意見,這包括數讀、訪客留言板以及最新回應的功能。

我偶爾也會看看Blogger提供的流量統計以及Google分析的統計數據,每次都對越來越多的點閱量感到困惑。但統計數據無法跟我互動,我也不打算把「布丁布丁吃?」當做廣告平台來吸引流量。這個流量統計我也只是當做茶餘飯後的資料看看而已。

Blog之外的互動

除了利用blog內建功能在網路上進行互動之外,也有讀者會透過e-mail跟我聯絡,甚至是私下請教問題、進行訪談。

日前有研究生想要調查個人圖資部落格回應行為之研究,與是以e-mail跟我相約訪談,最近就要與他約談。12月時也有讀者不知如何設定DSpace中文語系,用e-mail聯絡來往多次仍不得其解,最後親自抱著筆電來政大看我一步一步的操作。甚至月初時實驗室有位應徵者在跟助理面試的過程中聊到我,突然跟在實驗室角落寫論文的我打聲招呼,說能看到我本人真是難得。

至於圖資相關研究所的學生似乎也有一些人受惠於「布丁布丁吃?」的內容。偶爾會有剛入學、不太認識的學弟妹跟我說:「我考研究所時有看你的blog耶。」雖然最後能考上是由於他們自己本身很優秀的關係,但能聽到人家這樣說,就會為「布丁布丁吃?」能幫上忙而感到開心。

其中,最讓我印象深刻的一次,是之前圖檔所舉辦資訊計量的研討會時,飛資得知識長的溫達茂先生在臺上發表他利用Yahoo網站連結分析工具研究「政大圖檔所」網站連結,結果就突然冒出一個「布丁布丁吃?」,著實讓我嚇了一跳。這是因為「布丁布丁吃?」有許多記錄我在政大圖檔所裡面所做的事情,所以自然也很多連結指向它,會有此結果並不意外。

似乎是從溫先生爆料之後,所上老師便會注意到有「布丁的blog」這個網站存在。我的指導老師常常以為我的blog非常熱門,而想要訪談我的研究生似乎也是因為所上老師推薦所以才找到我這邊來。偶爾跟學姊聊到「布丁布丁吃?」時,學姊也說我的blog在圖資界非常有名。

儘管這種名聲大多都只是讓人虛榮心作祟而已,但其實很多時候,我還寧願勸人來我blog看一下某篇文章,省下自己探索的時間。例如我身旁的助理正在拿著一本書研讀Lucene,我就介紹他到「布丁布丁吃?」看一下我之前寫的全文搜尋引擎Lucene簡介投影片,讓他可以先對Lucene有個概括的了解。


小結

不知道為什麼,我似乎可以預想到有人會問我:「會不會想要經營部落格讀者社群」的這種問題。老實說,我並沒有這種打算,也不覺得這種經營對我或對大家有什麼好處。

一如我開頭所說的,「布丁布丁吃?」對我來說只是個文章保存庫,我只要他能夠保存文章、供人取用就夠了,此外也沒有太多要求或目標。當然,如果有人想要針對「布丁布丁吃?」做任何研究或探討,還是可以與我聯絡討論看看的。

最後一問:

「圖資相關blog介紹」推薦一下圖資人值得瀏覽的部落格,並敘述理由。

(more...)

45巷My麵屋

布丁布丁吃布丁

45巷My麵屋

IMAG0252

  • 店名:My麵屋
  • 位置:指南路二段45巷內
    image
  • 菜單:麵 (超甜的紅茶自取)
  • 價位:40NTD~80NTD
  • 座位:高峰期有點難找位置
  • 環保:提供筷子與湯匙

My麵屋

IMAG0252

殺人魔王一樣位於指南路45巷的一家小店,是另一家不起眼、但是卻很熱門的店面。My麵屋就如其名一樣,主要就是賣麵,還有小菜,泡得非常甜的咖啡紅茶可以自取。不過他的他的特別在於他還有賣特製的「涼麵」,是一般店面難以吃到的蔬菜麵。

店面環境我覺得就一般,不能說得上乾淨、但也沒有特別髒到不能坐。店內空間雖然不小,但是卻塞了很多位置,讓人坐起來感覺擁擠。店內有一個很大的電視,大部分客人都是一邊看電視上的新聞一邊吃麵。

IMAG0253

My麵屋的菜單可以分成湯麵類、乾麵類、涼麵類與湯類。基本上都不難吃,而大碗的份量也是可以吃飽。雖然份量沒辦法跟飽飽食府相比,但是價位也比較便宜,要吃多吃少就看狀況選擇吧。

IMAG0256

就跟大部分麵店一樣,My麵屋也提供小菜區。雖然小菜的味道不怎樣,但是柴魚片跟蔥可以自己加的這點還讓人感覺不錯。這樣吃我喜歡的皮蛋豆腐時就可以加很多柴魚片了。

沙茶牛肉涼麵小碗 (70NTD)

IMAG0254

涼麵是My麵屋的特產,其中最昂貴的就是沙茶牛肉涼麵了,大碗80元,小碗70元。沙茶牛肉涼麵是由牛肉塊、胡蘿蔔條、小黃瓜條、蔬菜涼麵再搭配特製沙茶醬料組成。味道香淳,牛肉塊吃起來也是很有勁,我個人認為這是My麵屋裡面最好吃的餐點。

IMAG0255

My麵屋裡面的麵似乎是使用寬麵,上圖是涼麵使用的蔬菜麵,麵本身就是綠色的。寬麵的口感不錯,吃起來很有飽足感。沒有綠色的麵就會被分類到「乾麵類」,價格比涼麵類便宜10元,但是我覺得味道沒什麼差。所以平常我大多都點到「沙茶牛肉乾麵」而已。

附帶一提,雖然是涼麵或乾麵,但麵其實都是現煮的,一點也不涼,剛吃的時候還會燙。只不過這跟麵食的美味沒啥關係就是。

My麵屋另一個我常吃的餐點則是大滷麵,小碗50元、大碗60元。大滷麵全都是由青菜組成,有我喜歡吃的筍子,味道清淡。當我身體不適、想吃清淡麵類時,我總是會點個大滷麵小碗來吃吃。大碗的份量非常之多,加上味道清淡不會想吃太多,所以每次點了之後自己都會後悔。


結語

My麵屋雖然位於偏僻的45巷弄裡面,但是用餐時間還是常常很難找到位置,通常是要跟其他客人擠一擠、挑個角落塞進去才行。此外,My麵屋的價位對學生來說還蠻友善的,雖然他的麵大多都非常重口味,而咖啡紅茶又甜到令我喝不下去,結果吃完之後我總是會到對面水果攤買個水果、或是到對面的清心買飲料來解渴。

(more...)

推測COMODO Time Machine (CTM) 原理

布丁布丁吃布丁

2 Comments

推測COMODO Time Machine (CTM) 原理

image

備份、還原是每一台電腦都需要具備的功能。如果你還停留在電腦壞掉就要重灌的老舊思想,那我建議你該考慮學習一下備份、還原工具,例如現在我介紹的這個COMODO TIme Machine。以下是屬於個人心得,並沒有做太仔細的技術名詞確認。如果哪邊講錯了,還請告知一下。

為什麼不是用Windows的系統還原功能

雖然Windows內建了系統還原功能,但大部分人都不使用,甚至是不信任他的存在。

這是因為Windows的系統還原工具只是備份還原「系統檔案」(Windows資料夾中的資料,但不是全部)、「登錄檔」、「安裝程式」(只有部分)。在安裝驅動程式或是新的軟體時常常會造成系統不穩定,這時候Windows的系統還原就能夠派上用場。

但很遺憾的是,大部分情況下,Windows的系統還原是無法讓你的電腦恢復正常。更糟糕的情況當電腦壞到你連Windows都進不去的時候,Windows系統還原功能就幾乎沒有用武之地。

傳統磁碟映像檔(Image)備份

傳統談到硬碟備份,大多數人會想到的名詞就是「Ghost」,其實它所指的是Symantect Ghost。Ghost的技術是將硬碟或磁區備份成一個「映像檔」,要還原時,則是從這個映像檔再讀出資料、寫入硬碟中。這種技術可以準確地保證硬碟狀況「完好如初」。

即使操作方式略有不同,大部分的硬碟備份/還原軟體幾乎都是用這種思維在運作。早期的Ghost是只能在DOS環境下運作,後來的版本則可以在Windows一起運作。我常用的Acronis True Image也差不多,操作介面比Ghost友善,甚至加入了我最為激賞的「Acronis Secure Zone」(Acronis安全區),可將映像檔存放在隱藏的磁區中,並可在開機尚未進入Windows之前就可以進行備份/還原的工作。

使用Acronis True Image的好處是什麼?如果配置得當的話,當我電腦壞掉之後在進行還原,只需要7分鐘的時間,就恢復到當初備份時的狀況。而且系統目錄稍作變更調整,就可以確保桌面、我的文件等個人資料不會一起還原。

傳統映像檔備份還原的缺點:太過複雜

儘管乍看之下映像檔似乎能夠很完整地保存硬碟的情況,但實際操作時,你就會發現其實這還是有很多問題。

首先,使用者必須了解硬碟的磁區、分割、開機區等構造。如果你使用Acronis True Image,還要搞懂完整備份與差異備份的差別在哪裡。要到還原的時候,你還要回憶一下當初備份的映像檔到底放在哪邊、要還原到哪個分割區才行。

這一切操作手續都對一般電腦使用者來說太過複雜、太過低階。(儘管比起很多工具,他們已經相對高階了) 隨著時代技術的發展,我們追求的是更簡單、更直覺、更好操作的備份還原工具。

COMODO Time Machine:記錄差異

看過T邦客的介紹之後,我最近決定幫家裡電腦採用這個更容易上手的COMODO TIme Machine (番茄時光機器,以下簡稱CTM)。介紹文章已經很詳細,在此就不再贅述:

CTM本身是免費軟體,任何人都可以下載、安裝使用:

image

CTM在操作的時候隱藏了大部分的細節,除了「備份」、「還原」功能之外,最複雜的也只剩下快照的「樹觀圖」(Tree View)。

在CTM中,備份的資料並不叫做「映像檔」,而是叫做「快照」(Snapshots),這是因為他與傳統的映像檔備份有極大的區別。快照建立的速度極快,如果與上一個快照之間差異沒有很大的話,建立一個快照大概不需要10秒,而所需空間甚至只佔數MB。反觀傳統映像檔的備份,隨著硬碟越大、備份時間越長,80G的硬碟大概要備份30分鐘,這又是另一個讓人懶得常常備份的原因。

為什麼CTM的快照能夠這麼快、這麼小?很多人都在猜測CTM的運作原理,而根據我在使用時遇到的狀況中,我認為CTM做的是「記錄差異」而已。CTM的運作特點可以歸納如下:

  1. CTM只會在第一次安裝時備份整個硬碟分割區的映像檔
  2. 之後在CTM中建立的快照,都是與原始映像檔或是上一個快照的差異備份。也就是記錄你修改過的地方而已。
  3. 當電腦狀態與上次快照的變更越少,建立快照就越快、檔案越小。反過來說,越久沒有建立快照,則建立時就必須儲存更多差異、檔案也越大。
  4. 當你因為更換硬碟、調整硬碟磁區而導致CTM被破壞的話,硬碟狀態會還原到第一次安裝CTM的原始映像檔。

而CTM最大的隱憂也在於最後一點。安裝了CTM之後,就請千萬不要輕易決定要變更硬碟的狀況,否則一切都會還原到你當初安裝CTM的時候。這頂多只比Windows完全進不去還好一點點而已。

因此在使用CTM時,我仍然呼籲大家要將個人資料與系統資料分開安裝,詳細的教學請看我之前的介紹:Windows XP改變「我的文件」與「桌面」的儲存資料夾

反過來說,如果你電腦的環境是時常會更換硬體的話,那麼傳統的映像檔備份還原工具就比較適合你,例如將一台電腦的狀況備份到多台電腦上。當然,這就是網管才需要去鑽研的課題,而個人使用者就不太需要去煩惱這種問題。


結語

總而言之,CTM這個備份還原技術實在高招,簡單的操作讓一般使用者也能輕易上手。我都跟我家人說,沒事就按一下備份快照,簡單、快速又輕鬆。此外他也具備進入Windows前的備份還原功能,讓保護更為全面。最重要的是,他是免費的。

希望未來大家不要再把「重灌Windows」當做一個自豪的技能,而是將配置好穩定的「備份還原環境」視為最重要的任務吧。

(more...)

內/外控量表 Locus of control

布丁布丁吃布丁

內/外控量表 Locus of control

Rotter(1966)發展的內/外控量表是非常知名的泛用性心理測驗,我在研究中也將內/外控作為受試者調查的一個變量,用來探索受試者在標註系統中會有何種傾向。但是在找尋量表的時候卻發現針對原始量表的中文翻譯在網路上意外地難找,最後我是從「性格與社會心理測量總覽(下)」一書中找到看起來較為合適的中文翻譯拿來使用。

這個量表已經公開了將近半個世紀,我想就用這篇文章將量表的原文與中文翻譯記錄一下,並作一個簡單的介紹。

什麼是控制源(Locus of control)?

控制源(Locus of control,也有人翻譯做控制點)指的是人們對於成敗或後果原因所抱持的一概括性的期望。內在控制源(內控)指的是個人相信自己對所經歷的成敗負有責任,即相信個人的行為、性格、才能等是個人經歷的主要決定因素;而外在控制源(外控)指的是個人認為自己所得到的結果主要是由外部力量決定的,如運氣、社會關係、他人或其他因素。控制源概念的關注焦點在於個人所感知到的行為、性格與事件之間的互賴關係。

量表說明

控制源是一種單維度連續變項,一端稱為內控,另一端為外控。Rotter內/外控量表利用23對二選一單選測試題來調查,採用迫選作答式。此外還有了6對掩飾題。量表中內/外控測題成對出現,每條外控題記1分,總計分在0分(極端內控)至23分(極端外控)之間。必須強調的是,有些研究計分方式剛好相反:分數高的是內控、分數低的是外控。在使用與文獻探討上請務必注意到這之間的區別。在內/外控分組的處理上,Hsieh & Dwyer (2009)是依所有受試者的平均分數來分割組別,其研究中平均值為11.46分(標準差3.50),則12分以上作為外控、12分以下作為內控。

Rotter的內/外控測驗不是在於區別好壞,純粹只是調查受試者的傾向。許多研究將內外控的分類作為探索工具,用來在研究中預測傾向內控/外控的人們會有某些特別的特徵。儘管內外控量表非常有名,但是由於它的專門性不高,後人研究多將之改良成適合特定領域的專門問卷。大多數可以找到的文獻中都不是採用原始的內外控量表,而改量過後的問卷則會有使用上的限制,包括對象年齡、教育程度、研究目的等等。在使用上需要特別注意。

量表的信效度

Rotter內/外控量表作為一個評量工具,我們就要先確認它的信效度究竟到什麼程度,才能評估它的好壞。

信度方面,Rotter在1996年的「Generalized expectancies for internal versus external control of reinforcement」研究中調查結果來看,內部一致性信度(計算方式為Kuder-Richardson,中文常翻譯為庫李法)達到0.70;再測信度中,60名大學生樣本間隔一個月後再測信度係數值為0.72,117名大學生間隔兩個月後再測信度係數值為0.55。Rotter認為造成兩種再測信度差異的原因是因為施測方法不同。

效度方面,有關內/外控的研究中,有一半以上採用了Rotter的量表,而大部分文獻都揭示人們對於自己控制自己命運的感知是存在個別差異,而Rotter量表能夠敏感地辨別出這些差異。

閱讀學習與內外控

在閱讀學習方面,不少研究將內/外控作為一種學習型態的變量。認為學習責任較多在自己身上的人稱之為「內控」(internal controll),反之認為責任不在自己身上的人稱之為「外控」(external control)。(Lefcourt, 1982) 在需要使用技能的情況下,比起外控來說,內控會花更多時間在決策上;在較不要求技能或是較憑運氣的任務中,內控的回應中表現較為粗心大意與衝動。(Johnson & Kilmann, 1975; Kukulu, Buldukoglu, Kuladaç & Köksal, 2006; Wheeler & Davis, 1978)

某些傾向外控、能力較差的讀者需要在閱讀過程中支援(Coker, 1990; Coldevin et al., 1993)。這些學生相信他們的表現不會受到獎勵影響,而且通常難以控制。因此,他們需要教師的支援,甚至會懷疑自己的學習能力。Coker等人(1990)研究發現內控學習型態的讀者閱讀表現較佳,同時作為一個優秀的讀者,他們也能在閱讀中使用多種閱讀策略。比起較差的讀者來說,這種能力能夠幫助內控學習者理解未知單字的意義。(Arden-Close, 1993)。

內/外控量表題目

問卷來源:原始來源是來自Rotter(1966),控制源教學網頁裡面也有詳細的教學。(注意,裡面的內外控計分是高分內控、低分外控)中文翻譯是參考自楊中芳(1997)。

問卷說明:這份量表只是用來了解您對事情的看法和感受,並沒有對錯。請根據您個人真正的想法、感覺或行為來回答以下的問題,感謝您的合作。

1 a. 子女出了問題是因為父母懲罰過度。
Children get into trouble because their parents punish them too much.
b. 現今多數孩子的問題是父母過分溺愛。
The trouble with most children nowadays is that their parents are too easy with them.
2 a. 人們生活中發生的很多倒楣事,在某種程度上是由於運氣不佳所致。
Many of the unhappy things in people's lives are partly due to bad luck.
b. 人們的不幸是其自身錯誤造成的。
People's misfortunes result from the mistakes they make.
3 a. 戰爭發生的一個主要原因是人們對政治漠不關心。
One of the major reasons why we have wars is because people don't take enough interest in politics.
b. 戰爭是永遠不可避免的,無論人們怎麼努力去防止它。
There will always be wars, no matter how hard people try to prevent them.
4 a. 從長遠來看,人生在世總會獲得應得的尊敬。
In the long run people get the respect they deserve in this world.
b. 無論個人如何努力,不幸的是其價值還是經常被忽略。
Unfortunately, an individual's worth often passes unrecognized no matter how hard he tries.
5 a. 「老師沒有公平對待學生」,這種看法毫無道理。
The idea that teachers are unfair to students is nonsense.
b. 多數學生都沒有意識到他們的分數受到偶然因素影響的程度有多大。
Most students don't realize the extent to which their grades are influenced by accidental happenings.
6 a. 不借助外力,一個人很難成為有效的領導者。
Without the right breaks one cannot be an effective leader.
b. 一些能幹的人未能當上領導者是因為他沒能把握機會。
Capable people who fail to become leaders have not taken advantage of their opportunities.
7 a. 無論您如何努力,有些人就是不喜歡您。
No matter how hard you try some people just don't like you.
b. 不能獲得別人好感的人是因為他們不懂得如何與人相處。
People who can't get others to like them don't understand how to get along with others.
8 a. 遺傳對人的個性有著主要的決定作用。
Heredity plays the major role in determining one's personality.
b. 一個人的生活經歷決定了他會是什麼樣的人。
It is one's experiences in life which determine what they're like.
9 a. 我常常發現「人算不如天算」。
I have often found that what is going to happen will happen.
b. 「聽天由命」對我來說永遠不如爭取主動「人定勝天」。
Trusting to fate has never turned out as well for me as making a decision to take a definite course of action.
10 a. 對於準備充分的學生來說,基本不存在考試不公這一類的問題。
In the case of the well prepared student there is rarely if ever such a thing as an unfair test.
b. 很多時候考題與課程內容相去甚遠,再用功也是白費。
Many times exam questions tend to be so unrelated to course work that studying in really useless.
11 a. 成功之道唯有刻苦努力,與運氣好壞無關。
Becoming a success is a matter of hard work, luck has little or nothing to do with it.
b. 找一份好工作主要靠天時地利。
Getting a good job depends mainly on being in the right place at the right time.
12 a. 平民百姓能夠影響政府決策。
The average citizen can have an influence in government decisions.
b. 世界是由有權有勢的少數人左右的,平民百姓無能為力。
This world is run by the few people in power, and there is not much the little guy can do about it.
13 a. 我在訂計畫時就已經幾乎肯定自己可以將之付諸實現。
When I make plans, I am almost certain that I can make them work.
b. 計畫訂得太早並不明智,因為很多事情只不過是運氣好壞的結果而已。
It is not always wise to plan too far ahead because many things turn out to be a matter of good or bad fortune anyhow.
14 a. 有些人簡直一無是處。
There are certain people who are just no good.
b. 每個人都有其可取之處。
There is some good in everybody.
15 a. 對我來說,達到自己的目標與運氣無關或關係很小。
In my case getting what I want has little or nothing to do with luck.
b. 很多時候,我們大可以靠拋硬幣來決定何去何從。
Many times we might just as well decide what to do by flipping a coin.
16 a. 誰能出人頭地常常首先取決於誰佔天時地利。
Who gets to be the boss often depends on who was lucky enough to be in the right place first.
b. 要讓人們幹正事靠的是能力而不是運氣。
Getting people to do the right thing depends upon ability, luck has little or nothing to do with it.
17 a. 就國際事務而言,我們大家都是那些我們既不了解也無法控制的力量的犧牲品。
Children get into trouble because their parents punish them too much.
b. 通過積極參與政治和社會活動,一般老百姓可以左右世界大事。
By taking an active part in political and social affairs the people can control world events.
18 a. 大多數人都未意識到他們的生活受偶然因素控制的程度有多大。
Most people don't realize the extent to which their lives are controlled by accidental happenings.
b. 「運氣」這類的事情根本不存在。
There really is no such thing as "luck."
19 a. 人在任何時候都應該勇於承認自己的錯誤。
One should always be willing to admit mistakes.
b. 處理錯誤的最好辦法就是加以掩蓋。
It is usually best to cover up one's mistakes.
20 a. 您很難了解某人是否真正喜歡您。
It is usually best to cover up one's mistakes.
b. 您有多少朋友取決您的人品有多好。
How many friends you have depends upon how nice a person you are.
21 a. 從長遠來看,發生在我們身上的壞事與好事相互抵消。
In the long run the bad things that happen to us are balanced by the good ones.
b. 霉運大多是無能、無知或懶惰的結果。
Most misfortunes are the result of lack of ability, ignorance, laziness, or all three.
22 a. 只要下足功夫,我們可以剷除政治腐敗。
With enough effort we can wipe out political corruption.
b. 人民對於政治家們的幕後活動鞭長莫及。
It is difficult for people to have much control over the things politicians do in office.
23 a. 有時我真不明白老師是怎麼打分數的。
Sometimes I can't understand how teachers arrive at the grades they give.
b. 我用功與否與我得的分數有直接關聯。
There is a direct connection between how hard 1 study and the grades I get.
24 a. 優秀的領導者要求人們自行決定應該做什麼。
A good leader expects people to decide for themselves what they should do.
b. 優秀的領導者明確地告訴每個人應該做什麼。
A good leader makes it clear to everybody what their jobs are.
25 a. 很多時候我覺得自己對周圍發生的事無能為力。
Many times I feel that I have little influence over the things that happen to me.
b. 要讓我相信機遇或運氣主導了我的生活是不可能的。
It is impossible for me to believe that chance or luck plays an important role in my life.
26 a. 孤獨的人是因為他們沒有盡力友善待人。
People are lonely because they don't try to be friendly.
b. 想方設法取悅他人沒有多大用,因為他們喜歡您就喜歡您,不喜歡您就不喜歡您。
There's not much use in trying too hard to please people, if they like you, they like you.
27 a. 學校裡太過強調運動了。
There is too much emphasis on athletics in high school.
b. 團隊運動是陶冶品性的極佳方式。
Team sports are an excellent way to build character.
28 a. 我的今天是我自己一手造成的。
What happens to me is my own doing.
b. 有時我感覺對自己目前的生活方向沒有太大的控制。
Sometimes I feel that I don't have enough control over the direction my life is taking.
29 a. 大多時候,我都不能理解政治家們的所作所為。
Most of the time I can't understand why politicians behave the way they do.
b. 從長遠來看,人民自己應對國家何地方政府的劣績負責。
In the long run the people are responsible for bad government on a national as well as on a local level.
 

內/外控量表計分

當受試者回答以下題目中得分的選項時,則獲得外控題得分1分。不在下列題目中的題目即為掩飾題,不論答哪個選項皆與結果無關。

[答案藏在捲軸下面]






2a
3b
4a
5b
6a
7a
9a
10b
11b
12b
13b
15b
16a
17a
18a
20a
21a
22b
23a
25a
26b
28b
29a

參考文獻

Rotter, J. B. (1966). Generalized expectancies for internal versus external control of reinforcement. Psychological monographs, 80(1), 1.

Robinson, J. (1997). 性格與社會心理測量總覽. (楊中芳, Tran.). 臺北市: 遠流出版事業股份有限公司.

Hsieh, P., & Dwyer, F. (2009). The Instructional Effect of Online Reading Strategies and Learning Styles on Student Academic Achievement. Journal of Educational Technology & Society, 12(2), 36-50.

Lefcourt, H. M. (1982). Locus of control: Current trends in theory and research. Lawrence Erlbaum.

Arden-Close, C. (1993). NNS Readers. Reading in a Foreign Language, 9(2), 867–93.

Cappella, E., & Weinstein, R. S. (2001). Turning Around Reading Achievement: Predictors of High School Students' Academic Resilience* 1. Journal of Educational Psychology, 93(4), 758–771.

Coker, L. S. (1990). Success in Nursing: A Primary Intervention Course. Nurse Educator, 15(6), 14.

Coldevin, G. (1993). Influence of Instructional Control and Learner Characteristics on Factual Recall and Procedural Learning from Interactive Video. Canadian Journal of Educational Communication, 22(2), 113–30.

Johnson, B. L., & Kilmann, P. R. (1975). Locus of control and perceived confidence in problem-soliving ablities. Journal of clinical psychology, 31(1), 54–55.

Kukulu, K., Buldukoglu, K., Kulakac, O., & Koksal, C. D. (2006). The effects of locus of control, communication skills and social support on assertiveness in female nursing students. Social Behavior and Personality: an international journal, 34(1), 27–40.

Maguiness, C. (1999). Show Us How: A School-Wide Programme for Reluctant Readers.

Wheeler, R. W., & Davis, J. M. (1979). Decision making as a function of locus of control and cognitive dissonance. Psychological reports.

Whitney, P. (1992). Children’s out-of-school activities. In 42nd annual Meeting of the National Reading Conference. San Antonio, TX (ERIC Document Reproduction Service No. ED 358 408).

Neill, J. (2006, December 6). Locus of Control - A Class Tutorial. Retrieved December 25, 2010, from http://www.wilderdom.com/games/descriptions/LocusOfControlExercise.html


  • 2011/4/1/:把「Caker」修正成為「Coker」了,而且原文裡面引用的文獻也是錯誤的,不是1989而是1990,在此修正。
(more...)

手機範本僅使用Blogger提供的服務

布丁布丁吃布丁

手機範本僅使用Blogger提供的服務

image image

Blogger在之前提供了手機範本的功能,只要在設定中開啟,並以手機等行動裝置開啟blogger之後,便能夠自動轉換成手機範本的樣式。如果是一般桌上型電腦的使用者,也可以手動地在blogger網址後面加上「?m=1」來啟用手機範本,例如:http://pulipuli.blogspot.com/?m=1

手機範本會強制blog的文章以適合狹小螢幕的樣式來顯示,並且刪去邊欄以及額外的JavaScript功能,這讓網頁讀取的速度加快許多。如果只是單純要閱讀文章的話,我會推薦使用手機範本來閱讀。

原本我也有安裝Blogger Touch這個第三方服務,但是在某次我想要利用Google搜尋自己Blog中的內容、卻總是找到被Blogger Touch擷取的頁面時,我就興起了關掉這個服務的念頭。

另一方面來說,減少一個第三方服務,也可以讓「布丁布丁吃?」的速度再加快一點,也未嘗不是一件好事。

因此最後決定將Blogger Touch關閉,僅留下Blogger提供的手機範本功能,再此一文記錄。

(more...)

論文進度報告:評估閱讀理解能力 Progress report: Measure Reading Comprehension

布丁布丁吃布丁

論文進度報告:評估閱讀理解能力 Progress report: Measure Reading Comprehension

image

要評估一個人的閱讀理解能力並不是很容易的事情。除了閱讀理解的程度會隨著文章不同而有所變動之外,閱讀理解能力還涉及多方面的概念,根據Cromley等人(2010)提出的DIME Model,認為閱讀理解涵蓋了「先備主題知識」、「推論」、「閱讀策略」、「閱讀詞彙」與「閱讀流暢度」這五個構面;而Keshav(2007)、Bogucka & Wood(2009)、John & Roy (2010)等人又針對學術論文提出了閱讀指導,他們認為學術論文的重點通常落於「研究問題」、「研究貢獻」、「研究結果」的證據、「結論」等部分。

為了使閱讀理解能力的評估更為客觀,我採用了兩種方式來評估:問答題形式的心得報告以及四選一選擇題的測驗。並規劃為期兩週的閱讀文章作業流程來取得這些資料,而這也就是我論文中最主要的實驗設計。

實驗規劃

image

這是實驗是在數位學習碩士課程中作為一個課堂報告進行。在課堂報告目的中融入了我的實驗目的,我希望能在這次的作業中讓受試者使用KALS標註系統、並取得受試者閱讀理解能力資料。

在實驗開始之前,我會課堂中說明閱讀文章與標註系統操作,並告知受試者要在閱讀過程中填寫閱讀心得報告,以及閱讀文章完畢之後要進行閱讀理解測驗的訊息。說明結束之後,我請受試者先進行閱讀文章、確認閱讀心得報告的問題,並即時回答受試者的疑惑。

課堂結束之後,受試者會有兩週的時間閱讀文章並撰寫閱讀心得報告。在這段期間中,受試者可以利用課堂討論區進行非同步的提問,我也會在最短時間為受試者排解操作上的困難。受試者可在這段期間內任意時候利用數位學習平台繳交閱讀心得報告,在兩週期限結束之前,我也會確認尚未繳交的受試者,並催促受試者完成撰寫。

兩週報告結束後,我會要求受試者利用數位學習平台填寫閱讀理解測驗,並限時30分鐘內完成。除了填寫測驗時發生了操作上的問題之外,所有受試者都能在時限內完成。

另一方面,原本應該在兩週內完成的閱讀心得報告,卻仍有部分受試者無法在期限內繳交。所以我只好延後繳交時間,讓實驗過程從14天延長到16天才能回收所有的閱讀心得報告。然而閱讀心得報告在設計上並沒有嚴格要求時間限制,因此延後繳交並不會造成太大的影響。

閱讀文章選擇

在本次實驗中,閱讀文章是要給數位學習碩士課程「資訊科技融入教學」作為課堂作業來閱讀,因此文章的選擇與主題會受限於實驗情境,必須要搭配課程以及授課內容大綱,課程的涵蓋主題包括了數位學習理論、教案設計、研究方法、學習風格與適性化、遊戲式學習等。另一方面,由於我的系統需要辨識「詞性」的特徵,所以選用文章必須使用中文語言。

基於以上理由,我選擇使用黃桂芝、曾憲雄、翁瑞鋒與何筱婷於2008在數位學習科技期刊發表的「採遊戲式學習教育平台之科學教育活動設計」作為指定的閱讀文章。該文章是描述如何使用e-GBL遊戲式學習平台,並應用知識螺旋理論,讓遊戲式學習導入教學過程中,採用的研究方法是數位學習常見準實驗研究法,並利用了思考風格之學習分析。其探討議題多能與實驗情境配合,因此我選擇他作為本研究實驗中的指定閱讀文章。

關於這篇文章的原文可以到開放進用期刊「數位學習科技期刊」中下載,下載位置連結在此。我也做了這篇文章的介紹投影片如下:(SkyDrive下載)


閱讀心得報告設計

心得報告的規劃是參考Keshav(2007)、Bogucka & Wood(2009)、John & Roy (2010)等人認為閱讀學術論文的重點,並根據指定閱讀文章、實驗的情境來設計。閱讀心得報告是五題問答題,請受試者自由作答。不限字數,但在說明時提示受試者不用寫太多文字。每個題目配分皆為20分,滿分為100分。受試者必須在兩週的閱讀文章過程中繳交,但是實際上最後是延期到16天才收齊所有受試者的閱讀心得報告。

由於問答題的題目設計在評分上容易偏於主觀、難以取得公平。所以我安排兩位評分者為受試者的閱讀心得報告評分。這兩位評分者熟悉指定閱讀文章,能夠勝任評判閱讀理解能力的工作。每個題目皆有設計好的評分準則,依據題目複雜度的不同,評分準則有2到5條不等,皆有各自的配分。評分時則是請評分者依照此準則,評定受試者回答內容與此準則的符合程度來給分,以確保評分具備信度。

閱讀心得報告的題目與評分準則在評分者之間有多次討論與修正。最早設計時是6題(SkyDrive下載),後來擬定評分準則 (SkyDrive下載),最後的題目與評分準則如下:

  1. 這篇論文提出了哪些研究問題?你覺得是否清楚合適?
    • 受試者是否能從研究問題取得資料?(10分)
      受試者是否能對研究問題提出自己的看法,且能夠解釋支持或反對的理由。(10分)
  2. 請簡單地敘述該論文的主要貢獻。
    • 受試者是否能找到文中「研究貢獻」一節的敘述?(7分)
    • 受試者是否能夠結合論文研究的結果結合到研究貢獻之中?(7分)
    • 受試者是否能用自己的言語來合理地詮釋、說明研究貢獻?(6分)
  3. 哪些證據支持這篇文章的研究結論?論文中的研究數據是怎樣解釋結論?你是否有其他看法?
    • 受試者是否能在研究結果與分析的段落找尋資料?(5分)
    • 受試者是否能夠用自己的話撰寫簡潔的摘要?(5分)
    • 受試者是否能夠連結研究資料與結論之間的關係?(3分)
    • 受試者是否能夠質疑對這些證據,或是嘗試評估結論的正確性?(3分)
    • 受試者是否能夠以這份研究數據提出不同解釋?(4分)
  4. 請提出這篇論文在研究方法上可以改善的地方。
    • 受試者是否能發現樣本數量不足的問題?(3分)
    • 受試者是否能發現單組前後測設計的缺點?(4分)
    • 受試者是否能夠發現學習成效問卷的嚴謹性不足?(3分)
    • 受試者是否能針對研究方法提出其他的建議?(5分)
    • 受試者是否能夠以研究方法的缺點來檢討結論的合理性?(5分)
  5. 這篇論文能對你在實施教學上的啟發是什麼?
    • 受試者是否能從敘述他從這份論文中學習到的知識 (10分)
    • 受試者是否能夠能將論文內容與自身教學經驗結合提出看法 (5分)
    • 受試者是否能夠在教學實施上提出舉例應用、或是新的研究看法或研究方向 (5分)

在回收受試者的閱讀心得報告之後,我擷取受試者針對各五個題目回答的答案,並重新組合成五份評分表格。以第四題的評分表格(SkyDrive下載)來說,表格中包含了題目、評分準則、受試者回答內容、評分欄位。評分表格除了可以方便評分者進行評分之外,還可以讓評分者容易比較所有受試者的回答狀況,以確保評分能夠客觀、公正。

評分者信度的評估方法

在回收受試者的閱讀心得報告之後,兩位評分者即依照評分準則給分。良好的評量工具需要具備效度與信度。閱讀心得報告的效度可從文獻探討中確定,而信度的計算方式,則讓我花了好一段時間研究。

根據余敏賢(2003)的教育測驗與統計重點整理所述,依照評分者人數與評分方法的不同,求評分者信度可用的評分方法有四種,引用表格如下:

評分者人數
二名 二名以上
評分方式 名次法
(等級資料)
Spearman等級相關係數 Kandall和諧係數
分數法
(等距資料)
Pearson相關係數 變異數分析 (Hoyt分析法)

根據我的情況,應該採用Pearson相關係數。但是卻也有許多學者認為這是錯誤的作法。

大陸學者徐曉鋒與劉勇(2007)講解James(1993)的組內評分者間一致性評估的方式,他們指出信度與一致性的不同,此外也有組間與組內的差別。柴惠敏(2007)認為評分者信度評估不應該用Pearson相關係數,因為Pearson相關係數的前提是兩個變項應該是獨立,而我目前資料狀況中,兩位評分者評定出來的分數卻是相依的。他建議應該使用Shrout與Fleiss提出的組內相關係數分析 (intraclass correlation coefficient, ICC)來進行分析。但是ICC需要確認許多前提,竹家庄blog中有專家回答讀者問題中可以得知,這的確不是簡單、隨便就可以使用的一種工具。最後讓我打退堂鼓、回來使用Pearson的是庄主最後的一段話:

定量分析与其它绝大多数知识不同,只能循序渐进、一个台阶一个台阶往上爬。如果对进阶的方法不甚了了,与其大胆试用(大部分情况下会用错,而且错了还不知道原因何在),我强烈建议使用熟悉的经典方法,如回归、方差、crosstabs等等。经典方法也许用到你的数据上会有些问题、但那是已知的问题,而新方法可能带来的风险是无法预知。如果医生不了解某一新药,绝不敢乱用,而会使用已知作用有限并有副作用的旧药。我们是给数据看病的Data Doctor,也要有如此的基本医德。共勉。

閱讀心得報告結果分析

回收受試者的閱讀心得報告之後,兩位評分者即依照評分準則進行評分。評分結果再以Pearson相關係數進行分析,取得Pearson相關係數r = 0.832,雙尾的顯著性p = 0.000 < 0.001,顯示兩位評分者的評分具有顯著的相關性。據吳明隆(2009)的相關係數評判準則來看,r = 0.832屬於高度正相關,也就是評分者A認為高分的受試者、評分者B也認為高分,反之亦然。

相關係數評判標準
相關係數 相關程度
0.7以上 高度相關
0.4-0.69 中度相關
0.1-0.39 低度相關
0.1以下 弱或無相關

由於每個領域的評量工具都有不同的信度準則,r=0.832作為評分者信度來使用是否達到理想的信度水準,這點我還沒有找到足夠的文獻來支持。然而我的研究並不是專注於發展一個評量工具,所以分析到這邊我自認應該足矣。

基於以上信度水準,我可以有信心地將兩位評分者的分數取平均結合,成為最後的報告分數。簡單來說就是下圖:

image


閱讀理解測驗規劃

除了閱讀心得報告之外,我也根據Cromley等人(2010)提出的DIME Model來設計四選一的閱讀理解測驗。

image 

DIME Model (Direct and Inferential MEdiation Model,直接與推論調解模型)是一個閱讀理解測驗設計的模型,Cromley等人認為「閱讀理解能力」(Comp. = comprehension)是由「先備主題知識」(Background)、「推論」(Inference)、「閱讀策略」(Strategies)、「閱讀詞彙」(Vocabulary)與「閱讀流暢度」(Word)這五個構面組成。並在2010的實驗中以生物學專業領域的學術文本作為指定閱讀文章,探討是否DIME Model也適用於特定領域的文章上。研究結果發現,先備主題知識、閱讀詞彙、閱讀策略與推論跟閱讀理解有顯著的影響。而沒有顯著影響的閱讀流暢度,可能是由於學術文章的重點與閱讀快慢並沒有太大影響的關係。

我採用DIME Model的架構來設計閱讀理解測驗,並依據Cromley等人的發現而捨棄閱讀流暢度的構面,僅以先備主題知識、推論、閱讀策略與閱讀詞彙這四個構面來設計題目。依照DIME Model的設計概念來看,只要檢測這四個構面即可推測出綜合的閱讀理解能力。

根據DIME Model題目設計的說明,配合我在實驗中的指定閱讀文章等實驗情境之後,四個構面的設計理念如下:

先備主題知識 (Prior topic knowledge)
  • 測試受試者是否對於「遊戲式學習」、「科學教育」等該篇文章談論的主題概念有所誤解。
  • 必須避免跟「詞彙閱讀」的題目相衝突。
推論 (Inference)
  • 基於Hannon與Daneman (2001)發展出來的方法。
  • 題目由固定形式組成:「A句」並且「B句」因此。再請受試者選擇A句到B句推論的正確答案。
  • 每個答案都是正確的,但只有一個跟推論結果相關。
閱讀理解策略使用 (Reading comprehension strategy use)
  • 測試受試者是否能夠使用閱讀理解策略,例如「摘要」、「預測」、「自我測試」、「先備主題知識活化」、「做筆記(例如圖表繪製)」、「圖文批配」。
  • 設計題目時,需以另一篇類似的文章作為閱讀題目。另一篇文章為「黃國豪, 李玲梅, 王皓瑀, 洪珮菁, 吳佳茹, & 賴煖菱. (2010). 無所不在學習之系統建置與成效分析─以小學生認識校園植物為例. 數位學習科技期刊, Volume2(Number3). Retrieved from http://ijdlt.org/paper_info.php?pid=52043」,這是與實驗指定閱讀文章屬於同樣的期刊,表示審核門檻雷同。儘管摘要敘述方式與實驗閱讀論文不同,但是與大部分論文的摘要相同,足以作為代表。
閱讀詞彙 (Reading vocabulary)
  • 測試受試者是否能理解「專有詞彙」跟「非專有詞彙」的意義。
  • 題目設計為:列出一段敘述,在要測試的詞彙下畫底線,並要求受試者選擇跟這個詞彙最符合的敘述。
  • 詞彙是選擇自重要的關鍵概念,但並不會在題目的段落中解釋。
  • 必須避免跟「先備主題知識」的題目相衝突。

依照以上四個構面與設計理念,最後我設計出15題的閱讀理解測驗 (SkyDrive下載)。並在為期兩週的閱讀文章期間結束之後,於數位學習平台上進行限時30分鐘的測驗,測驗完成之後即進行統計分析。

測驗的評估方法

比起問答題的心得報告,選擇題的測驗較容易評估,不僅方法客觀、爭議性也較少。在此我主要參考了鄭湧涇(1998)的評量結果統計分析步驟:

  1. 將試卷依得分的高低排列。
  2. 由最高分向下取全部試卷數的27% 或三分之一,稱為「高分組」。
  3. 再由最低分向上取與高分組相同份數的試卷,做為「低分組」。
  4. 分別計數高、低分組,選答各試題每一選目的人數,記錄在「試題卡」(Test item card)上。
  5. 計算各試題之「難度指數」,以百分比表示,其計算方法如下:

難度指數(P) = {[T-(RU+RL)]/T}x100

RU :高分組答對該題人數

RL :低分組答對該題人數

T :全部取樣人數,即高、低分組試卷份數之和

  1. 求取各試題之「鑑別指數」,其計算方式如下:

鑑別指數(D) =(RU-RL)/(1/2)T

  1. 評鑑每一試題的「擾亂答案」(選目)之有效性。
  2. 將所有試題依其難度指數與鑑別指數值製作綜合分析表,並求出其平均值;綜合分析。

最後我再用庫李法(Kuder-Richardson method,1937)中的KR20來評估內部一致性信度。但是必須說明的是,許多評估測驗評量的指導中並沒有說明他們是使用哪些數值作為計算KR20的數據,到底是要用全部受試者的答題狀況、還是應該要像難度指數與鑑別指數一樣只取用高分組、低分組的答題狀況來計算,似乎較難以有所定論。可以確定的是,僅使用高分組與低分組來計算KR20信度係數的結果會比採用全部受試者的結果還要高,也就是數字看起來會比較漂亮的意思。所以以下KR20內部一致性信度係數我只有使用高低分組的受試者來計算。

閱讀理解測驗分析結果

image

19位受試者完成測驗之後,我就可以依據測驗結果來進行分析。

初步分析結果顯示整體難度指數為36%,比正常情況下的50%還要簡單很多,也不到理想的37.5%;整體鑑別指數為0.29,屬於不佳的試題,必須加以改進或棄卻(Ebel, 1972);整體無效選目高達36.8%,也就是完全不會有人去選、一看就知道是錯誤的選目數量。而最後的KR20內部一致性信度為0.56,在10到15題的小型題庫中算是可接受的範圍(林朝順等,2005),但不算理想。

試題鑑別指數(D)的評鑑標準
D值 評鑑
0.40以上 極佳的試題
0.30-0.39 尚可的試題,可能需要稍加改進
0.20-0.29 不佳的試題,必須加以改進或棄卻
0.19以下 極差的試題,應棄卻

為了提高這份測驗的信度,參考Ebel (1972)的建議,將題目中鑑別指數等於或低於0.2的題目刪除,修正整份測驗。刪減之後題目數量從15題降至8題,整體難度指數提高到47.5%,屬於理想的程度;整體鑑別指數提高到0.6,屬於極佳的程度;無效選目降低到28.3%,KR20內部一致性信度更是提高到0.77。

整體而言,修正後的測驗都顯示出較理想的狀況,因此我將之作為「測驗分數」來採用。修正過程簡單來說就是下圖:

image

閱讀理解測驗的詳細結果請看投影片:(SkyDrive下載)

閱讀理解分數處理

在實驗中利用兩種評量工具可以取得兩項數值:「報告分數」與「測驗分數」。我以Pearson相關係數再做分析,計算出r = 0.616,雙尾顯著性p = 0.005 < 0.01,屬於顯著的中度正相關,顯示這兩項數值都可以測量出同一種概念,也就是閱讀理解能力。接著我將兩項數值以比例的方式標準化,並取平均結合,得到最後的閱讀理解分數。處理方式如下圖:

image

整個處理過程的分數列於下表:

受試者
編號
修正前
測驗分數
測驗分數 評分者A
報告分數
評分者B
報告分數
報告分數 閱讀理解
分數
1 12 6 48 50 49 0.84
2 12 6 53 75 64 1
3 12 5 46 65 55.5 0.81
4 9 4 40 31 35.5 0.49
5 10 3 46 52 49 0.54
6 10 4 39 52 45.5 0.6
7 8 4 26 14 20 0.32
8 8 2 34 41 37.5 0.31
9 11 4 37 48 42.5 0.56
10 8 2 47 47 47 0.41
11 10 5 59 61 60 0.86
12 8 1 40 42 41 0.25
13 9 4 32 46 39 0.53
14 10 5 57 63 60 0.86
15 10 6 54 63 58.5 0.94
16 9 4 48 60 54 0.69
17 12 6 51 56 53.5 0.88
18 6 2 17 20 18.5 0.1
19 7 2 40 30 35 0.28

 

我將以上所有過程以投影片方式說明,投影片如下:(SkyDrive下載)


小結

這些資料都是我論文的一部分,但是在寫這篇文章的時候,我並不是抱著我在寫論文的心態而寫,而只是單純地記錄我是如何處理這些資料以及這之中遇到的困惑。實際上論文時可能會將一些無法解答的疑惑刪除、修飾,讓論文寫起來漂亮一點。

儘管為了我花了許多精力在蒐集文獻、規劃如何評估閱讀理解能力,但是平心而論,這並不能非常準確地說這樣子就能評估閱讀理解能力,只能說是盡可能地去得到受試者在閱讀理解能力上高低的量化數值而已。就如我內文所說的,這個研究並不是發展閱讀理解能力評估量表或是心得報告規範工具,在撰寫這份論文之中,我最多就做到這邊而已。

被迫採用這種不穩定的評估方式,最大的原因還是受限於實驗情境中,必須要配合課堂內容而選定文章。碩士生閱讀的文章不會是一般常見的泛用讀本,自然也難以有客觀、公正的評量工具。迫於這種情況下只能自己規劃,但這不管怎麼做都很難讓人真的信服。

最理想的解決方式還是換一個實驗情境、採用經過公開評量的工具,例如PIRLS(Progress in International Reading Literacy Study,促進國際閱讀素養研究)或是全民英檢使用的閱讀文章與評量工具,就能夠避免陷入這種窘境。

事實上,在之前的規劃中,我的確是打算採用PIRLS的文章作為實驗的工具。但是人算不如天算,在種種無奈與時間限制之下,我只能採用目前這種作法。然而換個角度想想,很多時候我們很難去創造一切盡如己願的環境來評估資料,像現在這樣能夠配合場域、情境即時地設計一個評估方式,說不定這才是比較貼近現實的狀況。變化並沒有錯,錯的是無法因應變化的人,我是這樣子認為的。

即使如此,我想我在評估閱讀理解能力的過程中,應該還是有些地方值得別人參考、使用,所以才將資料彙整、撰寫成這篇文章。希望能夠幫到大家的忙。


參考文獻

  • Cromley, J. G., Snyder-Hogan, L. E., & Luciw-Dubas, U. A. (2010). Reading Comprehension of Scientific Text: A Domain-Specific Test of the Direct and Inferential Mediation Model of Reading Comprehension. Journal of Educational Psychology, 102(3), 687-700. 
  • Keshav, S. (2007). How to read a paper. ACM SIGCOMM Computer Communication Review, 37(3), 83–84. 
  • Bogucka, R., & Wood, E. (2009). How to Read Scientific Research Articles: A Hands-On Classroom Exercise. Issues in Science & Technology Librarianship, (59), 4. 
  • John W. Little, & Roy Parker. (2010, Fall). How to Read a Scientific Paper. Retrieved November 23, 2010, from http://www.biochem.arizona.edu/classes/bioc568/papers.htm#evaluate 
  • 黃桂芝, 曾憲雄, 翁瑞鋒, & 何筱婷. (2008). 採遊戲式學習教育平台之科學教育活動設計. 數位學習科技期刊, 1(1). Retrieved from http://ijdlt.org/paper_info.php?pid=27
  • 余敏賢. (2003). 教育測驗與統計:重點整理. 高點致勝叢書系列 (五版.). 臺北市: 高點文化. Retrieved from http://library.yfms.tyc.edu.tw/webopac/detdata.php?pagerows=15&orderby=BRN&qrow=1&brn=1031623
  • James, L. R., Demaree, R. G., & Wolf, G. (1993). rwg: An assessment of within-group interrater agreement. Journal of Applied Psychology, 78(2), 306–309.
  • 徐晓锋, & 刘勇. (2007). 評分者內部一致性的研究和應用. 心理科学, 30(5), 1175-1178. Retrieved from http://cnki50.csis.com.tw/kns50/detail.aspx?QueryID=3&CurRec=1
  • Statistics and SAS Package, School of Physical Therapy, National Taiwan University. Retrieved January 20, 2011, from http://www.pt.ntu.edu.tw/hmchai/PTcomputer/hSAS/SAScontinuous/SASicc.htm
  • Shrout, P. E., & Fleiss, J. L. (1979). Intraclass correlations: uses in assessing rater reliability. Psychol Bull, 86(2), 420–428.
  • 庄主. (2009, May 17). 如何选择Intraclass correlation coefficient (组内相关系数) 的模型? - Windows Live. Retrieved January 20, 2011, from http://zjz06.spaces.live.com/blog/cns!3F49BBFB6C5A1D86!1228.entry?wa=wsignin1.0&sa=753480086
  • 吳明隆. (2009). SPSS 操作與應用-問卷統計分析實務 (二版三刷). 台北: 五南.
  • 鄭湧涇. (1998, September 18). 科學學習成就評量:II.評量結果的統計分析. Retrieved December 27, 2010, from http://140.122.143.143/doc/evaluate3.htm
  • Kuder, G. F., & Richardson, M. W. (1937). The theory of the estimation of test reliability. Psychometrika, 2(3), 151–160.
  • 林朝順, 鄒國英, 劉正耀, 胡彼得, & 楊育純. (2005). 醫學系筆試多項選擇題品質分析. 輔仁醫學期刊, 3(4), 213–220.
  • Ebel, R. L. (1972). Essentials of educational measurement.
(more...)

論文進度報告(2011/1/19):變更的研究架構 Progress report: modified research

布丁布丁吃布丁

論文進度報告(2011/1/19):變更的研究架構 Progress report: modified research

image

現在論文的進度來到了「分析資料」的步驟。很多人會問我:「論文寫得怎樣了?」我都會回答:「一個字都還沒寫。」是的,論文還沒正式動筆寫,因為我現在還在數字之間打轉。


為什麼很久都沒報告進度?

距離上次論文進度報告居然隔了快要兩個月的時間,這段時間我到底在幹嘛呢?其實是因為12月底的時候我就在進行論文的實驗。由於擔心受試者會有霍桑效應的影響,也就是他們發現到自己原來就是實驗的對象,而改變了原本自然的行為,所以我想應該是要隱瞞「這是一個實驗、我正在觀察你們」的這個訊息。

實驗的過程中其實有很多想跟大家分享的資料,可是礙於這個限制,我自己也悶了好久。現在實驗已經結束,進入分析資料的階段,也跟老師確認了一下,就算公開應該也是不受影響,所以接下來我會陸陸續續地在這邊敘述目前論文的進度。

變動的實驗進行、變動的研究架構

由於實驗進行方式與當初計劃書規劃的有很大的不同,所以連研究目的、研究問題、研究架構等設計都要全部重寫。會變動我覺得很正常,跟人扯上關係的計畫通常都無法如願地進行,這並不是任何人的錯。如果真要怪是誰的責任,那我會認為是自己需要去承擔這種變更帶來的風險與額外工作。

簡單來說,整個研究架構都要做調整。從上週與老師討論時講的研究架構投影片 (SkyDrive下載) 讓老師直呼:「你的研究怎麼會變成這樣?」就可以知道我的論文變動的程度大到令應該是很熟悉的老師都覺得很驚訝。

總而言之,現在就是要改研究架構。我希望整個研究架構能寫到簡單、直覺、易懂,所以不斷地翻修,並嘗試跟別人說明、邊講邊反省看看自己是否寫得好或壞。

基於標註行為之知識萃取研究與應用

目前的論文的標題我擅自將之修改成「基於標註行為之知識萃取研究與應用」,而研究目的主要有三項:

  1. 發展基於閱讀標註行為之知識萃取機制。
  2. 驗證知識萃取機制有效性。
  3. 找尋改善知識萃取機制的方向。

根據以上研究目的,我需要探討以下研究問題才能達到這些目的。其中「發展」目的是要仰賴文獻探討與系統發展,因此只需要針對「驗證」與「改善」來設計研究問題:

「驗證」目的

  1. 閱讀理解能力高低是否與知識萃取機制結果相關?
  2. 知識萃取機制與整體的標註行為有何差異?

「改善」目的

  1. 哪些標註行為與閱讀理解能力高低相關?
  2. 哪些標註行為與背景因素相關?
  3. 受試者對於改善知識萃取機制的建議是?

上述研究問題中主要需要定義的有四個名詞:

  1. 知識萃取機制:本研究根據文獻探討與專家意見發展而成,考慮六種標註行為之後以模糊綜合評判來判斷標註好壞的「標註分數」、並且給予使用者提示改善的「標註建議」。知識萃取機制包含六項因素的模糊隸屬度函數制定(判斷各行為的好壞)、因素權重設定這些細項。
  2. 知識萃取機制結果:受試者透過本研究的知識萃取機制所得到的結果,包含「標註分數」與「標註建議」接受程度。
  3. 標註行為:受試者利用本研究標註系統的原始行為資料。與知識萃取機制結果不同,不受知識萃取機制設計的影響。
  4. 閱讀理解能力:閱讀本研究指定文章之後,以「閱讀理解測驗」跟「心得報告」來評定受試者的閱讀理解分數,能夠反映出受試者閱讀理解能力的高低。
  5. 背景因素:包含閱讀習慣(閱讀報紙、雜誌、書本、網路文章的頻率)、內外控性格、科技接受度模型

基於以上五個研究問題,就可以整理成下面的研究架構圖:

image

而這五個研究問題又必須蒐集不同的資料、做不同的統計與分析方法來處理,才能回答這些問題。詳細的內容就請看投影片吧:(SkyDrive下載)


結語

由於分析方式與實驗室中常見的準實驗研究法有很大的不同,各種因素之間要如何配對比較都需要構思,再繼續分析的這段日子裡,研究架構還會持續地被修正吧。

另一方面,不熟高級統計的我實在是無法貿然地使用單因子變異數等統計工具,就算統計軟體跑得出來,但我也不會解釋或是確認各種數字。儘管目前我只是使用初統的獨立樣本T檢定與Pearson相關係數,一方面我想這已經足以解釋之外,另一方面是我預期這些因素相關都不太能達到統計上的顯著性,因此到最後還是需要參雜許多質性的個案觀察來解釋吧。

(more...)