:::

序列分析工具 Sequential Analysis Tool

12月 14, 2010 作品 , 研究方法 , 程式寫作 , 碩士畢業論文 63 Comments Edit Copy Download

觀察樣本	每一個字都表示一個編碼記錄，空格、斷行表示觀察樣本片段。用括弧表示同時發生的不同編碼。舉例1 「ABDC CBBD」：表示依時間排序發生了「ABDC」跟「CBBD」這兩串序列。舉例2 「A(BD)C(CB)BD」：(BD)表示同時發生B跟D這兩個事件、(CB)表示同時發生了C跟B這兩個事件。在計算次數時，A(BD)C會被當做AB、AD、BC跟DC這種組合的順序來記錄。
觀察編碼	例如：「ABCD」，每一個字都表示一種編碼，共4種編碼。如果沒有空白，則程式會自動從觀察樣本去統計。
觀察序列長度	lag 最小是2 lag。
期望機率模型	First-order model：從觀察樣本中推估機率期望值。 Zero-order model：設定每種編碼的機率期望值均相等。
編碼重複	根據樣本判斷可重複不可重複(強迫忽略重複的編碼順序)

說明

此方法是參考Bakeman跟Gottman(1986)介紹序列分析的書本歸納出來，方便大家計算。計算過程如有任何問題或錯誤，請務必在下面留言告知，感謝。

參考文獻

Bakeman, R. (1986). Observing interaction : an introduction to sequential analysis. Cambridge ;New York: Cambridge University Press.

修改記事

2011/1/25: 修正「不可重複(強迫忽略重複的編碼順序)」的模式下計算錯誤的問題
2010/12/30: 不可重複功能加入強迫忽略重複的編碼順序功能。重新調整演算法。加入同時發生多次編碼的資料結構。

總共63 則留言 ( 我要發問 , 隱藏留言 顯示留言 )

布丁布丁吃布丁2010年12月29日晚上7:48
http://edugate.fss.uu.nl/mepa/index.htm
侯老師推薦我用這個工具，MEPA (Multiple Episode Protocol Analysis)
可是網站上沒有直接下載的連結……看來是要寫信去問了。
回覆刪除
回覆
TzungJin2011年9月14日下午5:19
請問版主大大：您有要到軟體了嗎？
回覆刪除
回覆
布丁布丁吃布丁2011年9月14日晚上9:50
後來我沒去要，倒是學妹研究有用到而去要了，但要到時論文已經來不及了 TwT

你需要的話，還是寫信跟原作者要吧
回覆刪除
回覆
Yun2012年12月4日上午9:30
版主您好~
感謝您的分享!讓我受益良多
然後想請問，如果編碼超過26個，無法以AB~Z表示完全部編碼該怎麼辦呢? 謝謝您!
回覆刪除
回覆
布丁布丁吃布丁2012年12月4日上午10:45
To Yun:

用數字跟國字都可以喔 _A_

把你的留言輸入進去就會得到以下結果：

編碼次數：58
序列次數：54
片段次數：4
編碼列表：版, 主, 您, 好, ~, 感, 謝, 的, 分, 享, !, 讓, 我, 受, 益, 良, 多, 然, 後, 想, 請, 問, ，, 如, 果, 編, 碼, 超, 過, 2, 6, 個, 無, 法, 以, A, B, Z, 表, 示, 完, 全, 部, 該, 怎, 麼, 辦, 呢, ?
編碼重複：可

後面就不列了，這樣懂了嗎？
回覆刪除
回覆
布丁布丁吃布丁2012年12月4日上午10:51
以上是從程式技術的角度來說明，不過我覺得更重要的是，要從研究角度來告訴你的事情。

序列分析的觀察編碼種類不宜太多。

序列分析的目的是在看編碼轉換到下一個編碼的序列有沒有統計上的顯著性，如果你的編碼種類很多，表示序列會有很多種組合，那麼就很難有其中一種序列會是明顯地常常發生。

序列分析跟資料探勘中的關聯式規則並不相同，也許你要的方法是後者也說不定？
回覆刪除
回覆
Yun2012年12月5日上午11:10
謝謝版主解惑!

關聯式規則我會去研究看看，感謝您的回覆與建議^^
回覆刪除
回覆
布丁布丁吃布丁2012年12月5日上午11:16
加油

關聯式規則也是很有趣的！
回覆刪除
回覆
匿名2012年12月26日上午11:21
版主你好

想請教一下,由同一份資料進行重複編碼與無重複編碼所計算出來的"編碼頻率與機率表"是一樣的值,可是無重複編碼所產生的"編碼轉換期望機率表(first-order model)"的值卻不一樣,不知道這是怎麼計算出來的?
回覆刪除
回覆
布丁布丁吃布丁2012年12月26日下午1:05
To CY Tsai:

請把你的樣本數據寫上來給我看一下，讓我方半講解可以嗎？
回覆刪除
回覆
匿名2012年12月26日下午1:44
作者已經移除這則留言。
回覆刪除
回覆
布丁布丁吃布丁2012年12月26日下午1:49
阿，不是，我是想知道你的「觀察樣本」，輸入在「觀察樣本」的資料是如何呢？
不方便寫在這邊的話也可以寄信給我

pulipuli.chen@gmail.com
回覆刪除
回覆
匿名2012年12月27日上午9:16
版主你好

不知道你是否有收到我昨天寄的信@@"
回覆刪除
回覆
布丁布丁吃布丁2012年12月27日上午9:45
喔喔，不好意思，該信被Gmail丟倒垃圾信去了orz

剛剛測試一下的確是有你說的問題
應該是bug

我晚點再修
回覆刪除
回覆
布丁布丁吃布丁2012年12月27日下午2:27
終於修正了，請再試試看
回覆刪除
回覆
匿名2012年12月27日下午5:28
版主你好

關於修正後的部分, 有幾個地方想請教, 就是在採用無重複編碼, 在結果輸出部分, 編碼次數的值會等於序列次數的值, 這個似乎與重複編碼的結果(序列次數的值會等於編碼次數扣掉片段次數)不一樣?
另外, 同樣在無重複編碼, 其編碼轉換期望機率表的值, 我採用重複編碼部分的計算方式計算, 還是無法得出相似的值, 不知道是不是採用無重複編碼的方式, 期望機率的值計算方式就不同嗎?
回覆刪除
回覆
匿名2013年1月3日上午10:13
版主你好
又再次打擾了>"<

就是對於程式修正後的疑問部分是否可以幫忙解答@@"
回覆刪除
回覆
布丁布丁吃布丁2013年1月3日上午10:39
To CY Tsai:

哎呀呀，最近比較忙所以就沒回覆了。
畢竟是兩年前寫的東西，理論都快忘記了。

你用序列分析之前有去看過Observing interaction : an introduction to sequential analysis這本書了嗎？
回覆刪除
回覆
匿名2013年1月3日上午11:34
版主你好
不好意思在百忙之中打擾冏

因為之前沒借到版主推薦的那本書, 所以只看了Bakeman, R., & Quera, V. (2011). Sequential Analysis and Observational Methods for the Behavioral Sciences這一本, 不過裡面關於Sequential Analysis的計算分式, 倒是沒有很詳細的介紹, 所以目前是以版主寫的計算方式為主。只是目前對於在程式中無法用重複編碼的計算方式得到不可重複編碼的編碼轉換期望機率這部分感到困惑...。

回覆刪除
回覆
布丁布丁吃布丁2013年1月3日中午12:45
我終於發現哪裡怪怪的了
為什麼你會覺得重複編碼跟不重複編碼的結果會一樣？
你的樣本刪除連續重複出現的編碼之後，編碼的轉換次數跟出現頻率都不一樣了
結果當然不同

如果你不懂序列分析的算法
那我還是會去建議你搞懂他再來用
以確保你真的知道你在算什麼
回覆刪除
回覆
布丁布丁吃布丁2013年1月3日中午12:47
不重複的意思是

BBB

重複是當成B出現3次，B→B有2次
不重複是B出現1次，沒有轉換序列
回覆刪除
回覆
匿名2013年1月3日下午2:45
版主你好

你可能誤會我的意思了, 我不是指重複編碼跟不重複編的結果一樣@@"
我覺得困惑的地方是指同一份資料(使用版主提供的觀察資料亦同), 若採用重複編碼的計算, 程式所產生出來的期望機率值, 是近似值, 這部分我覺得沒有問題, 但是若採用不重複編碼的計算方式, 在結果輸出部分的"編碼轉換期望機率表", 表格中所計算出來的值似乎跟從"編碼頻率與機率表"所計算出來的值, 有不少落差(非近似值), 所以我才會對這部分的計算感到困惑。

回覆刪除
回覆
布丁布丁吃布丁2013年5月10日下午3:28
To: anthrop

請盡量集中到Blog的意見中發表，方便其他有相同問題的人查閱。

不過現在的問題是，我不是很懂你的資料類型為何。

問題1：單人跟多人

如果你把許多人當成同一種類型的觀察對象來看，例如現在有A對象跟B對象，A對象的行為編碼為「aabac」，B對象的行為編碼為「abbca」。

而A對象跟B對象都被你視為同一種類型的觀察對象，你想要探討這類型的對象會有什麼顯著的行為轉換，那你可以把這兩個對象的行為編碼以「一格空白」結合起來，變成「aabac abbca」，丟到上面工具來進行分析。
這個意思就是把A跟B視為同一種人，但是A最後的行為編碼「c」跟B開頭的行為編碼「a」並不是行為轉換。

這可能會是你要的解答，或是另一種。

續問題1：合作式學習的行為編碼

另一種問題是端看你的研究目的跟編碼的對象。

在合作式學習中，我們會把學生分成各小組，觀察每個組別是否有發生顯著的行為轉換。
以前做過的研究就是去為學生的「討論層次」進行編碼，層次由淺至深分成「c1」、「c2」、「c3」、「c4」以及聊天型的「c5」。

學生在討論區每一篇的討論文章都會賦予研究者認定的編碼。例如第一組有110篇文章，那麼第一組的編碼就會有110筆。我們就用這110筆去做分析，來觀察第一組有沒有特別顯著的行為轉換。

在這階段編碼完之後，你只會看到第一組所有的行為編碼，而分不清楚第一組裡面每一位成員的個別行為。

接著你可以用同樣方法來看第二組、第三組，或是把實驗組（第一組到第三組）湊在一起，跟控制組（第四組到第六組）湊在一起，比較實驗組與控制組的顯著行為序列轉換的差異。

好，那以小組為單位來分析之後，你可能會想要用另一種方式來分析了。

問題2：單人跟群組的差異

要比較單人與群組差異之前，有個問題是，你必須重新去設計你的編碼方式。

上述討論層次行為編碼的前提是從小組多人的情況下進行編碼，如果你現在想要觀察第一組的A同學跟B同學，他們個別的行為已經不是「小組討論的行為編碼」而是「個人在小組活動中的行為編碼」。請注意到這兩種觀察角度的差異，一不注意的話很容易被人挑毛病的喔。

那你現在已經用「個人在小組中的行為編碼」將A、B、C、D、E等五位同學編碼了，那你可以把五位同學的行為編碼湊在一起觀察，也可以單看A同學與五位同學的行為轉換有沒有異同。

大概就是這樣分析囉。
回覆刪除
回覆
anthrop2013年5月10日下午4:42
Dear布丁：謝謝你的解說。
回覆刪除
回覆
布丁布丁吃布丁2015年3月15日下午1:33
回應朋友的來信：

1. 需要多少觀察樣本？
http://pulipuli.blogspot.tw/2010/12/sequential-analysis-introduction.html
這篇的投影片有介紹樣本公式，公式來自於Bakeman的書，書要好好看，搞懂為什麼是這樣算。

工具裡面也有一個「建議最少編碼轉換樣本數量表」
如果是6種編碼，就會顯示一下提示訊息：「※ 目前您的樣本數為64，未達建議最少個編碼轉換樣本數38034.00個」
所以就是不夠用的意思。
樣本數量建議多少是跟編碼種類有關。

2. 「期望機率模型」的Zero-order跟First-order的差別

先看介紹裡面的公式 http://pulipuli.blogspot.tw/2010/12/sequential-analysis-introduction.html
要瞭解公式中的「期望值」是怎麼來的，就是分成Zero-order跟First-order。

很多人都只是因為Zero-order有顯著就用Zero-order，
可是不懂Bakeman建立這兩種模型的影響。
這樣的求學態度不太好喔。

3. 是否觀察「編碼重複」？

如果你關注的是不同編碼之間的轉換，那就選「不可重複」。
舉例來說：
[可重複] 可能出現 G->G
[不可重複] 不可能出現G->G，因為在記算時就會被排除。
回覆刪除
回覆
布丁布丁吃布丁2015年7月8日晚上9:07
做3lag的分析也會出錯orz
真是很多bug
回覆刪除
回覆
布丁布丁吃布丁2015年12月20日上午8:30
我做的序列分析工具有點問題，可以改用MEPA來分析：
http://pulipuli.blogspot.tw/2015/12/mepa.html
回覆刪除
回覆
布丁布丁吃布丁2016年5月19日晚上10:42
關於序列分析的介紹，我也把連結集中在這裡：

簡單的介紹：http://blog.pulipuli.info/2010/12/sequential-analysis-introduction.html
行為編碼與序列分析介紹：http://blog.pulipuli.info/2015/06/introduction-of-behavior-coding-and.html
編碼者間一致性信度：Cohen Kappa係數計算器 http://blog.pulipuli.info/2015/06/cohenkappa-cohens-kappa-coefficient.html
編碼結果轉序列編碼工具 http://blog.pulipuli.info/2015/06/coding-result-to-sequence-convertor.html

回覆刪除
回覆
Rabbit2016年5月30日晚上11:29
版主大大您好:
想請問關於 " 編碼結果轉序列編碼工具 http://blog.pulipuli.info/2015/06/coding-result-to-sequence-convertor.html " ,這編碼結果轉序列編碼工具用途是做什麼用的呢?
例如您的範例"2" ,轉換後變成 " 211332322211122232322314421552 " ?
回覆刪除
回覆
Rabbit2016年5月30日晚上11:39
版主大大:
很抱歉我好多問題! 很感謝您耐心解惑! 想請問Lago, lag1, lag2,lag3 是甚麼意思呢 ? 我在Observing Interaction這本書裏頭看到說Lag1 被舉例來說是打雷的天數,而lag0被舉例來說365天 , 感覺上想要知道打雷的在一年當中的機率則打雷就設定為lag1,而一年365年則設定為lag0,所以我想要知道的編碼機率通常都設為lag1 是這原因嗎?但看了版主的編碼工具後才知道還有 lag2 and lag3,因此深感疑惑.
回覆刪除
回覆
布丁布丁吃布丁2016年7月26日凌晨2:21
最近因為計劃需要，我把序列分析的算法以PHP來撰寫
程式碼：https://github.com/pulipulichen/blogger/blob/gh-pages/posts/2016/07/20160720-sequential-anlysis/sa/sequential_analysis.class.php

使用範例
include_once 'sequential_analysis.class.php';
$obs = "ABABCBCA"; // 觀察序列
$codes = "ABS"; // 觀察編碼
$repeatable = FALSE; // 可否重複
$lag = 2; // 觀察序列長度
$sa = new Sequential_analysis($obs, $codes, $repeatable, $lag);
print_r($sa->export_sign_result("allison_liker"));

這次z-score算法除了zero-order 跟 first-order (這裡我改成叫做code frequency)之外，我還加入了Backman書中介紹的joint frequency跟Allison & Liker (1982)的算法。
最後推薦大家使用的是Allison & Liker的算法，一來是比較準確，二來是比較容易出現顯著。計算方式跟zero-order有很大的差別喔，以前的研究結果重跑的話，應該會有完全不一樣的結論吧。

Bakeman & Quera (1995)所開發的GSEQ軟體中計算z-score似乎也是用Allison & Liker的算法，叫做Allison and Liker z score
https://books.google.com.tw/books?redir_esc=y&hl=zh-TW&id=MJ3e1ap-338C&q=z-score#v=snippet&q=z-score&f=false
位於書本的P.85，8.1 Specifying statistics with the Stats command

但是我自己試著跟MEPA比較的結果，發現兩者還是不一樣
http://blog.pulipuli.info/2015/12/mepa.html#bc_0_1MC
我不清楚MEPA背後的計算方式，但至少我能確保我自己寫的程式邏輯是正確的吧。
回覆刪除
回覆
Unknown2017年1月12日晚上7:53
作者已經移除這則留言。
回覆刪除
回覆
布丁布丁吃布丁2017年1月12日晚上9:59
把多位受測者當做一位受測者的資料來分析即可。
當然，這中間的細節很多，不容易一言道之。

最重要的事情是，你的研究問題是什麼：
你想要看什麼東西？你期待出現什麼結果？你的研究希望得到什麼結果才符合預期。

如果你還沒想過這個問題，那建議你先想想看
我最近發現很多人來問序列分析問了老半天，結果他們要的根本就是不一樣的答案

這就像是有人一直問醫生感冒的症狀是什麼，要怎麼解決
但他其實得到的病是腸胃炎，不是感冒，醫生講老半天也只是傳遞科普知識，對解決病症沒有幫助。

所以還是建議你先講講看你想要得到的是什麼結果
講出來結果跟序列分析無關，這也無妨
至少我可能可以給你其他建議

我的座右銘之一：「沒有蠢問題」
放心，大家都是這樣一路蠢過來的，我也是如此
一起加油

不過有時候我一忙就不會馬上回覆就是了，請多包涵orz
回覆刪除
回覆
布丁布丁吃布丁2017年1月12日晚上10:01
關於序列分析的介紹請看這篇：
http://blog.pulipuli.info/2016/10/php-introduction-of-behavior-coding-and.html#more

常見問題請看這邊
http://blog.pulipuli.info/2016/11/sequential-analysiss-q.html#more

你的一些問題可能可以在這裡獲得解答吧？
回覆刪除
回覆
布丁布丁吃布丁2017年1月12日晚上10:04
然後關於MEPA操作的問題，我所知甚少，我也不覺得有特別必要用MEPA，因為沒我自己寫的程式來得靈活
如有問題建議你自行摸索吧
回覆刪除
回覆
匿名2017年5月30日晚上7:56
請問布丁如果類似於序列分析AABBCCDD這種行為模式分析若使用R 語言的話建議使用哪一個PACKAGE?
回覆刪除
回覆
匿名2017年5月31日上午9:23
謝謝您的解答，因為使用R的arulesSequences 感覺支持度數據怪怪的，不會解讀。
另外您的PHP程式是否不支援lag>2 ? 嘗試了幾次感覺數值怪怪的。
GSEQ軟體有DATA的輸入格式嗎? 試了幾次都沒成功
回覆刪除
回覆
匿名2017年6月1日下午2:34
是的您說的沒錯無論格多遠只要是({C},{R},{P}) 有依照這樣產生就算。
但是我發現有個時候反過來他也算。
以下面為例換成 "sequenceID","eventID", "items"
1 1 S R P S S S R
2 1 S R R S S R R
3 1 S P R R S R R

s2 <- cspade(x1,
parameter = list(support = 1, maxsize = 3, maxlen = 3),
control = list(verbose =TRUE, tidLists = TRUE),
tmpdir = tempdir())
as(s2, "data.frame")
===>
sequence support
1 <{R}> 1
2 <{S}> 1
3 <{R,S}> 1
果真不是我要的序列，我認為的序列是連續的存在，不是這樣只有先後的概念。
所以果真不適用，謝謝布丁的解釋，讓我更加確認
回覆刪除
回覆
匿名2017年6月1日下午2:38
我的資料會長度一致(items總數)
只是有的時候eventID會呈現多筆，因為我把sequenceID當成一個人，eventID當成組來看。
sID eID items
1 1 S R P S S S R
1 2 S P P R S R R
1 3 S R P S S S R
2 1 R R R S P R R
2 2 P R P S S R R
3 1 S P R R S R R
回覆刪除
回覆
匿名2017年6月1日下午3:52
所以這樣的意思是表示一個人反覆次數做的N次就是N個不同的序列。
這裡不能看不同人之間的關係，最多只能看同一個人 N個序列中的最頻繁序列。

我再試試看謝謝您的指導
回覆刪除
回覆
匿名2017年6月1日晚上9:36
不過以這樣來說表示編號一有出現編號2也有出現 SUPPORT =1
就算是有很多序列 ({S},{R})出現，也容易造成support=1
回覆刪除
回覆
匿名2017年6月1日晚上10:06
回到最根本的問題序列我搞錯意思了
循序樣式探勘中，中間隔多少事件都無所謂，反正整體來看這個事件都有按照順序發生==>這才是重點!

更謝謝布丁在這裡的指導與解說

回覆刪除
回覆
匿名2017年6月4日中午12:10
不好意思版主大大
我使用到的是zscore
想要請問是否他計算出的值越大就代表關聯越強烈呢
回覆刪除
回覆

新增留言

Comment Tools:

訂閱：張貼留言 (Atom)

布丁布丁吃什麼？

序列分析工具 Sequential Analysis Tool

12月 14, 2010 作品 , 研究方法 , 程式寫作 , 碩士畢業論文 63 Comments Edit Copy Download

說明

參考文獻

修改記事

總共63 則留言 ( 我要發問 , 隱藏留言 顯示留言 )

About Me

布丁布丁吃布丁

Luminous Blessing (Donors)

Podcast

Facebook Fanpage

Random Posts

Guestbook

Comments

Recent Posts

聯絡布丁

Buy Me A Coffee (Donate)

Labels (All Labels)

序列分析工具 Sequential Analysis Tool 12月 14, 2010 作品 , 研究方法 , 程式寫作 , 碩士畢業論文 63 Comments Edit Copy Download

說明

參考文獻

修改記事

Related Posts

總共63 則留言 ( 我要發問 , 隱藏留言 顯示留言 )

About Me

布丁布丁吃布丁

Luminous Blessing (Donors)

Podcast

Facebook Fanpage

Random Posts

Guestbook

Comments

Recent Posts

序列分析工具 Sequential Analysis Tool

12月 14, 2010 作品 , 研究方法 , 程式寫作 , 碩士畢業論文 63 Comments Edit Copy Download

總共63 則留言 ( 我要發問 , 隱藏留言顯示留言 )