tag:blogger.com,1999:blog-16607461.post6880926074411434594..comments2024-03-28T23:00:58.358+08:00Comments on 布丁布丁吃什麼?: 資料聚類:分群 / Clustering布丁布丁吃布丁http://www.blogger.com/profile/13614721642960940190noreply@blogger.comBlogger3125tag:blogger.com,1999:blog-16607461.post-44566373076039837492021-06-13T18:35:11.426+08:002021-06-13T18:35:11.426+08:00有網友提問,分群結果不僅包括了連續數值的資料(例如年齡、身高、體重),還包括了類別資料(例如性別)。...有網友提問,分群結果不僅包括了連續數值的資料(例如年齡、身高、體重),還包括了類別資料(例如性別)。<br />這是正常的嗎?<br /><br />答案:這是正常的。<br /><br />K-means的計算方式的確只能處理連續數值資料。<br />因此,在處理類別資料的時候,我們會將類別資料轉換成虛擬變項。<br /><br />例如原本的資料爲<br /><br />性別<br />男<br />女<br />男<br /><br />轉換成虛擬變項後就成爲<br />性別=男,性別=女<br />1,0<br />0,1<br />1,0<br /><br />其中1表示類別變項屬於該類別,0表示不屬於該類別<br /><br />虛擬變項的做法請看這篇:<br />https://dasanlin888.pixnet.net/blog/post/34469150-%E8%BF%B4%E6%AD%B8%E5%88%86%E6%9E%90%E4%BD%BF%E7%94%A8%E8%99%9B%E6%93%AC%E8%AE%8A%E9%A0%85%E7%9A%84%E6%B3%A8%E6%84%8F%E4%BA%8B%E9%A0%85%EF%BC%88dummy-variab布丁布丁吃布丁https://www.blogger.com/profile/18000418899714977849noreply@blogger.comtag:blogger.com,1999:blog-16607461.post-6603918709513516412018-05-18T19:56:00.909+08:002018-05-18T19:56:00.909+08:00來記錄一下Calinski-Harabasz指標的公式
論文參考來源:
Caliński, T.,...來記錄一下Calinski-Harabasz指標的公式<br /><br />論文參考來源:<br />Caliński, T., & Harabasz, J. (1974). A dendrite method for cluster analysis. Communications in Statistics, 3(1), 1-27. doi:10.1080/03610927408827101<br /><br />CH(K)的公式<br />https://lh3.googleusercontent.com/-2tktJCRD6nw/Wv6-Va_3ZAI/AAAAAAADvFI/gX82TTSYgYMqZmodaz10_97KXjafuyJdACHMYCw/s0/chk.png<br /><br />trace B的公式<br />https://lh3.googleusercontent.com/-WKm5TuROVEw/Wv6-VFlrPRI/AAAAAAADvFA/xZGKsbYo74UALS-weYGTcF1-hFhJHPjmQCHMYCw/s0/traceB.png<br /><br />traceW的公式<br />https://lh3.googleusercontent.com/-XAOw9erDF7M/Wv6-VHBC13I/AAAAAAADvFE/FeyAu5Dz3TQMCOxiK2jZI-WfJ_-0RNhmgCHMYCw/s0/traceW.png布丁布丁吃布丁https://www.blogger.com/profile/18000418899714977849noreply@blogger.comtag:blogger.com,1999:blog-16607461.post-61767661652101653342017-12-05T13:36:03.908+08:002017-12-05T13:36:03.908+08:00這份教學有個錯誤的地方,在Preprocess的地方,要在右下角「Visualize All」左邊的...這份教學有個錯誤的地方,在Preprocess的地方,要在右下角「Visualize All」左邊的class選擇器選擇「No class」,然後再來做分群,這樣才正確<br />https://lh3.googleusercontent.com/-Tkge0-JyMiM/WiYwMvrDFpI/AAAAAAADlMs/g1P-ZJVCkwsIozednXUfuTEaw1bfW-SZQCHMYCw/s0/2017-12-05_13-35-47.png<br />未來如果有機會再講分群,我再來修正這部分的操作吧布丁布丁吃布丁https://www.blogger.com/profile/18000418899714977849noreply@blogger.com