發掘模型背後的知識:子群組探勘 / Knowledge extraction beyond the AI Models: Subgroup Discovery
哈囉,大家最近在吃什麼呢?這裡是換了一臺電腦的布丁。這篇是2021年演講的記錄,主題一樣是講述子群組探勘(subgroup discovery)。跟前一篇「子群組探勘簡介」不一樣的是,演講裡面我加入了較多例子,用比較容易理解的方式來介紹子群組探勘。這次也嘗試把演講的錄影放上來做個記錄,提供有需要的同學觀看。
大綱 / Outline
- 前言
- 初識子群組探勘
- 深入子群組探勘
- 子群組探勘工具
- 子群組探勘實戰
- 結語
投影片 / Slide
- Google投影片:發掘模型背後的知識:子群組探勘
- Power Point投影片備份:GitHub, Google Drive NCCU, One Drive, Mega, Box, MediaFire, SlideShare
影片 / Video
- YouTube影片:發掘模型背後的知識:子群組探勘 | Subgroup Discovery
本來這是Google Meet錄影的內容。我試著把它拉伸到整個畫面,並加上片頭跟片尾。
片頭跟片尾是使用Canva製作的影片。音樂的部分來自Bensound的Creative Minds跟Acoustic Breeze。影片剪輯軟體是使用開放原始碼的OpenShot。本來想要用功能強到逆天的DaVinci Resolve,但在Linux上一直裝不起來,真是無奈。雖然是這樣說,我也沒有打算做太複雜的影片剪輯就是了。
倒是錄音的品質比較令我困擾。我參考了好和絃 NiceChord介紹的Compressor跟AutoGain的做法,想說之後可以試著用Audacity來修正看看好了。
下次吧。每次都試著進步一點,加油!
結語 / In closing
子群組探勘的大部分文字介紹,我都放在子群組探勘簡介裡面了。這篇主要就是把之前演講投影片和錄影做個記錄,也算是為自己論文的演算法「模糊特殊模型探勘」做個前導。
關於記錄 / Blog as my record
上一次這樣記錄授課教材的是「Weka簡介與實作:資料探勘的分群、異常偵測、關聯規則探勘、分類」,至今已經過了快一年多了。這段期間並不是沒有做什麼事情,反而是事情有點多,導致我一直沒能好好回到Blog上,繼續記錄自己做過的事情。
為了消弭這種擔憂,我開始在「布丁布丁吃什麼?」Facebook粉絲專頁裡,在每個工作天發佈一些簡短的內容。至於內容是什麼嘛...就跟這個Blog一樣,就是分享我正在吃的,一些奇怪的東西。
很多人都跟我建議,要把Blog、粉專經營的像是一檔節目一樣。要有明確的受眾,穩定的客群,這樣才能長久經營。
但終歸來說,我還是把Blog當作是日記一樣的記錄,備份著自己做過與想過的事情。如果在這個記錄中能夠對別人有些幫助的話,那就太好了呢。
那麼這次子群組探勘演講的記錄就到這裡了。寫到最後,我來問個剖析模型的問題:
你想要嘗試看看那種打開黑箱鑰匙的方法呢?
- A. 白箱模型:全局代理模型: 好像之前學過多元回歸耶。
- B. 找出代表案例:反事實解釋: 還是實際例子比較讓人有感。
- C. 找出特徵的模式:子群組探勘: 掌握規律,才能洞悉未來。
- D. 其他:我會選擇其他方法,下面跟大家分享。
歡迎在下面的留言處跟大家分享你的想法。你的意見都是我繼續分享的動力喔!
如果你覺得我這篇實用的話,請幫我在AddThis分享工具按讚,或是將這篇分享到Facebook等社群媒體吧!想在社群媒體追蹤我的話,歡迎到我的Facebook粉絲專頁「布丁布丁吃什麼?」按個讚喔!
不知道這篇文章有沒有讓你吃到什麼有趣的東西呢?我是布丁,期待下次見!
經常看您的推文,很有收穫,尤其是以前的資訊行為的文章~很感謝。 我來自對岸,也是學圖資的。
回覆刪除To ye,
刪除原來是圖資大家族的一員。歡迎多多交流喔。
學長好,我可以給您寄信請教問題嗎?最近看了很多blog內容,尤其是一些圖資研究的考試題目,很有啟發。
刪除To ye,
刪除可以啊。
我推薦在blog問。這樣有同樣問題的人,也可以得到解答。