:::

發掘模型背後的知識:子群組探勘 / Knowledge extraction beyond the AI Models: Subgroup Discovery

5-cover-Introduction_to_Subgroup_Discovery2.png

哈囉,大家最近在吃什麼呢?這裡是換了一臺電腦的布丁。這篇是2021年演講的記錄,主題一樣是講述子群組探勘(subgroup discovery)。跟前一篇「子群組探勘簡介」不一樣的是,演講裡面我加入了較多例子,用比較容易理解的方式來介紹子群組探勘。這次也嘗試把演講的錄影放上來做個記錄,提供有需要的同學觀看。


大綱 / Outline

2022-0331-231724.png

  1. 前言
  2. 初識子群組探勘
  3. 深入子群組探勘
  4. 子群組探勘工具
  5. 子群組探勘實戰
  6. 結語

投影片 / Slide

影片 / Video

本來這是Google Meet錄影的內容。我試著把它拉伸到整個畫面,並加上片頭跟片尾。

片頭跟片尾是使用Canva製作的影片。音樂的部分來自BensoundCreative MindsAcoustic Breeze。影片剪輯軟體是使用開放原始碼的OpenShot。本來想要用功能強到逆天的DaVinci Resolve,但在Linux上一直裝不起來,真是無奈。雖然是這樣說,我也沒有打算做太複雜的影片剪輯就是了。

倒是錄音的品質比較令我困擾。我參考了好和絃 NiceChord介紹的Compressor跟AutoGain的做法,想說之後可以試著用Audacity來修正看看好了。

下次吧。每次都試著進步一點,加油!


結語 / In closing

2022-0331-234319.png

子群組探勘的大部分文字介紹,我都放在子群組探勘簡介裡面了。這篇主要就是把之前演講投影片和錄影做個記錄,也算是為自己論文的演算法「模糊特殊模型探勘」做個前導。

關於記錄 / Blog as my record

上一次這樣記錄授課教材的是「Weka簡介與實作:資料探勘的分群、異常偵測、關聯規則探勘、分類」,至今已經過了快一年多了。這段期間並不是沒有做什麼事情,反而是事情有點多,導致我一直沒能好好回到Blog上,繼續記錄自己做過的事情。

到底什麼時候才能寫blog呢...

為了消弭這種擔憂,我開始在「布丁布丁吃什麼?」Facebook粉絲專頁裡,在每個工作天發佈一些簡短的內容。至於內容是什麼嘛...就跟這個Blog一樣,就是分享我正在吃的,一些奇怪的東西。

很多人都跟我建議,要把Blog、粉專經營的像是一檔節目一樣。要有明確的受眾,穩定的客群,這樣才能長久經營。

但終歸來說,我還是把Blog當作是日記一樣的記錄,備份著自己做過與想過的事情。如果在這個記錄中能夠對別人有些幫助的話,那就太好了呢。


那麼這次子群組探勘演講的記錄就到這裡了。寫到最後,我來問個剖析模型的問題:

你想要嘗試看看那種打開黑箱鑰匙的方法呢?

  • A. 白箱模型:全局代理模型: 好像之前學過多元回歸耶。
  • B. 找出代表案例:反事實解釋: 還是實際例子比較讓人有感。
  • C. 找出特徵的模式:子群組探勘: 掌握規律,才能洞悉未來。
  • D. 其他:我會選擇其他方法,下面跟大家分享。

歡迎在下面的留言處跟大家分享你的想法。你的意見都是我繼續分享的動力喔!

如果你覺得我這篇實用的話,請幫我在AddThis分享工具按讚,或是將這篇分享到Facebook等社群媒體吧!想在社群媒體追蹤我的話,歡迎到我的Facebook粉絲專頁「布丁布丁吃什麼?」按個讚喔!

不知道這篇文章有沒有讓你吃到什麼有趣的東西呢?我是布丁,期待下次見!

總共4 則留言 ( 我要發問 , 隱藏留言 顯示留言 )

  1. 經常看您的推文,很有收穫,尤其是以前的資訊行為的文章~很感謝。 我來自對岸,也是學圖資的。

    回覆刪除
    回覆
    1. To ye,

      原來是圖資大家族的一員。歡迎多多交流喔。

      刪除
    2. 學長好,我可以給您寄信請教問題嗎?最近看了很多blog內容,尤其是一些圖資研究的考試題目,很有啟發。

      刪除
    3. To ye,

      可以啊。

      我推薦在blog問。這樣有同樣問題的人,也可以得到解答。

      刪除