:::

知道怎麼作,比實際做還要重要

布丁布丁吃布丁

知道怎麼作,比實際做還要重要

12/6課堂上聽了世新大學資訊傳播學院阮明淑老師的演講影片:「知識產業與知識服務」,這類概念理論的演講我還是很難抓到重點,不免為自己警惕一下。阮老師想要呼籲的應該是將圖書館所學的知識轉移到其他領域時,將會自動轉換成Know-How,而使產業從原本的製造提升到研究發展的層級。

Know-How在英文wiki裡面的解釋有點複雜,他是一種關於特定領域資訊的概念,有點像是私傳祕笈一樣,就是一些未受專利保護的發明(unpatented inventions)、經驗法則、設計、繪圖、程序及方法。經由長時間累積而成的技巧與經驗的專業人員控管,可協助改善產業的大量生產或是帶來競爭性的優點。

同學常常覺得老是在寫程式的我不該在圖資界,而去資工、資管領域才是,這觀點我並不贊同。程式寫越多,就越覺得自己有些地方不足。那是什麼呢?就是上面提到的Know-How。舉個例子來說,執行需要程式為工具的計畫中,固然程式設計師是負責將程式建構起來的人,但是這程式該怎麼運作、想要達到什麼樣的結果,這則是系統分析師搭配Know-How才能去做的事情。

只會寫程式,說真的,一點也沒什麼了不起。偶爾會聽到同學感嘆自己電腦能力不足,我認為大可不必妄自菲薄。圖書資訊學充滿了許多有趣的議題可以深入研究,這應用範圍並不止於在圖書館。將圖資知識應用到各行各業,都將會有一番作為。

雖然這樣說可能有失偏頗,但我還是想這麼說:我們熟知資訊結構與組織的同學們啊,你們以後是要站在上位指導者的地位的人,何必去煩惱電腦技術比不過基層人員呢?

(more...)

本所聽課最認真之學生

布丁布丁吃布丁

本所聽課最認真之學生

日前所上的薛老師跟蔡老師獲得了95學年度專業課程教學特優教師獎

趁此機會,我也想推薦一個本所聽課最認真學生獎

該學生認真聽課、確實吸收老師的教學內容

雖然偶爾會打個瞌睡,但他的確很認真

而且也是所上最得力的小幫手.......

(more...)

選擇政大圖檔所好處在哪裡?──事情多到做不完

布丁布丁吃布丁

選擇政大圖檔所好處在哪裡?──事情多到做不完

明天就是政大圖檔所的碩士班推甄口試了,還沒注意的同學請趕快到政大圖檔所的網站上去看口試名單吧。(雖然說到現在還沒注意的人,大概也是不想來考了。)

政大圖檔所的推甄算是推甄潮的尾端。相關系所的臺大、師大都已經放榜,誰會來繼續挑戰這最後一所,其實看了看放榜名單大概就可以略知一二。今天老師就在調查那些口試名單的人有沒有在他校榜上有名,名單上有不少都已經考上其他所,小我一屆的第一名學弟甚至已經考上台大,據說他應該已經不會來面試了。

重榜並不讓人意外,優秀的人才本來就會錄取很多所學校,這是應試者實力的証明。但是在這最後一所的推甄口試中,你一定會被問到一個問題:「你如果考上政大圖檔所,那你會選擇哪間?」尤其是我們所似乎常常被拿來跟師大圖文傳播學系做比較,大概因為都是國立的圖資系相關系所的緣故吧。

如果你想要進入政大圖檔所,那麼這個問題的答案是一定要準備的,然而這卻很難客觀地回答。

答案大致上可以從設備、師資、研究方向是否吻合等幾點來著手。如果你是很主動地說自己的研究方向與所上老師專長吻合,這樣子應該是最有力的說詞。但是大學剛畢業就明確地決定自己要做什麼的人,我想應該是不太多。另外設備、師資什麼的,我這個還沒仔細看過師大的人也沒有資格比較,所以我打算直接來說政大圖檔所的好處在哪。

師資,五位老師的教學跟研究能力上都很不錯,跟學生關係也都很好。師資專長請參考所上網頁的師資陣容,如果對陳志銘老師的研究方向有興趣的話,可以另外再來問我。

設備,研究生室一大間約二十幾個座位,專用圖書室好幾櫃圖資資料,伺服器室十幾台伺服器跟一台超高級掃描機,資訊檢索室有十幾台公用電腦,此外筆電、投影機、錄音筆、數位攝影機等等的設備。高不高級我是不知道,但是應該足以支援學生跟老師的研究了。(對,因為設備就是我在管的)

以上這兩點說客觀也不太客觀,好或不好是因人而異。所以我想到了一個最通用、同時也相當有力的論點──計畫與活動。

政大圖檔所的活動不少,有學術性的、也有增進所上團體氣氛的活動。學術性的研討會、研習班,老師們會帶領學生以團隊的方式進行;團康活動大部分都是由學生去策劃、執行。一方面是圖檔所全部也不過三十幾位學生,人手時常不足,需要參與活動策劃的機會相對地比較高。

這可以增加類似社團的活動經驗,而且因為會有老師主導、學長姐傳承下來的策劃方式,加上碩士生比較願意做事,所以就我目前參與過的團隊經驗都還不錯,可以學到相當多東西。

另一個是研究或計畫。本所老師似乎還蠻常找研究生來支援研究的,這跟有些老師不放心讓學生插手的心態有很大的不同。參與研究計畫的學生,可以清楚地看到老師是怎麼進行研究與計畫,而且背後也有老師指導與經費設備支持,因此可說是有相當多地實務操作的機會。

這種經驗對於研究上有很大的幫助。跟著老師,就很像是你在作研究方法的實習一樣。而計畫中使用到的設備,或著是你在計畫中的貢獻,都可以成為你未來畢業論文的基石。

以我個人來說,推甄完之後就加入老師們的計畫團隊,老師便打算讓我以這個計畫為基礎,發展出適合碩士畢業論文的主題。到了現在,同學們都還在一邊修課一邊想著「畢業論文該做什麼好呢」的時候,我已經常常在跟指導教授討論畢業論文的方向了。

最後就是說到畢業,政大圖檔所一般唸下來通常是兩年就可以順利畢業,這是國內眾多文學院裡面最快的速度,應該是沒有比兩年更短的了。

以上這些經驗分享,反過來想的話,就是政大圖檔所內事情多到有點做不完的感覺,而且整體修課而言並不算輕鬆的。但是如果你真的想好好地來念書,你還會擔心這些事情嗎?

(more...)

與其當作Second Life,不如當成提供服務的平台

布丁布丁吃布丁

與其當作Second Life,不如當成提供服務的平台

  1. 在寫前面兩篇關於Second Life介紹時,比較沒把個人的想法寫進去,所以我想在這邊就來寫寫個人的想法。

我的電腦跑不動

對我來說,Second Life在台灣還不能盛行,關鍵點卡在電腦設備上。

你可能會想起那篇介紹中我列了系統需求表格,也提到了串流方式下載對於網路的負荷。我在進入Second Life的時候,這是我最大的阻礙。

為方便參考,我列一下自己電腦的設備:

  • CPU:Mobile Intel Pentium M, 1100MHz
  • 系統記憶體:1015MB DDR SDRAM PC2700(166MHz)
  • 顯示晶片:Interl(R) 82852/82855 GM/GME Graphics Controller(64MB)
  • 使用學術網路

別人的電腦我不確定,但是我的電腦跑得很不順,這也很難得地激起了我想要換筆電的衝動。

對於大多數有在玩遊戲的人來說,Second Life的系統需求連看都不用看就可以輕易跨過去。但別忘了,就如部落客 Mr. 6 寫的,Second Life是大人的遊戲、適合商業人士的遊戲,而看看那些號稱商業人士使用的文書機、高續航力筆電,這種程度真的可以來玩Second Life嗎?

電腦設備ok了,那網路呢?電腦等級的問題永遠都爭不完,永遠沒有一個「這樣子最好」的標準。

那麼我們先把這個問題放一邊,來看看另一個問題。


不太好用的Web 2.0服務

有人說Second Life是個標準的Web 2.0呈現工具,我認同,但是在Web 2.0的各種服務中,我卻不覺得他好用。

這是觀看角度的問題。對我而言,我需要的是一條獲取資訊的管道。YouTube、Flickr方便分享、散佈影片與圖片、del.icio.us串聯起散落各地的網頁資訊、Digg篩選出了有用的資訊。這些網站的共通點有兩個:一個是快速便利、另一個是容易混搭(mash up)。

Second Life是一個完整的世界,但是他並不快──我是指,我要找一篇期刊論文來看的話,開網頁資料庫來看明明就方便很多,應該是沒有必要還跑到Second Life裡面去找吧?

這就又是另外一個問題了,也許我從方便性來看Second Life,說不定也是個錯誤的角度。


虛擬實境的服務,而不是世界

我認為Second Life最重要的,應該還是設計出殺手級的服務。

SLURL這功能或許是Second Life提供網頁服務混搭的一條途徑,例如對於一個產品的使用,服務提供者可以在Second Life製作一個虛擬實境的教材,讓瀏覽者進入Second Life的世界去體驗。然而,這個前提在於Second Life已經是一種普遍的資訊素養,就如現代人用瀏覽器上網找尋資訊一樣的程度。

我認為這是可行的。我們不一定要真的把Second Life當作「生活的延伸」,就像掛BBS那樣整天待在那個世界,但卻可以用Second Life的功能設計優質的服務。Second Life是一個共通、低門檻(至少使用者能免費進入)的平台,只要在上面提供吸引人、難以取代的服務,使用者要說服上頭單位更新電腦到足以跑Second Life也會比較有理由吧。

只是到目前為止,自己是還沒有體驗過這種殺手級的服務,可能得繼續等了。

(more...)

Web2.0的迷思

布丁布丁吃布丁

Web2.0的迷思

11/22是聽同學如玉報告Web 2.0,實在是很佩服她整理的這麼有條理,短短一堂課的報告讓大家了解Web 2.0的概況。

雖然是這樣說,先自首一下,大致上都是看過的內容,所以難免聽講的時候比較不專心。

Web 2.0是個趨勢,這個我想大家都認同。但是到底Web 2.0是什麼?我覺得那些定義都頗為詭異。

你說,Web 2.0就是Blog、就是Wiki。所以你的網站服務上就要有Blog,就要有Wiki,因為這是趨勢。在一個不需要提供留言、不允許別人編輯的服務中,提供這樣子的服務,這樣真的是正確的嗎?更糟糕的是,當你提供一個Blog、Wiki,卻沒有管理者去維護,這將會遭受到更嚴重的信譽受損──提供了這樣子的服務,實際上卻只是個空殼子,這已經是欺騙的行為了。

不管做什麼事情都是會卡在時間、經費、人力等限制上,朝向Web 2.0的概念去設計,一樣會遇到這種問題。特別是Web 2.0講究的是一個永續經營的概念,別忘了O'Reilly和Battelle的定義:「永遠的Beta版」。

矛盾的是,對於一個滿腦子都是自動化、想辦法降低人力介入的程式設計師來說,卻要寫這種盡量讓人力介入的Web 2.0服務,這種設計理念的轉換,我覺得應該值得開個專題來討論。至少對現在的我來說,越需要去維護的東西,我就越懶得去動就是。

(more...)

孤單的感覺

布丁布丁吃布丁

孤單的感覺

(more...)

A Knowledge Network Constructed by Integrating Classification,Thesaurus, and Metadata in Digital Library

布丁布丁吃布丁

A Knowledge Network Constructed by Integrating Classification,Thesaurus, and Metadata in Digital Library

書目資料:

  • 篇名:A Knowledge Network Constructed by Integrating Classification,Thesaurus, and Metadata in Digital Library
  • 作者:JUN WANG
  • Intl. Inform.&Libr. Rev. (2003), 35, 383~397

摘要

現今檢索系統最常使用的技術是關鍵字檢索(keyword-based search),然而這種方式卻忽略了詮釋資料(metadata,因為習慣所致,接下來我都會寫成metadata)的價值。該文將結合分類法(classification)以及索引典(thesaurus)而成為一種概念網路(concept network),然後將metadata記錄依照主題(subject)排列。

該文並建置了一個系統VISION用來驗證其理論,這是結合了漢語分類主題一體化詞表(Chinese Classification and Thesaurus)與北京大學圖書館的書目資料計算而成的結果。

這種概念網路不僅只是metadata的組織框架,同時也是一種知識導覽、檢索、以及學習的結構,而作者相信它將會把數位圖書館提升成為知識管理中心。

好啦,反正這種自動產生概念網路的論文很多,好處跟優點大家都差不多。所以要看這種論文,重點要擺在理論與實驗驗證的部份,該文的實驗部分僅有系統介紹,並沒有證實用的測試數據,故以下僅談理論部份。


知識網路整合分類法、索引典以及詮釋資料 Knowledge Network Integrating the Classification, Thesaurus, and Metadata (KNICTM)

這方法是把分類法索引典當成是組織書目資料的骨架,而書目資料則是框架的內容。在這種作法中,藉由從書目資料自動地抽取出新的辭彙,可用於更新分類法與索引典,以構成知識群組。最後分類法與索引典也會符合專屬領域的OPAC資源(Open Public Access Catalog,開放線上目錄,就是圖書館網站裡面最重要的那個查詢系統啦)。

KNICTM的作法有三個步驟,整個過程最後將會產生出一棵樹(tree)。這步驟簡單來說各別是創造骨架、充實內容、新增內容:

1. 以分類法與索引典為基礎,建構原始的概念節點(concept node)

首先,要將索引典轉換成原始的概念網路,它包括了節點(nodes)與邊(edges)。

每個節點都是一群同樣意思的主題詞,包括了索引典中所有相關的詞彙。如果兩個主題詞之間有層級的關係,這兩個節點則連上「is-a」的邊,表示兩者之間有所關聯。is-a白話就是「是一個」,例如「正方形」「是一個」「長方形」,大概是這種感覺。

如此不斷重複的訓練過程,就能夠將分類法嵌入概念網路中。這個概念網路你可以想像成一個骨架,能夠呈現出分類法與索引典的骨架。

2. 將書目資料加入概念網路中

將相關的書目資料結合之後,摘要概念節點(abstract concept node)將可以成為知識節點,而概念網路(concept)將轉變成實體的知識網路(knowledge)。從這邊你可以稍微理解概念網路與知識網路的差別了,一個只是架構,另一個則是有東西在裡面。

將書目資料記錄(bibliographic data records,BDR)結合到概念網路的方法如下:

如果BDR只有一個主題詞,那麼就直接找到相關的概念節點,並把該BDR加進去。如果BDR包含了許多的主題詞,那麼就照上面的作法一一將主題詞加入,很廢話。

重點在於,如果BDR中有多個主題詞組成的混合主題詞(composite subject)時,就要創造一個新的概念節點,然後將它與其他偶關聯的節點連上「related-to(關聯到)」的邊。這個新的節點稱為「co-concept(聯合概念)」節點,該節點只有BDR並且此時沒有主題詞(因為不是由第一步的分類法與索引典而來的)。

例如BDR有個主題詞叫做「Internet Firewall Technologies(網際網路防火牆技術)」,它與「Network-Security(網路保全)」有關,但是在索引典裡面並沒有「firewall(防火牆)」這個詞。現在就要建立一個co-concept節點,然後用relate-to把它跟Network與Security節點連起來,而這個包含BDR的co-concept節點就是關聯的驗證。

在下一步當中,要把新抽取出來的詞彙加入co-concept當中,在此例裡面就是將「firewall」加入。

KNICTM需要經常手動(?)檢查確認co-concept是否正常建立。當更好的詞彙可以代表的這個co-concept的時候,該節點將會轉換成通用概念節點(common concept nocde)。你可以想像成原本的節點達到足夠重要的條件,所以將它升級的意思。只是為何要用手動檢查呢?

3. 加強KNICTM

這是最後也是最困難的工作,現在要從metadata集合當中找出新的辭彙,以加強KNICTM。

一般來說,科學性的文獻通常可以從標題去抽取出關鍵字,以找到相對應的主題詞。從語意上去對照,即可找出新的辭彙,並且將它加入概念網路中。

這邊有三個困難之處需要克服的:

  1. 標題中如何分辨重要與不重要的辭彙?
  2. 該怎麼決定抽出來的詞彙要不要加入到KNICTM?
  3. 中文斷詞,這是中文檢索永遠的問題

最後KNICTM將會長得像一棵樹。我覺得作者在此時應該放張圖片來說明,這樣應該會更好懂,所以我決定畫張圖來說明吧!

這張圖有簡化過概念,我覺得這樣應該會比作者的敘述更好理解。想要實作的話就再繼續細讀這篇後面的實驗部份吧!


剩下的篇幅,作者都在介紹他的VISION實驗系統。只是單純介紹系統的話,我覺得那是要等實作的時候再去觀摩就好。

本來很想知道到底KNICTM的演算法能作到什麼程度,作者要用什麼方式去驗證,或是比較KNICTM與其他的concept network的優劣,可惜都沒有這方面的資料。

故本篇閱讀心得也到此為止,感謝大家收看。

(more...)