:::

實作DC資料,Dubline Core metadata editor

布丁布丁吃布丁

實作DC資料,Dubline Core metadata editor

Dublin Core metadata editor,一個網路線上服務,可以取得指定網址的資料並生成為DC(Dublin Core)欄位,可選擇輸出為HTML的<meta>標籤或是RDF(描述網路資源的標記語言)/XML,嵌入到<head>...</head>區段內即可使用。

此metadata(詮釋資料)產生器也可以選擇輸出到其他格式,如USMARC(美國的圖書機讀格式)、SOIF、IAFA/ROADS(網路發行者使用)、TEI headersGILS(全球資訊定位服務)或是IMS(IP多媒體子系統)。

DC是一種metadata元件,目的是為了讓電子資源更容易被找到。原始的構想是提供給作者產生網站資源的敘述,它引起了正規資源描述社群的注意,包括博物館、圖書館、政府機關部門以及商業組織。

以上都是翻譯自該頁面的介紹。

講了這麼多,到底這個編輯器能夠幹麻呢?最簡單的應用如下:

  1. 取得指定網頁的資料
  2. 分析成為DC格式
  3. 修正該網頁的資料,讓網站能見度更高(例如SEO,我猜)

讓我們一步一步來做做看吧。


DC metadata editor與網頁的關係

該網頁當中就只有一欄表單,本次的實驗對象,就填進「布丁布丁吃?」的網址吧。

天啊,好多亂碼。我相信Blogger在幫我寫metadata的時候應該是用Unicode,那麼就是這個用perl寫成的編輯器是用其他編碼寫成的囉?

網頁下面可以看到他抓了網頁的資料來跟DC作配對,為了方便起見,我把它複製過來看看。

Title
Creator (author)
Subject or keywords
Description
Publisher
Contributor
Date
Type
DCMI Type:
Format
Identifier
Source
Language
Relation
Coverage
Rights management
Version: DC-dot $Id: dcdot.pl,v 1.107 2005/03/02 23:55:27 lisap Exp $

你可能會很好奇,到底他是從哪裡取得這些資料的。讓我們打開布丁布丁吃?的原始碼來瞧瞧<head>區段裡面有些什麼。排除掉一些CSS跟JavaScript連結之後,我們可以看到以下內容:


   <head>
   <meta content='text/html; charset=UTF-8' http-equiv='Content-Type'/>
   <meta content='true' name='MSSmartTagsPreventParsing'/>
   <meta content='blogger' name='generator'/>
   <link rel="alternate" type="application/atom+xml" title="布丁布丁吃&#65311; - Atom" href="http://pulipuli.blogspot.com/feeds/posts/default" />
   <link rel="alternate" type="application/rss+xml" title="布丁布丁吃&#65311; - RSS" href="http://pulipuli.blogspot.com/feeds/posts/default?alt=rss" />
   <link rel="service.post" type="application/atom+xml" title="布丁布丁吃&#65311; - Atom"
   href="http://www.blogger.com/feeds/16607461/posts/default"
   />
   <link rel="EditURI" type="application/rsd+xml" title="RSD" href="http://www.blogger.com/rsd.g?blogID=16607461" />
   <title>布丁布丁吃&#65311;</title>
   </head>

很短,對,很短。除了那個「&#65311;」大概是「?」之外,<head>區段裡面找不到這麼多資料的樣子。好,讓我們再仔細地看一次上面有填資料的表格與該網頁之間的關連,也許可以發現什麼有趣的東西。

Title 標題,從<title>區段擷取
Subject or keywords 關鍵字,似乎是從網頁裡面資料去斷字斷詞出來的結果
Date 網頁的更新日期
Type 網頁的型態,因為是文字為主的Blog,所以他判斷成為Text吧
Format 格式分成兩個子欄位,編碼可以從<mate>標籤裡面找到,長度則是程式去計算出來的
Identifier 網址,就是你輸入的網址

其中重要的「Description」欄位無法自動產生,那麼就由作者(我)來為他撰寫吧。從下面表單填入了Description,並修正其他欄位的亂碼之後,re-submit的結果是:

<link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" />
   <link rel="schema.DCTERMS" href="http://purl.org/dc/terms/" />
   <meta name="DC.title" content="布丁布丁吃?" />
   <meta name="DC.subject" content="RSS; Atom; friends; PHP5$HTTP_GET_VARS; OK; LCD; K300; Picasa; Vlog; Writer;
   11/24/2007; Inno; OK─A.R.K; Wikipedia; Sitebar; CNET; Album; Zoomify; 11/25/2007; Creator; WLW”:Zoundry; main; Albums; Loading; 2.5轉IDE;
   Google; Alpha; Engadget; Aglaia; Zoundry; Raven; Feeds; Page; 32GB,15100; SSD; Setup; LG; Blog; Caduceus; WebFTP; MUSASHI; Web; Dear;
   BBS‧RSS; Vii; Reader; sidebar; skip; ACG; GUN; Decaview; Blogger" />
   <meta name="DC.description" content="布丁個人BLOG" />
   <meta name="DC.date" scheme="DCTERMS.W3CDTF" content="2007-11-25" />
   <meta name="DC.type" scheme="DCTERMS.DCMIType" content="Text" />
   <meta name="DC.format" content="text/html; charset=UTF-8" />
   <meta name="DC.format" content="126737 bytes" />
   <meta name="DC.identifier" scheme="DCTERMS.URI" content="http://pulipuli.blogspot.com/" />

讓我們把這些標籤加入原本的Blog,看看有什麼不同。

外表上看不出有什麼差別的。

書籤...也沒有差別。Description欄位沒有發揮功效。其實應該是要填入<meta name="Description" content="布丁個人Blog" />才對。

好吧,讓人高興的是這編輯器總算不會呈現亂碼了(這也是他說明裡面寫到的用處)。


不同輸出格式

接下來我們來看看不同的輸出格式會有什麼結果,並比較一下它們之間的差異吧。

XHTML:單一標籤結尾加上/,這是XML的規範


   <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" />
   <link rel="schema.DCTERMS" href="http://purl.org/dc/terms/" />
   <meta name="DC.title" content="布丁布丁吃?" />
   <meta name="DC.subject" content="RSS; Atom; friends; PHP5$HTTP_GET_VARS; OK; LCD; K300; Picasa; Vlog; Writer;
   11/24/2007; Inno; OK─A.R.K; Wikipedia; Sitebar; CNET; Album; Zoomify; 11/25/2007; Creator; WLW”:Zoundry; main; Albums; Loading; 2.5轉IDE;
   Google; Alpha; Engadget; Aglaia; Zoundry; Raven; Feeds; Page; 32GB,15100; SSD; Setup; LG; Blog; Caduceus; WebFTP; MUSASHI; Web; Dear;
   BBS‧RSS; Vii; Reader; sidebar; skip; ACG; GUN; Decaview; Blogger" />
   <meta name="DC.description" content="布丁個人BLOG" />
   <meta name="DC.date" scheme="DCTERMS.W3CDTF" content="2007-11-25" />
   <meta name="DC.type" scheme="DCTERMS.DCMIType" content="Text" />
   <meta name="DC.format" content="text/html; charset=UTF-8" />
   <meta name="DC.format" content="126737 bytes" />
   <meta name="DC.identifier" scheme="DCTERMS.URI" content="http://pulipuli.blogspot.com/" />

HTML:跟XHTML的差別就只有結尾沒有/


<link rel="schema.DC" href="http://purl.org/dc/elements/1.1/">
   <link rel="schema.DCTERMS" href="http://purl.org/dc/terms/">
   <meta name="DC.title" content="布丁布丁吃?">
   <meta name="DC.subject" content="RSS; Atom; friends; PHP5$HTTP_GET_VARS; OK; LCD; K300; Picasa; Vlog; Writer;
   11/24/2007; Inno; OK─A.R.K; Wikipedia; Sitebar; CNET; Album; Zoomify; 11/25/2007; Creator; WLW”:Zoundry; main; Albums; Loading; 2.5轉IDE;
   Google; Alpha; Engadget; Aglaia; Zoundry; Raven; Feeds; Page; 32GB,15100; SSD; Setup; LG; Blog; Caduceus; WebFTP; MUSASHI; Web; Dear;
   BBS‧RSS; Vii; Reader; sidebar; skip; ACG; GUN; Decaview; Blogger">
   <meta name="DC.description" content="布丁個人BLOG">
   <meta name="DC.date" scheme="DCTERMS.W3CDTF" content="2007-11-25">
   <meta name="DC.type" scheme="DCTERMS.DCMIType" content="Text">
   <meta name="DC.format" content="text/html; charset=UTF-8">
   <meta name="DC.format" content="126737 bytes">
   <meta name="DC.identifier" scheme="DCTERMS.URI" content="http://pulipuli.blogspot.com/">

RDF:完全是XML的架構

<?xml version="1.0"?>
<!DOCTYPE rdf:RDF SYSTEM "http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd">

<rdf:RDF
  xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
  xmlns:dc="http://purl.org/dc/elements/1.1/">
  <rdf:Description rdf:about="http://pulipuli.blogspot.com/">
    <dc:title>
      布丁布丁吃?
    </dc:title>
    <dc:subject>
      RSS; Atom; friends; PHP5$HTTP_GET_VARS; OK; LCD; K300;
      Picasa; Vlog; Writer; 11/24/2007; Inno; OK─A.R.K;
      Wikipedia; Sitebar; CNET; Album; Zoomify; 11/25/2007;
      Creator; WLW”:Zoundry; main; Albums; Loading; 2.5轉IDE;
      Google; Alpha; Engadget; Aglaia; Zoundry; Raven; Feeds;
      Page; 32GB,15100; SSD; Setup; LG; Blog; Caduceus; WebFTP;
      MUSASHI; Web; Dear; BBS‧RSS; Vii; Reader; sidebar; skip;
      ACG; GUN; Decaview; Blogger
    </dc:subject>
    <dc:description>
      布丁個人BLOG
    </dc:description>
    <dc:date>
      2007-11-25
    </dc:date>
    <dc:type>
      Text
    </dc:type>
    <dc:format>
      text/html; charset=UTF-8
    </dc:format>
    <dc:format>
      126737 bytes
    </dc:format>
  </rdf:Description>
</rdf:RDF>

XML:跟RDF相比的差別只有最外面幾層的標籤,XML標籤描述就很直接地使用metadata,不像rdf使用名稱空間(namespace)的rdf:RDF

<?xml version="1.0"?>
<metadata
  xmlns="http://www.ukoln.ac.uk/metadata/dcdot/"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://www.ukoln.ac.uk/metadata/dcdot/ http://www.ukoln.ac.uk/metadata/dcdot/dcdot.xsd"
  xmlns:dc="http://purl.org/dc/elements/1.1/">
  <dc:title>
    布丁布丁吃?
  </dc:title>
  <dc:subject>
    RSS; Atom; friends; PHP5$HTTP_GET_VARS; OK; LCD; K300;
    Picasa; Vlog; Writer; 11/24/2007; Inno; OK─A.R.K;
    Wikipedia; Sitebar; CNET; Album; Zoomify; 11/25/2007;
    Creator; WLW”:Zoundry; main; Albums; Loading; 2.5轉IDE;
    Google; Alpha; Engadget; Aglaia; Zoundry; Raven; Feeds;
    Page; 32GB,15100; SSD; Setup; LG; Blog; Caduceus; WebFTP;
    MUSASHI; Web; Dear; BBS‧RSS; Vii; Reader; sidebar; skip;
    ACG; GUN; Decaview; Blogger
  </dc:subject>
  <dc:description>
    布丁個人BLOG
  </dc:description>
  <dc:date>
    2007-11-25
  </dc:date>
  <dc:type>
    Text
  </dc:type>
  <dc:format>
    text/html; charset=UTF-8
  </dc:format>
  <dc:format>
    126737 bytes
  </dc:format>
  <dc:identifier>
    http://pulipuli.blogspot.com/
  </dc:identifier>
</metadata>

但是後兩者拿來擺在HTML或XHTML裡面就很奇怪,對吧。


結論:網站設計者所關心的不是DC

這個編輯器能協助我們用統一的方式去描述網站資源,並且方便你更新資料。從另一個角度來看,他用DC的方式描述網頁資料跟網頁平常在描述的方式不同(如前面的Description欄位與書籤),那麼這個編輯器產生的資料到底能不能對於網站有所幫助?甚至提升SEO?這就很難說了。

如果能夠再跟網頁描述做緊密結合的話,那麼相信會有更多網站會喜歡參考這個標準規範的。

(more...)

低速雲霄飛車──貓空纜車搭乘感想

布丁布丁吃布丁

低速雲霄飛車──貓空纜車搭乘感想

貓纜自夏天開通以來已經數月,經過了颱風、地震等多次停擺事件,至今仍不減人們對它的好奇心。

這週我有圖檔所大出遊以及輔漫社團出遊,剛好都選擇以搭貓纜進行,於是乎我就在這週內連續搭了我的第一次跟第二次貓纜。本回感想是以第一次搭貓纜時的照片為主。

2007年11月21日星期三上午10點55分1秒,貓纜前的紅龍分隔線已經有三排站滿了人龍,我忽然開始懷疑今天到底是不是非假日。然而事實證明,週六社遊時排隊的長度,則是照片中的兩倍。

我不知道是不是旁邊就是動物園的關係,這條路上的遊覽車非常的多,當然,從遊覽車下來特地來坐貓纜的人也不少。

從外面玻璃窗上貼著的票價來看,坐到貓空總站需要50元,來回則是100元。雖然這樣比較很奇怪,但這足以騎摩托車上下來回三次的油錢吧。

另一張海報,宣傳著貓纜的可靠性,但是這可靠性老是被媒體不斷抨擊。而且我相信海報這種寫法,幾乎沒幾個排隊的人看得懂它是什麼意思。

剛剛看到很長的列隊,到我排到門口之前,其實也不過花了五分鐘左右而已。其實照一般的載客量來說,貓纜是不需要這樣排隊的。然而大家都把它當作觀光景點來坐,最後演變成得拉紅龍來整隊,原本的用意都改變了。

讓我介紹一下,這位可愛的工作人員是進門後第一關的守門員。什麼意思?在踏上手扶梯之前,你還要再等一段時間,以免排隊人數過多。

貓纜動物園站有四層,就是要你排四次的意思。雖然佩服他們的控管方式,但是這樣排的確是很考驗人們的耐心。

四樓,你看到的還是一堆人。讓我們看看照片上的時間紀錄,到目前為止已經花了二十分鐘了。果然,門外只是表象,裡面排隊才真是花時間。

好吧,至少來到四樓可以遠眺景色,這是讓人覺得開心的地方。

靠近貓纜了!眼前看到的這個捷運常見的出入口並不是真正的出入口,要從右邊在繞一下才會到,不知道為何是這樣設計。

真正的出入口,隨時打開的團體票出入口表示有很多人是用團體票進來的。這層樓的工作人員特別戴著口罩,其他人卻沒有,這到底是為什麼呢?

在排進貓纜之前,再讓我們眺望一下遠方的景色吧。

喔喔喔!來了來了!

巨大的機械構造,身為男生通常都會對這個感到熱血十足吧。

終點(?)就在前面了!

這張照片很動態,因為貓纜是邊轉邊坐上去的,他不會停下來等你喔。還好速度很慢,老年人上去也不成問題。

搭上貓纜之後往後看。有沒有感覺到玻璃霧霧的差別啊?

風さそう木陰に俯せて泣いてる......プリン、行きます!

窗外景致...反正就是樹樹樹樹樹。

但這種角度,可就不只是樹了。這裡不是遊樂園,下面沒有籃網喔。

再來一張,有沒有像是在看衛星圖的感覺啊?

打開的氣窗。貓纜上是沒有冷氣的,溫度調節只依賴天氣。最近天氣陰陰涼涼的,貓纜內坐起來也頗為舒服,但也不是不能體會那些夏天來坐貓纜而形容它為烤箱的乘客的心情啦。

貓纜串一串,我很喜歡這種景色。

支撐點,整條路上有許多這樣子的支點,經過的時候貓纜會稍微抖動,有點恐怖。

好會撞上去的感覺!

貓纜中間會轉彎喔,圖中為轉彎的地方。

我一個人搭乘的時候,是與另一家人共乘一車。成員為兩位社會人士的姊姊,兩位小妹妹,以及一位膽子很大的老婆婆。小妹妹們一直望著窗外,十分興奮,讓大姊姊要拍照的時候都得說謊騙她們,她們才會轉過來。聊天的時候得知他們是從台中來的,是同鄉呢。

「請乘客不要在車內站立、晃動...」廣播忽然從天花板的喇叭發出聲音,嚇的小妹妹們安靜了一陣子。

窗外,霧霧的,雖然看不清楚,但也換來了涼爽的舒適感。

這邊算是文山區吧,可以找到政治大學的綜圖大樓喔。

遠方是六張犁,我不久前才去過的。

搭了好久卻才只搭到指南宮站。貓纜共有四站,個別是動物園站、動物園內站、指南宮站、貓空總站。到達指南宮站約花了二十幾分鐘。入鏡人物是同車的老婆婆,右圖則是指南宮。

再搭一下子,總算到了貓空總站。貓空站附近吃飯都不便宜,而且好吃的似乎不多,本來那家人還想說要請我帶她們去吃飯的,最後還是在站前揮手道別了。


週吃完飯之後,回程又是搭貓纜。六的時候,人群是現在的三倍之多吧。

借用吾友某誠的相片一張XD 大概是這種震撼感

照片也都貼得差不多了,本回的感想就到此為止囉。

(more...)

うおっまぶしっ!Decaview LCD的爛螢幕

布丁布丁吃布丁

9 Comments

うおっまぶしっ!Decaview LCD的爛螢幕

「嗚啊!真是太刺眼了!」

MUSASHI -GUN道-的笑話真的在身邊發生之後,就很難笑得出來。上面這張圖絕對不是我把螢幕保護程式調成全白,或著是我在測試LCD的亮點,而是這台LCD自己的問題。

友嘉國際Decaview YV2200W,22吋LCD寬螢幕,我使用約三個月左右,在某次關機時,他會自動變成全白的螢幕,除非拔掉電源他才能真的「關機」。我的使用狀況跟一般人應該差不到哪去,螢幕一天開機時間約8小時不到,應該也不能說是使用過度的問題。

本產品有一年保固(還是三年?)免費到府送修,但拿去送修就等於這幾天我沒螢幕可用,工作停擺,這可不行啊。第一次壞掉的時候,我直接騎機車載去該公司維修,大概三十分鐘以內搞定回家。

重點來了,大概過了三個月之後,又發生這個問題。我該說一年保固還沒到之前又再壞一次,真很幸運嗎?

因為沒時間拿去修,但又不能放著讓下舖的室友睡覺時總是籠罩在一片白光裡,只好改用了獨立開關的延長線,省下每次都要拔電線的困擾。

(more...)

快要超越WLW的Blog離線撰寫軟體:Zoundry Raven Alpha

布丁布丁吃布丁

快要超越WLW的Blog離線撰寫軟體:Zoundry Raven Alpha

現在我在這邊很高興地為大家介紹一款新的Blog離線撰寫工具:Zoundry Raven Alpha。這是從Zoundry Blog Writer衍伸發展而來,目前仍在開發中,尚未推出正式版。我現在使用的版本是0.8.143 Alpha,發佈日期是2007年11月19日。

雖然尚未到達正式版,但我卻已經開始使用了。這是因為他擁有許多項特點,這是連Windows Live Wrtier都尚未達到的程度。

好用的編輯器

來看看這編輯器,他跟一般的編輯器有什麼不同呢?

  • 基本但詳盡的格式設定。喔喔,WLW可差遠了呢。
  • 支援拖曳插入,其實這大多數編輯器都有。
  • Extemded Entry延伸閱讀標籤。他會在程式碼裡面插入<!--more-->,此時編輯畫面便會多一條綠色的線,讓你可以靠這條線來決定延伸閱讀的界線在哪裡。我的程式基本上是用<!--Digest-->來分段,但如果順應Zoundry Raven而改變程式碼,倒也不是什麼問題。
  • 縮圖大小多個種類自訂,而且可以自訂上傳到Picasa,真夠讓人感動的了。 同時縮圖也會自動上傳原圖,並且生成超連結,沒想到這篇文章就這樣順利地達到了。

缺點還是有的:

  • 縮圖雖然可以縮,但發佈之後卻沒有<a>超連結連到原圖,怪哉。 此外,縮圖沒相框不夠漂亮。好吧,我承認我還蠻喜歡WLW的圖片相框功能的。
  • 不能在Design畫面中設定HTML Tag,這是我蠻詬病的一點。這讓我好像回到了最早期用Word的時候,現在已經是統一設定格式的CSS了。
  • Insert HR不能使用,插入水平線依然得去編寫HTML 。
  • Design與XHTML模式切換,游標會回到最上方。我不知道這是不是網頁編寫工具,如Dreamwaver,才有的特異功能,大多數的WYSIWYG都會有切換模式的時候游標會跑掉的問題。雖然上面提到的幾點問題都可以直接修改HTML碼來手動修正,但是每次都得切換、重找修改到哪邊,這會讓人失去耐心。
  • 沒有自動儲存草稿的功能。

詳盡的管理介面

左方的樹狀結構圖將各個Blog分成Post、Links、Images、Tags四項,管理功能十分強大,將原本已經相當好用的Zoundry提升到更高的一層境界。

整合多種多媒體資料庫

除了原本可自訂FTP上傳之外,現在也加入了Image Shack、LiveJournal ScrapBook、Picasa Web Album、Ripway FTP。我嘗試過Picasa,整合上是沒有問題的。然而這些類型中卻沒有常見的Flickr,這讓我感到奇怪。

其他特色與問題

目前Template似乎整合上還沒有做得很好,雖然顯示上是沒問題,但是錯誤訊息會一直跳出來。也許這跟我老是在範本裡面裝了一堆莫名奇妙的JavaScript有關吧。

另一個則是他的圖片整合了LightBox,這是一種美觀地展示圖片的JavaScript程式,相當知名。之前我也有在考慮要不要為我的Blog加上這支程式,但目前看來還有很多問題有待解決就是。


看論壇的公佈週期,作者大概半個月會公佈一次,讓我們一起期待吧。

(more...)

Engadget 癮科技加入我的Google Reader

布丁布丁吃布丁

0 Comments

Engadget 癮科技加入我的Google Reader

Engadget 癮科技,一樣是一個科技為主的新聞台,但他跟常駐我Google Reader已久的CNET有很明顯的市場區隔。癮科技的文章短、範圍廣、語帶諷刺(這讓我覺得他們很像是Blogger而不是新聞編輯)、而且盡是在玩些新的玩意兒。的確在很久以前我就注意到這個站,而在上次看完Engadget Vlog大家討厭的 Vii 又來囉! 而讓我一整晚都在歡樂的心情下渡過之後,我決定把癮科技加入我的Google Reader。

當我每看一次CNET的RSS都要花上快一個小時的時間,甚至看到快睡著的時候,我早就該有警惕。CNET的文章雖然精闢、詳細,但說真的,真的太長了。有些最新新聞對我來說也有點難懂, 企業應用專題也頗為企業。一不小心過了幾天沒看,CNET的分類又多了幾十篇尚未閱讀的文章,真是看也不是,不看也不是。

癮科技的文章長度適宜,大多都是都是像前面圖片一樣用一個螢幕就可以看完的長度,很適合時間不多的人輕鬆閱讀。(嗯?我有在炫耀螢幕尺寸嗎?一定是你的幻覺啦。)


這篇其實是再練習用Zoundry而寫的日記,習慣之後其實也頗好上手。三點了,還是來睡覺吧。 (more...)