tag:blogger.com,1999:blog-16607461.post7561367040484598603..comments2024-03-28T18:22:06.279+08:00Comments on 布丁布丁吃什麼?: 以PHP與PostgreSQL實作簡易中文全文檢索功能—概念說明篇布丁布丁吃布丁http://www.blogger.com/profile/13614721642960940190noreply@blogger.comBlogger10125tag:blogger.com,1999:blog-16607461.post-25530017383733435652010-07-17T04:59:41.905+08:002010-07-17T04:59:41.905+08:00期待你的續篇期待你的續篇Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-16607461.post-31139933580039649012010-07-11T22:48:04.873+08:002010-07-11T22:48:04.873+08:00您好,
一般的斷詞器都會判斷半型空格來分割字串,包括SCWS。
正常撰寫英文時,就已經有半型空格在...您好,<br /><br />一般的斷詞器都會判斷半型空格來分割字串,包括SCWS。<br />正常撰寫英文時,就已經有半型空格在內,斷詞器也就會把他依照空格來斷詞囉。<br />所以您的方法是正確的,而一般斷詞器也都考慮到這點了!<br />而PostgreSQL的全文檢索功能還會把英文做詞幹分析,更為強大。<br /><br />請期待下一篇的介紹!……等我論文系統寫到一個段落之後吧orz布丁布丁吃布丁https://www.blogger.com/profile/13614721642960940190noreply@blogger.comtag:blogger.com,1999:blog-16607461.post-49816251090865335242010-07-10T14:10:16.701+08:002010-07-10T14:10:16.701+08:00您這篇寫的非常好
對我還滿大的幫助
我也有個想法
適用於
在標題 或是 網站標題
我愛吃布...您這篇寫的非常好<br /><br />對我還滿大的幫助<br /><br />我也有個想法<br /><br />適用於<br /><br />在標題 或是 網站標題<br /><br />我愛吃布丁 Hi love<br /><br />用PHP 去分割字串<br />英文部分 不分割<br /><br />我愛 愛吃 吃布 布丁 Hi love<br /><br />這種方法也可以用於<br /><br />其他語言 不限定繁體<br /><br />撋使嗽SCWS 只能用繁體和簡體Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-16607461.post-79223071566618496002010-07-05T09:45:10.577+08:002010-07-05T09:45:10.577+08:00是的~是的~布丁布丁吃布丁https://www.blogger.com/profile/13614721642960940190noreply@blogger.comtag:blogger.com,1999:blog-16607461.post-28885571866028425052010-07-05T09:32:45.443+08:002010-07-05T09:32:45.443+08:00布丁大, 我不太懂你的意思? 您的意思是要讓 "to_tsvector" 吃中...布丁大, 我不太懂你的意思? 您的意思是要讓 "to_tsvector" 吃中文, 需要靠PHP嗎??冠生https://www.blogger.com/profile/00892816141805421009noreply@blogger.comtag:blogger.com,1999:blog-16607461.post-9851000533048178112010-07-04T17:26:45.005+08:002010-07-04T17:26:45.005+08:00呵,這就要靠PHP來處理了。
這個部分的細節正是我接下來要講的……
不過近期可能比較沒時間寫,七月...呵,這就要靠PHP來處理了。<br />這個部分的細節正是我接下來要講的……<br /><br />不過近期可能比較沒時間寫,七月中之後吧QQ布丁布丁吃布丁https://www.blogger.com/profile/13614721642960940190noreply@blogger.comtag:blogger.com,1999:blog-16607461.post-89646938412465894402010-07-04T02:39:19.596+08:002010-07-04T02:39:19.596+08:00感謝您快速的回答~
其實我比較感興趣的是如何把中文parser跟Dictionary整合到postg...感謝您快速的回答~<br />其實我比較感興趣的是如何把中文parser跟Dictionary整合到postgres裡面,因為您在文章中一開始就介紹postgres。 請問有方法讓to_tsvector像您文章中提到的可以解析中文嘛? <br /><br><br />SCWS的安裝方法好像純粹是就是把它裝入Linux系統,然後可以讓PHP在網頁調用,好像沒有提到如何加入postgres裡面....???<br /><br>冠生https://www.blogger.com/profile/00892816141805421009noreply@blogger.comtag:blogger.com,1999:blog-16607461.post-58488967832617300332010-07-02T19:49:36.753+08:002010-07-02T19:49:36.753+08:00因為我可能還要一段時間才會回來繼續補完這篇(遮臉)
SCWS的安裝方法可以先看這個網頁XD
http...因為我可能還要一段時間才會回來繼續補完這篇(遮臉)<br />SCWS的安裝方法可以先看這個網頁XD<br />http://www.ftphp.com/scws/docs.php#instscws<br /><br />中文全文檢索會使用到中文字典,其實分詞或斷詞的原理,主要還是依賴字典的豐富程度。字典越完整,斷詞也就越準確。<br /><br />字典檔通常是要錢的,或是各家的機密!<br />不過SCWS倒是供人直接下載就是<br /><br />請看XDB 词典文件<br />http://www.ftphp.com/scws/download.php布丁布丁吃布丁https://www.blogger.com/profile/13614721642960940190noreply@blogger.comtag:blogger.com,1999:blog-16607461.post-38482538611823794552010-07-02T16:52:33.371+08:002010-07-02T16:52:33.371+08:00有一點觀念方面我一直搞不太清楚, 希望大大可以幫我解答. 就是"中文分詞系統"指...有一點觀念方面我一直搞不太清楚, 希望大大可以幫我解答. 就是"中文分詞系統"指的應該是"中文parser"吧? 那中文字典(Dictionary)呢? 做中文全文檢索, 會需要中文字典嗎? 又中文字典如何獲得呢??冠生https://www.blogger.com/profile/00892816141805421009noreply@blogger.comtag:blogger.com,1999:blog-16607461.post-9270121657346246582010-07-02T16:50:12.908+08:002010-07-02T16:50:12.908+08:00真是太棒了! 正好最近會用到!!! 真想趕快看到SCWS的安裝方法!!!真是太棒了! 正好最近會用到!!! 真想趕快看到SCWS的安裝方法!!!冠生https://www.blogger.com/profile/00892816141805421009noreply@blogger.com