文獻成長的機理分析
文獻成長的機理分析
孫潔,情報學報,第15卷第4期,1996年8月
該文對於幾種主要的文獻成長模型進行評估,利用層次分析法對文獻成長機理進行了分析,並以此建立了中國大陸文獻出版量的多元線性迴歸模型,從而從質化與量化上驗證了影響中國大陸文獻成長的最重要的四個因素:科技人員人數、社會購買力、出版社數量和社會總產值。
1 文獻成長模型的評介
近十年來,文獻成長現象進行的研究主要分成方法論的探索與應用兩個方向。在描述文獻成長現象中,主要有六種模型:(1)普賴斯文獻指數成長理論模型;(2)文獻邏輯曲線成長模型;(3)線性成長模型;(4)雷歇(Rescher)分級滑動指數模型;(5)超越函數模型;(6)舍─布成長模型。而這幾種模型本身存在一定的限制。文獻指數成長模型能反映過去歷史年代科學文獻的成長情形,但是不能預測未來成長趨勢。文獻邏輯曲線成長的理論可用於描述以往的文獻成長,也可用於預測文獻的未來成長,但是存在著「發散性」的缺陷,即隨著年代的成長,當科學發展到一定階段時,文獻成長率為零,這是不符合實際情況的。上述兩種曲線都是在大量統計基礎上得出的,尚未全面考慮到其他因素的影響。作者認為只有利用系統論的觀點,對於科學文獻成長做系統上的分析,弄清楚文獻成長的基本過程、機理和趨勢。線性成長模型適用於某些領域跟類型;雷歇分級滑動模型考慮文獻質量因素來研發規律,但卻很難具體驗證其正確性;超越函數模型只是一種專門研究期刊論數量成長的假設性理論模型;舍─布成長模型包括多種模型,但不夠全面。
2 文獻成長的機理分析
根據文獻探討,(1) 科學文獻成長是由社會的需求和一個國家發展科學文化事業的方針政策決定的;(2) 科學文獻數量成長的規律同時受到科學自身固有的發展規律和科學所處的環境條件(包括政治、經濟、文化、教育等社會條件)這兩種主要因素的制約。另一篇文獻也提出建立非時序的文獻成長模型的必要性。
層次分析法
經過分析,影響文獻成長的主要因素有「社會文獻供給」和「社會文現需求」兩個方面。而「科技人員數量」、「社會購買力」、「出版社數量」以及「社會總產值」又是影響社會文獻供給和需求的主要因素。所以,文獻成長系統的遞階層次模型可表示為圖1。
圖1 文獻成長系統遞階層次模型
作者對各成影響因素進行兩兩比較,建立了一系列的判斷矩陣,並求出他們各自的最大特徵跟相映的特徵向量,再進行一致性檢驗。最終結果可以得出在影響文獻成長的因素中,科技人員人數對文獻出版量影響最大,其次是社會購買力、出版社數量和社會總產值。
3 我國文獻出版量預測分析
作者將中國大陸1980到1989年間文獻出版量與科技人員人數、出版社數量、國民收入、社會總產值等四個因素用統計方法建立多元回歸模型,以四個因素為自變量、文獻出版量為因變量,經過一連串的計算之後,最後得到的預測模型為:
Y = -18430.8 + 64.103x1 + 53.955x2 - 8.317x3 + 3.288x4
其中,Y為文獻出版量,x1代表科技人員人數,x2代表出版社數量,x3代表國民收入,x4代表社會總產值。
接著作者計算偏相關系數來判斷四個變量與文獻出版量的影響程度,結果可以發現:科技人員人數影響最大,其次是國民收入、社會總產值和出版社數量。
4 結論
- 本文先利用層次分析法分析影響文獻成長的各種因素,然後建立非累積數量的多元線性迴歸模型,不但如實反映科學技術事業的發展狀況,也能夠比較清楚地反映經濟發展、科技發展以及政治形勢的變化對他們的影響程度。
- 作者分析層次分析法與多元回歸模型的結果,在影響文獻成長中諸多因素的相對重要性上,兩者結果基本上是吻合的。其次,本文只選取多種因素中最重要且可量化的影響因素,此外政治的動盪與安定、人口素質等影響難以取得量化指標而不列入討論,在某種程度上影響了模型的精準度。
- 根據上述模型,作者取1990年的數據進行預測並與實際數值比較,誤差率為1.2%。可知該模型能達到較理想的預測效果。
感想
一開始作者分析了六種文獻成長模型的特徵及適用場合,只是還是沒有辦法當作文獻成長模型入門來閱讀。老師抱歉,儘管選了好幾篇,看來這次我又挑錯文章了。
該篇論文使用的兩個重要的方法:層級分析法與多元回歸模型,都時常聽過,但是每次看到的時候都還是一片茫然。其中,作者在進行層級分析法的時候,以相對重要比例給予向量,但是並沒有詳細說明相對重要比例的定義過程,這我覺得比較不足的地方。
這篇論文讓我看到了文獻成長預測模型的建立方式,以理論為基礎,在從量化的數值來建構出模型。至於詳細的建構過程解說,不知道未來的課程中會不會教到呢?