本站小編為你精心準備了國內外機構知識庫建設研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《情報理論與實踐雜志》2015年第九期
機構知識庫(InstitutionalRepositories,IR)是利用網絡及相關技術,依附于特定機構而建立的數字化學術數據庫,它收集、整理并長期保存該機構及其社區成員產生的學術成果,并將這些數據進行規范化處理、分類,在遵守相應的開放標準和互操作協議下,允許機構以及其社區內外的成員通過互聯網免費獲取使用[1]。對于成立機構來說,機構知識庫不僅使成立機構對智力成果的管理能力增強,而且能夠使學術成果得到展示和保存,提升機構的影響力和學術地位。另外,它充分顯示了規模經濟的作用,即機構知識庫對信息的整合有利于知識的產生,對機構數字成果的收集和保存可保障學術界對其知識的長期獲取,平衡機構內的知識資本。目前國內外對機構知識庫都進行了大量的研究,但國內對于知識庫的研究主要集中在微觀層面,大部分只針對國內知識庫的某一方面進行論述,如管理服務、政策、模型等,或者只分析國外機構知識庫的發展狀況,而通過對國外機構知識庫現狀進行分析,借鑒國外成熟機構知識庫的經驗,來分析我國機構知識庫的發展這方面的研究卻不多。2010年,萬文娟等主要從機構知識庫的資源數量、類型、學科分布的差異來分析其異同,并提出相應措施[2];肖希明通過國外幾個成功范例,指出我國機構知識庫存在的問題,并提出針對性措施[3]。2011年,趙莉娜通過對ROAR統計數據,介紹了國外基本情況,重點分析了我國的建設現狀并提出建議[4];喬歡比較綜述了國內外機構知識庫內容建設的相關研究[5]。本文通過OpenDOAR、ROAR、CybermetricsLab的機構知識庫排名以及國內外相關機構知識庫網站的調查統計,從不同角度分析當前世界范圍內機構知識庫的建設現狀以及英、美、日等國家機構知識庫建設的特色,并針對目前我國機構知識庫建設的問題及不足,提出相應的建議。
1世界機構知識庫發展現狀
IR是20世紀90年代末隨著開放存取的興起而出現的一種學術交流與資源共享的新模式。2002年,Dspace系統問世,世界范圍內出現了大規模機構知識庫的建設,并且很多國家已經取得了顯著成效。截至2007年3月,OpenDOAR上收錄的機構知識庫僅有853個[6];截至2010年8月30日,OpenDOAR就收錄機構知識庫1714個,ROAR收錄機構知識庫1625個[2];而截至2014年11月1日,OpenDOAR收錄機構知識庫2728個[7],ROAR收錄機構知識庫3216個[8]。由此可見,近十多年來全球范圍內機構知識庫發展迅速。根據ROAR統計數據,圖1顯示了機構知識庫各大洲分布情況及集中分布地區。在世界知識庫的分布中,歐洲的機構知識庫數量所占比例最大,其次是北美洲,亞洲居于第三。通過進一步分析發現,在這些所占比重較大的大洲中,其知識庫分布的國家也是比較集中的。如北美洲83%的機構知識庫集中于美國;歐洲雖然國家數量較多,但是由圖1發現,17%的機構知識庫來自于英國,德國占14%,西班牙占11%,其他國家所占比例較少;日本領先于亞洲其他國家和地區,占25%;中國的大陸以及臺灣,還有印度的機構知識庫的數量在亞洲也占有一定的比例。根據ROAR結合西班牙CybermetricsLab的RankingWebofRepositories按照規模、能見度、豐富性和學術性把世界機構知識庫進行的排序[9],本文選取了綜合排名前200位中所占數量最多的機構知識庫進行統計。由表1和圖1可知,英國、美國、德國和西班牙不僅僅在數量上領先于其他國家,在機構知識庫建設的質量上也處于領先地位。然而,數量上排名居于前10位的國家和地區中,中國大陸、印度和波蘭沒有排名前200位的機構知識庫,可見這些國家和地區的機構知識庫建設質量有待提升。同時,這也反映了世界機構知識庫不僅在數量的分布上比較集中,而且在建設質量上發展也不平衡。所以出現了這樣一種局面,即一些國家和地區的機構知識庫無論從數量上還是發展水平上都處于領先地位,而另一些國家和地區的機構知識庫數量極少,或者數量雖然可觀,但是發展水平較低,不能有效發揮機構知識庫的作用。由于歐洲、美洲的一些國家機構知識庫建設起步較早,有較成熟的建設體系及經驗,所以在發展數量和發展程度上要領先于其他地區。世界機構知識庫分布過于集中以及發展不平衡的現狀,不利于世界范圍內的開放存取,甚至有可能進一步拉大地區間的差距。然而機構知識庫發展相對落后的國家,可以通過這些集中且成熟的機構知識庫,進行國內外機構知識庫的發展狀況的研究,分析先進國家機構知識庫發展特色,借鑒其發展經驗,如美國、英國和日本等,進而建設和完善符合本國國情的機構知識庫。
1.1世界機構知識庫軟件應用情況隨著機構知識庫在各個國家的發展,機構知識庫長期發展的技術保障也在迅速發展,比如開發的應用軟件種類在迅速增長。選擇較成熟、友好、個性化的系統軟件是機構知識庫建設不可或缺的重要因素,它的界面是否友好,用戶使用是否方便等都決定著機構知識庫是否能被大眾所接受[10]。機構知識庫所用的開發軟件主要可分為開源軟件、自行研發軟件和商業軟件3種。由于開源軟件具有免費使用和授權操作簡單的優勢,只要機構知識庫顯著位置標注使用軟件標徽,并加上網站所有者鏈接就可以供單位和個人使用,所以全球機構知識庫多選此類軟件[11]。OpenDOAR所統計的軟件共有150多種,ROAR主要統計了30多種開源軟件,下面分別列出這兩個網站所統計的應用最廣泛的前10位軟件。由表2可知,雖然OpenDOAR和ROAR的統計具有一定的差異性,但可以看出當前世界機構知識庫應用最廣泛的開源碼軟件是Dspace、Eprints和Bepress,并且它們的使用率之和超過70%。與2010年軟件總數50多種相比,機構知識庫的應用軟件數量增長迅速,這與各國各地區為滿足自身的需要而開發軟件的實際情況密不可分。這些軟件無論在設計原則上還是應用目標上,都各具特色,為不同機構知識庫的建設提供了更多可選擇的技術平臺。另外,在OpenDOAR統計的150多種應用軟件中有很多軟件只有一個或少數機構知識庫使用,反映了目前各機構獨自開發的知識庫軟件正在興起。例如,在按門戶網站排名世界機構知識庫的名單中位居第一的法國HAL-INRIA(INRIAaCCSDElec-tronicArchiveServer)[12]使用了HAL軟件,此機構知識庫主要針對計算機科學方面的研究,除了具有精致的界面和英法文閱讀,提供基本檢索和高級檢索以外,還具有RSS、新沉積報警、數據統計顯示和歸類的出版名單的功能。HAL軟件共有28個機構知識庫使用,是法國開發的一款獨具特色的軟件,目前英國的機構知識庫也有此軟件的應用;另外,位居第三的美國SAO/NASA天體物理學數據系統(ADS)所使用是單獨開發的HS-DVL軟件[13],此軟件的開發主要針對天文學和物理學方面的研究人員,并且ADS是唯一使用此軟件的系統,它包含天體物理學、物理學和arXiv電子出版物三方面數據1110萬條記錄。
1.2世界機構知識庫建設和服務模型機構知識庫的建設是推進知識服務的基礎之一,其建設和服務模型能保障將有效的資源進行整合,并提供優良的知識化服務,使每個機構知識庫獨具機構特色和學術特色。筆者根據國外機構知識庫建設比較成熟國家的案例,如美國、日本等,對機構知識庫的構建及服務模型進行了總結,發現機構知識庫的系統結構總體分為3層:采集層、處理層和服務層,雖然基本框架大同小異,但是在每個機構知識庫的構建過程中,框架內容卻獨具特色(如圖2所示)。第一層,采集層,主要采集內容數據和有關元數據,注重數據的來源和種類。從數據來源看,以美國加州大學的eScholarship為例[14],它在采集層的主要特色是有著格的作者提交系統并且收集除作者提交以外的其他內容來源。首先,作者通過提交系統或者規定的開放期刊系統(OJS)提交自己的內容,然后進行內容評審,此過程是以管理員審核或者同行評審的形式進行的,最終審核通過或刊載的內容就會在機構知識庫保存并發表。其次,對于很多機構知識庫來說,內容的主要來源是機構作者提交,eScholarship還有其他內容來源———開放獲取出版社(Bi-oMedCentral)和電子學位論文服務(UCETDs)的數據,這些都保證了數據來源的質量和數量。此外,從采集數據種類上看,除了eScholarship等大多數存儲相關學術論文之外,哈佛大學的DASH(DigitalAccesstoScholarshipatHarvard)[15]和北得克薩斯州大學(UNT)[16]的電子圖書館,鼓勵存儲與手稿相關的資料,包括數據、圖片、聲視頻文件等,提供了更多灰色數據和隱性數據,擴大了科學數據范圍,滿足了科研用戶更高層次的需求。第二層,處理層,主要涉及數據處理及存儲的過程。采集數據后,為方便存取,要對數據進行相應的處理轉化,形成統一格式,如文本提取、文字識別、建立索引、生成圖像等,然后通過門戶網站為用戶提供便利服務。筆者通過調查一些國外機構知識庫發現,很多機構知識庫由于遵循了OAI-PMH協議,被專業搜索引擎所收錄,擴展了資源檢索途徑。在這方面日本做得比較突出:大阪大學[17]機構知識庫的主頁提供了Jairo(JapaneseInstitutionalRepositoryOnline)和Oaister站外搜索;北海道大學[18]則提供了更多的站外檢索:谷歌/谷歌學術搜索、CiNii、JAIR、Worldcat、NDLTD;長崎大學[19]的站外檢索有Scir-us、Oaister、CiNii。相反,通過這些站外檢索也可以檢索到本機構知識庫的資源,這樣一方面為用戶檢索提供了方便,另一方面也提高了機構知識庫的知名度。eScholarship還把數據存儲于加利福尼亞電子圖書館(CDL)數據保存庫,保證了數據更大限度的開放獲取,實現真正的利用價值。第三層,服務層,包括基本服務、擴展服務、知識服務和增值服務。基本服務包括對數字資源的內容組織、長期保存、信息瀏覽和檢索以及對互操作協議的支持;擴展服務指機構知識庫要滿足學術交流、科研輔導、教育服務的需求;知識服務指個性化服務和嵌入式服務;增值服務指知識發現服務和分析評價服務。對于目前大部分機構知識庫來說,都做到了基本服務和擴展服務,部分機構知識庫的個性化服務以及知識發現服務也逐步完善。其中嵌入式服務是一種以用戶為中心的全新服務理念,要求機構知識庫通過多種方式融入到成員的信息環境,與學科服務結合,使學科服務一同嵌入到成員的教學科研環境中[20]。例如,美國NASA(TechnicalReportsServer)以及明尼蘇達大學的電子數據庫(UMDC)、加州大學的eScholarship,提供了Facebook、Twitter和YouTube等社交網絡平臺的鏈接,加強了用戶知識交流和互動的支持,擴展了用戶信息交流空間,促使隱性知識的激活。分析評價服務是從不同的維度,如范圍、類型、時間等,根據知識庫內資源利用情況,開展科學的同行評議和學術影響價值分析,并通過可視化的形式展示分析評價結果,以滿足科研工作者的需要[21]。目前大部分的世界知識庫門戶網站都提供本月下載量排行榜、總下載量、最新上傳等基本統計數據,有的還展示作者詳細資料、提供引用鏈接服務、發展引用分析服務等。
1.3國外機構知識庫相關政策制定情況在開放存取知識庫目錄OpenDOAR中,將機構知識庫的政策分為元數據復用政策、數據復用政策、內容政策、提交政策和保存政策,并且對各機構知識庫的政策制定情況進行了不完全統計。截至2014年11月的數據,2728個注冊成功的機構知識庫中,對世界范圍、英國、美國及中國的相關政策制定情況進行統計(如表3所示)。由表3可知,相對于近年來機構知識庫數量的突飛猛漲,世界范圍內機構知識庫政策的制定比例并不高,可見大部分國家對此并沒有充分重視。美國知識庫政策制定比例整體來看僅稍高于世界平均水平,但通過調查其中很多知識庫的政策都很具代表性。例如,康奈爾大學的E-Commons@Cornell制定的內容政策中明確規定了存儲內容的類型、格式、大小和所有權4個方面,其中保存政策包含了提交方式、提交者的定義、數據質量以及版權問題[21];而劍橋大學的Despace@Cambridge對內容政策中重點提出對內容質量的要求,還有單獨的提交政策,對提交過程及提交人所涉及的版權問題均作出了明確規定[22]。此外,還有些知識庫涉及使用政策、隱私政策、撤回政策等的規定。相比之下,英國表現尤為突出,遠遠超出了世界平均水平。據OpenDOAR統計,英國機構知識庫數量為228,大部分是由資助機構贊助和大學組成的非盈利性質的機構知識庫,其中制定元數據復用政策的機構知識庫中有70家是非盈利性質的,約占31%,22家是盈利性質的,約占10%;制定數據復用政策的機構知識庫有44家是非盈利性質的,約占20%,僅1家是盈利性質的,約為0;另外有111家制定了提交政策,約占50%;59家制定了保存政策,占26%。這些數據反映了英國機構知識庫政策在機構層面的建設比較突出,也顯示出資助機構和大學對政策制定的重視。通過利用制定的政策采取有效措施,充分發揮了機構知識庫學術交流的作用,這也是英國在機構知識庫政策方面呈現積極態度的主要原因。
2我國機構知識庫建設存在的問題及建議
2.1我國機構知識庫建設存在的問題1)我國機構知識庫目前在數量上雖然發展迅速,但是建設程度差別較大,失衡問題嚴重。大陸機構知識庫整體建設水平不高,影響力遠遠不及英美日等發達國家。但是,相對而言,我國的臺灣及香港地區的機構知識庫建設水平還是相當高的,不僅數量多,而且質量高,影響力較大。根據西班牙CybermetricsLab的RankingWebofReposi-tories顯示,香港大學的機構知識庫排名第54位,相比2010年的統計數據[9],是我國機構知識庫綜合發展最快的。另外,在世界排名前500的機構知識庫中,我國臺灣地區有7個,臺灣大學排名第109位,成功大學排名176位,政治大學排名195位,是我國機構知識庫綜合質量最高的地區,而大陸排名第一的廈門大學世界排名第700位。可見臺灣和香港地區的機構知識庫建設無論在數量規模還是在宣傳推廣和技術保障上都取得了顯著的成績,相比而言,大陸的機構知識庫雖然在數量上增長較快,但是僅處于建設的初級階段,沒有完備的體系、政策支撐,建設水平亟待提升。2)我國機構知識庫使用的軟件平臺種類及功能單一,且本地化程度低。軟件平臺的類型決定機構知識庫存儲對象的種類、存儲對象的互動性、安全性以及提供服務的多種能力等[23]。目前世界機構知識庫建設所使用的軟件主要分為兩大類:一是使用專用機構知識庫建設軟件(開源軟件和商業軟件);另一種是自行開發專用軟件用于特定或小范圍的機構知識庫開發建設。由于我國機構知識庫建設起步晚,技術力量薄弱,通過OpenDOAR統計,除了奇跡文庫的自開發軟件、香港中文大學使用的Drupal、嶺南大學使用的DigitalCommons、臺灣中央大學使用的ETD-db,以及中國科學院在Dspace的基礎上根據自身要求進行深度開發了CSpace系統以外,主要使用的是開源軟件Dspace,而且大多直接采用Dspace默認設置(浙江大學等),或只是簡單對Dspace進行本地化(廈門大學),致使我國機構知識庫軟件平臺功能顯得十分單一,缺乏個性化。3)在國外知識庫機構的建設向服務縱深型模式發展的背景下,我國機構知識庫服務模式存在很大問題,主要有:①提供的服務資源類型有限,不能滿足科研工作者研究和創新性學習的需要。大部分的機構知識庫收藏的資源類型主要是期刊論文、會議論文和學位論文等,圖像、多媒體等復合數字資源則收集的較少。例如,中國科學院力學研究所機構知識庫雖然有演示報告(視頻)、圖像集、網頁、軟件等內容類型,但是內容數量較少,且發表時間間隔長,如圖像類型資源2000年發表5項,到2013年一直為空白期,剩余內容發表日期均為2014年,同時又反映了該知識庫開始重視此類數據的收藏。②服務功能有限,大部分機構知識庫以基本服務功能為主,雖然提供個性化推送服務但是過于簡單,沒有對用戶的需求進行更深入挖掘。信息交流空間缺乏,充其量只是一個數據庫,科研用戶之間不能像外國一些知識庫一樣通過如社交網絡平臺、討論組等形式進行有效的學術交流。4)缺乏有力的政策支持仍然是我國機構知識庫建設發展的瓶頸問題。2005年6月,在北京召開的“科學信息開放存取戰略與政策國際研討會”[24],表明了我國對開放存取政策的相關研究是非常重視的。但是2010年10月,在北京舉辦的“第八屆開放存取柏林國際會議”上,中國科學院機構知識庫負責人指出機構知識庫建設過程中政策支持仍為最大缺陷,并且此問題至今仍未解決。據OpenDOAR統計,目前我國的機構知識庫政策與相關發達國家相比顯得較為滯后,且實施力度不大。由于各種政策的出臺是漫長的,加之我國機構知識庫發展起步較晚,我國在宏觀政策的制定上顯得較為滯后。機構知識庫研究者能夠直接參與的政策僅僅是機構層面,研究相關政策制定的熱度很高,但實際應用很少。我國雖然在微觀政策上的建設方面有所發展,但是相當數量的機構知識庫管理者在確定了政策基本框架后卻沒有及時進行具體政策規定的補充,鑒于國內外機構知識庫政策建設現狀,我國很有必要進一步建設與完善適合機構知識庫長期發展的政策體系。
2.2我國機構知識庫發展建議機構知識庫的建設是一項系統工程,要保證其健康持續發展,需要從改變對機構知識庫的認識,完善相關機制,革新技術,加強服務功能的完善等多層面出發。筆者認為在機構知識庫建設的過程中,宣傳工作是前提,政策體系是保障,技術革新是動力,服務完善是目的。針對我國機構知識庫目前存在的問題,筆者提出了以下幾方面的建議:①堅持基本原則———開放存取,擴大開放存取的宣傳工作,加強宣傳和推廣,鼓勵廣大科研人員及相關用戶積極投稿和使用,使開放存取理念深入人心,充分發揮機構知識庫的作用。②結合我國國情及機構知識庫自身特點,借鑒機構知識庫政策體系比較完善發達的國家的經驗,如英國、美國等,制定適合我國機構知識庫長期發展的完整政策體系。③自主開發軟件與使用國外比較成熟的軟件相結合,一方面根據我國目前機構知識庫建設狀況,開發適用于我國機構知識庫的軟件;另一方面在利用國外成熟機構知識庫軟件的同時,要從信息交換、Web界面和索引等方面加強軟件系統的漢化水平,使之符合中文用戶需求,解決本地化應用問題。④立足“服務”理念,以用戶為中心,完善資源存儲類型,完善服務功能,除了使機構知識庫具備一般檢索、瀏覽以及個性化推送功能以外,還應具備引用鏈接服務、嵌入式服務、學術交流服務等功能。
3結束語
在機構知識庫備受關注的今天,我國機構知識庫雖然在數量上增長迅速,但是機構知識庫的建設完善程度及使用效果層面上來講卻僅僅處于初級階段。縱觀國內外機構知識庫建設情況,我們應該在建設機構知識庫中不斷總結經驗,并借鑒國外機構知識庫建設的成功之處,從多個層面出發,建設有中國特色的機構知識庫,使其真正成為科研和學術交流的有效平臺。
作者:陳美華 劉文云 劉昊 王靜雅 單位:山東理工大學 科技信息研究所