在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網 資料文庫 閱覽室共詞與社會網絡探析范文

閱覽室共詞與社會網絡探析范文

本站小編為你精心準備了閱覽室共詞與社會網絡探析參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

閱覽室共詞與社會網絡探析

研究熱點分析

1關鍵詞詞頻統計本文僅對搜集到的1173篇數字圖書館領域的文獻進行統計,共得到3352個關鍵詞。統計的過程中,需要對關鍵詞進行處理:合并library、libraries等類型的同義詞;“digitiallibrary”是一個高頻詞,涉及文獻510篇,但是本文是以數字圖書館為研究內容,并且以“digitiallibrary”作為檢索詞,再選取這個詞做分析意義不是很大,故不對該關鍵詞進行分析;另外,諸如印度、臺灣、中國等表示地域類型的關鍵詞也不做具體分析。經過處理后,本文選擇詞頻不少于10次的48個關鍵詞作為因子分析和聚類分析的基礎,統計情況如表1所示。由表1可知,對數字圖書館的研究主要集中在信息檢索、網絡、學術圖書館、虛擬圖書館、數據庫、用戶研究、元數據、檔案管理、語義等方面;同時注重數字存儲、信息技術、館藏管理、本體等方面的研究;有些研究涉及到了教育、組合化學、通信技術等領域。2.2因子分析本文為了初步確定提取公共因子的個數,采用了因子分析法進行試驗。將48×48的關鍵詞共詞矩陣導入SPSS20.0中,并轉化為Spearman相關矩陣,在該相關矩陣的基礎上采用主成分、相關性矩陣、最大方差法進行因子分析,結果如表2所示。

由表2可見,48個關鍵詞中有9個公共因子提取,他們能夠解釋總信息的91.269%,根據數據挖掘理論,所提取的因子應包括總信息的60%以上,因此表2提取4個及4個以上的公共因子都是合理的。但是由于因子分析對數據的要求較高,檢驗結果顯示不是正定矩陣,KMO值無法計算出來,推測原因可能是由于樣本較小或個別高頻關鍵詞的相關性較小導致的,但是仍然會顯示表2的分析結果。所以本文僅借鑒因子分析提取的公共因子個數,并不采用因子分析的具體降維結果,從而為聚類分析的分類結果提供參考。

3聚類分析本文采用聚類分析法對數字圖書館領域的研究主題進行歸類。聚類分析是研究“物以類聚”的一種方法,基本思想是:首先,將n個樣品看成n類,即一類只包括一個樣品,然后將性質接近的兩類合并為一個新類,這樣得到n-1類,再從n-1類中找到性質最接近的兩類加以合并,變成n-2類,如此類推,直到所有的樣品聚為一類。最后把整個分類系統畫成一張譜系圖,用它來表示所有關鍵詞之間的親疏關系。

3.1關鍵詞預處理。關鍵詞是文獻核心內容的集中概括,能夠較好地反映某一研究領域的主題分布與特點。對關鍵詞進行聚類分析,為了便于統計,這里將原始關鍵詞共詞矩陣轉化為相異矩陣。用Ochiia系數將共詞矩陣轉換成相似矩陣,具體算法為A、B兩詞的Ochiia系數=(A、B兩詞共同出現的次數)÷(A詞出現的頻次×B詞出現的頻次),從而得到相似矩陣。但是相似矩陣中的0值過多,統計時容易造成誤差,為了方便進一步處理,用1與全部相關矩陣上的數據相減,得到關鍵詞相異矩陣,部分數據如表3所示。

3.2聚類分析結果。在SPSS20.0軟件中,導入關鍵詞相異矩陣,采用系統聚類(HierarchicalClus-ter),選擇離差平方和法(WardsMethod)與離散數據類型(Count)中的斐方(Phi-squareMeasure)方法,進行聚類分析。離差平方和采用方差分析的思想,使得類內關鍵詞間離差平方和盡量小,類之間的離差平方和盡量大,從而達到分類的效果。離散數據類型可以設置分類數據之間的距離,Phi方度量消除了Chi方度量中維數的影響。結合因子分析的結果和實際情況,本文提取5個公共因子,描述了總信息的71.283%。最終分類結果如圖1所示。由圖1可見,本文將48個關鍵詞分為5大類別,即國際數字圖書館領域研究熱點主要集中在5大主題:數字圖書館虛擬技術研究、資源組織研究、資源建設研究、電子資源及版權研究和信息服務研究。

a.數字圖書館虛擬技術研究。主要包括虛擬圖書館、組合化學、虛擬篩選、對接、定量構效關系、人機交互。虛擬化就是把物理資源轉變為邏輯上可以管理的資源,以打破物理結構之間的壁壘,資源的管理都按邏輯方式進行,完全實現資源的自動化分配,虛擬化技術在數字圖書館中的主要作用是進行服務器整合,也即將操作系統及應用從多個未得到充分利用的硬件平臺重新部署到單臺服務器上,進而節約空間成本、管理成本以及電源和散熱成本。

b.數字圖書館資源組織研究。主要包括語義、本體、元數據、XML、研究、索引、多媒體。信息資源組織即信息資源的有序化的活動:利用一定科學規則和方法,通過對信息外在特征和內容特征的描述和序化,實現無序信息流向有序信息流的轉換,從而保證用戶對信息的有效獲取和利用及信息的有效流通和組合。數字圖書館是下一代因特網上具有高度組織的超大規模資源庫群,它內涵了信息資源的生命全過程,包括生產、加工、存儲、檢索、傳遞、保護、利用、歸檔、剔除等,數字圖書館資源組織的關鍵是將信息資源在知識單元而非文獻單元的層次上組織起來,從而提供有利于產生新知識的資源、工具及合作環境。

c.數字圖書館資源建設研究。主要包括檔案存儲、數據、信息系統、數據挖掘、推薦、開源系統等關鍵詞。數字圖書館資源建設是數字圖書館重要的基礎建設,研究主要包括構建數據庫、數字資源整合與開發、數字資源共享等內容。建設數字圖書館要按照整體性、特色化、用戶至上、科學性、系統性的原則,采取科學有效的方法和手段對各種信息資源進行篩選和整理、進行深層次的開發和整合。數字圖書館要進行合理科學的資源建設,才能更好的為用戶提供服務。

d.數字圖書館電子資源及版權研究。主要包括電子期刊、電子圖書、電子出版、版權。電子資源是數字圖書館資源組成的重要部分,海量的電子資源的使用也涉及到了版權問題。互聯網時代版權問題的最大挑戰,進一步加強版權保護的技術性措施,采用防拷貝技術、訪問控制、內容保護、流媒體格式、數字水印以及DRM技術,保護數字化信息資源版權。

e.數字圖書館信息服務研究。主要包括網絡、信息服務、用戶研究、教育、信息檢索等關鍵詞。數字圖書館結合了先進的信息技術、網絡技術,使得服務內容不斷擴展,主要包括信息檢索服務、參考咨詢服務、個性化推送服務、信息定制服務等等。在信息服務研究中,個性化信息服務成為研究的重點,個性化信息服務是指能夠滿足用戶個體需求的一種服務,即根據用戶提出的明確要求提供服務,或通過對用戶個性、使用習慣的分析而主動地向用戶提供其可能需要的服務。

作者團體分析

根據統計,數字圖書館領域研究文獻涉及作者3398位(不考慮同名異人的情況)。根據普萊斯對洛特卡定律的一個重要推論:杰出科學家中最低產作者所發表的論文數量,等于最高產科學家數的平方根的0.749倍。在本次研究中最高產科學家數為10,則杰出科學家中最低產的那位科學家所發表的論文數應為2.37篇,取整數為3篇。也即發文3篇及3篇以上的作者為數字圖書館領域的核心作者,經過統計共得到114位核心作者。根據聚類分析的結果,將數字圖書館領域的核心作者與5大研究主題進行共現,刪除與5個主題都沒關系的作者,得到共現矩陣。用UCINET對該共現矩陣進行可視化,如圖2所示。

由圖2可見,5大主題涉及的作者團體非常清晰。數字圖書館信息服務研究這個研究主題的作者相對來說比較多,團體比較大,聯系比較緊密,主要作者包括Adams,A、Jin,Y、Thomas,R、Ray,K等作者。數字圖書館資源建設研究主題的作者團體僅次于信息服務,主要包括Hey,J、Gow,J、Porcel,C、Chowdhury,GG等作者。數字圖書館虛擬技術研究和電子資源及版權研究這兩個主題的作者團體相對來說較小,但是也還有一些核心作者在研究,證明了這兩個研究主題在數字圖書館領域的重要性。不難發現,該網絡圖的連通性較好,有些作者同時研究兩個或兩個以上的主題,這些作者成為網絡圖中的關鍵節點,有利于各個研究主題之間的學術交流。比如Jamali,HR、Lee,JY等作者同時研究資源建設和信息服務,Bainbridge,D、Witten,IH等同時在研究資源組織和信息服務,Spink,S、Chwn,CC等作者同時研究三個領域。

根據社會網絡的基礎理論,中心性分析相關概念解釋如下:各個研究主題的度數中心度也即該主題包含的作者數除以總的作者數;研究主題的接近中心度即該主題所包含的作者到其他作者和研究主題的最短距離的一個函數;研究主題的中間中心度即當主題的每對作者在研究主題中相遇時,該研究主題才獲得中間中心度。利用UCINET分析圖2中5大研究主題的度數中心度、接近中心度和中間中心度,結果如表4所示。由表4可見,數字圖書館信息服務研究的度數中心度、接近中心度和中間中心度都是最高的,資源建設研究僅次于信息服務研究。數字圖書館電子資源及版權研究度數中心度、接近中心度和中間中心度都是最低的,相對其他主題,該主題處于數字圖書館研究的邊緣位置。隨著計算機技術的發展,數字圖書館的研究已逐漸向技術和服務方面滲透。

結束語

本文對數字圖書館領域相關文獻的關鍵詞進行了因子分析和聚類分析,其中因子分析的要求條件較高,一些弱相關的高頻關鍵詞會影響因子分析的檢驗結果,在對高頻關鍵詞分類的過程中會遇到有些關鍵詞同時屬于兩個或者更多的類,導致無法明確分類結果。因此本文僅用因子分析初步確定了提取的公共因子個數,然后借助聚類分析進行具體分類,聚類分析可以清晰地看到各個關鍵詞之間的親疏關系,其分類結果更明確。結合因子分析和聚類分析的結果,本文歸納出2000年以來國際數字圖書館領域的5大研究主題:數字圖書館虛擬技術研究、數字圖書館資源組織研究、數字圖書館資源建設研究、數字圖書館電子資源及版權研究和數字圖書館信息服務。

同時本文對研究主題和作者共現矩陣進行可視化,指出了信息服務研究和資源建設研究涉及的文獻最多,它們成為近些年數字圖書館研究的熱點問題。數字圖書館資源建設是數字圖書館的重要任務,它廣泛的應用數據挖掘、推薦、數據庫等技術,為用戶服務提供資源保障。數字圖書館信息服務研究是資源建設的目的,信息服務、信息檢索、信息技術、用戶研究等成為信息服務研究的重點,其中個性化信息服務也對資源建設提出了更高的要求。同時指出各個研究主題內的作者團體:a.以Wei,J、Langer,T、Frecer,V等為代表的虛擬技術研究相關的作者團體;b.以Lim,EP、Bertino,E、Teng,YL等為代表的資源組織研究相關的作者團體;c.以Hey,J、Gow,J、Porcel,C、Chowdhury,GG等為代表的資源建設研究相關的作者團體;d.以Watkinson,A、Nicholas,D、Huntington,P等為代表的電子資源及版權研究相關的作者團體;e.以Adams,A、Jin,Y、Thomas,R、Ray,K等為代表的信息服務研究相關的作者團體。各個團體之間相互合作,資源建設、資源組織、信息服務相關文獻較多,作者團體較大,彼此之間的合作也多;電子資源與版權研究、虛擬技術相關文獻較少,作者團體較小,與其它主題合作的也少。總之,數字圖書館作者研究團體已經形成,相對來說,熱點問題的作者研究團體較大。各個作者團體的科研產出和科研合作績效評價情況還有待進一步研究。

作者:皇甫青紅華薇娜劉艷華殷之明單位:南京大學信息管理學院集美大學圖書館

精品推薦
主站蜘蛛池模板: 成年男女免费视频网站 | 国产欧美日韩综合 | 亚洲黄色激情 | 国产成人综合久久精品亚洲 | 夜色视频网 | 亚洲一区二区精品推荐 | 欧美性精品hd在线观看 | 亭亭五月天激情 | 五月一区二区久久综合天堂 | 羞羞视频免费网站 | 亚洲毛片免费视频 | 四虎午夜影院 | 在线精品一区二区三区电影 | 在线免费视频网站 | 五月天婷婷缴情五月免费观看 | 日韩欧美一区二区三区四区 | 亚洲成人免费 | 亚洲久草视频 | 色婷婷综合激情 | 日日网 | 男人的天堂中文字幕 | 国产精品久久久久久一区二区 | 羞羞视频入口网站 | 亚洲精品98久久久久久中文字幕 | 免费黄色国产视频 | 自拍偷拍视频网 | 男人天堂999 | 黄网国产| 亚洲国产精品人人做人人爽 | 亚洲午夜精品一区二区 | 亚洲视频在线播放 | 中文字幕无线精品乱码一区 | 东方亚洲东方欧美色二区 | www.五月婷| 在线视频国产网址你懂的在线视频 | 国产精品久久久久久 | 日韩精品专区 | 亚洲国产系列久久精品99人人 | 久久66久这里精品99 | 蜜桃视频黄色 | 久久婷婷五月综合色丁香 |