本站小編為你精心準備了數據挖掘在圖書館服務中的應用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:
高校圖書館服務的進一步發展需要更多信息的支持。數據挖掘技術作為一種信息分析的輔助技術可以應用到高校圖書館服務中。數據挖掘利用聚類分析、關聯性分析等手段,可幫助高校圖書館對客戶進行分類,發現各類客戶的特征,采購客戶需要的資源并開展有針對性的服務。高校圖書館應用數據挖掘在經濟、技術和運行方面都是可行的。
關鍵詞:
高校圖書館;數據挖掘;聚類分析;關聯性分析;個性化服務
1高校圖書館服務對數據挖掘的需求
隨著高校圖書館越來越多地參與到教學與科研過程中,其服務水平也需要有相應提高。當前高校圖書館追求以客戶需求驅動圖書館服務,使用戶的滿意度提高,從而以最低成本實現對教學、科研最有效的支持[1]。以用戶需求為驅動的圖書館服務流程如圖1所示。首先,高校圖書館通過各種途徑收集用戶(包括潛在用戶)的相關信息,實現用戶的識別。這里的潛在用戶是指沒有圖書館服務記錄的學生。其次,圖書館根據相關信息對用戶進行分類,體現用戶群之間的差異。再次,圖書館對區分后的不同用戶群進行分析,了解其特點和需求。最后,圖書館根據所了解的需求進行紙質和電子資源的采購[2],根據用戶的特征提供有針對性的定制服務。采購和服務獲得的信息以及最終績效數據被記錄,并在對用戶進行識別、區分和特征分析的過程中使用。由此可以看出,全流程的各階段都有大量的數據需要分析,而很多時候理想的分析結果隱藏在數據中,需要專業人員和技術來實現這一過程。但是,基于現在各高校圖書館人員的專業結構和職位分配,相當多的信息分析難以完成。因此,必須尋找一種途徑便捷地實現數據的分析。數據挖掘被稱為數據庫中的知識發現,它利用神經網絡、模式識別、歸納邏輯的方法,從大量數據中挖掘出未知的、有價值的一些模式和規律,歸納成為知識后供使用。由此可見,數據挖掘正是高校圖書館所需要的數據分析工具。借助于這種工具,高校圖書館才有可能真正實現需求驅動服務[3]。
2數據挖掘在高校圖書館服務中的具體應用
數據挖掘在高校圖書館服務中的不同階段有著不同應用。
2.1數據收集階段在這一階段要對所收集的數據進行處理,提高數據的質量,有利于后續的數據挖掘。例如,安徽大學研究生和本科生專業非常多,因此,用戶數據中“專業”屬性會有很多種取值,從而增加后續分析的難度。結合國家專業學科分類,“專業”屬性可以向更高層次泛化,形成替代屬性“學科門類”,各數據在該屬性只會有13種取值,有利于后續的挖掘。根據圖書館數據采集的情況,本階段還可以進行數據清洗、數據消減、數據集成與轉換。
2.2用戶分類階段利用數據挖掘中的聚類分析技術,可以十分方便地對高校圖書館用戶進行分類[4]。由于這種分類建立在前期大量數據的基礎上,所以分類結果更為科學和準確。例如高校圖書館根據如下算法進行分類:(1)建立包括用戶和潛在用戶的用戶集CW,其中每個用戶對象為xi;(2)在CW中任選k個典型對象構成聚類中心集合OW,其中每個對象oj對應為Cj類的中心;(3)計算CW中每個用戶對象xi到OW中每個對象oj的距離。由于每個用戶對象的各屬性是混合類型,所以不使用歐式距離,而如果利用k-modes算法的相異度計算公式,又無法體現數值型屬性間的實際差異,所以要對算法進行相應的修改[5]。最終,將每個xi歸入距其最近的oj所在的類Cj;(4)計算聚類是否收斂,如果收斂則聚類完成。如果未收斂,重新計算各類的中心,并重復步驟c和d。
2.3分類識別階段在該階段主要可以應用數據挖掘中的分類識別和關聯性分析技術。數據挖掘中的分類識別是對樣本數據進行分析,找出其中的分類規則,有利于對所有對象進行分類,進而針對每類對象采取相應措施。高校圖書館可以利用分類中的相關思想,對聚類的結果進行分析,識別各類的特征,更重要的是可以識別出各類對象中影響結果的關鍵因素。關聯性分析主要用于發現數據之間的聯系,從而建立相應的模式,有利于針對性的決策。數據挖掘中的關聯性分析主要是一種無指導的學習,高校圖書館在應用中可以將其變換為有指導的學習,發現服務對象的一些行為模式,從而實施有針對性的服務,提高最終的效果。以安徽大學為例,以80位學生的相關信息為訓練樣本,分析與借閱多少相關的關聯規則。每條信息包括年級、學科種類、借閱情況。為了簡化計算難度,學科種類和借閱進行了泛化處理,其結果構成以下四個集合。
2.4數據挖掘結果的應用高校圖書館可以利用數據挖掘的結果,在采購、服務等方面做出更為有效的決策。根據上文所得到的分類識別結果,安徽大學圖書館可以嘗試實施有針對性的措施。例如,根據上文的計算結果,性別對學生借書的意愿有較大影響,因此可以針對男性和女性制定不同的宣傳策略和激勵措施,以提高學生借閱量;針對三年級文科生借閱量大的情況,可以更多地了解他們的需求,聽取他們對圖書館的意見,比如說圖書的采購、室內的布局、桌椅和書架排列等,從而更好地完善圖書館工作;針對四年級文科生,可以聯系其學習、實習和書寫論文的實際情況,推薦相應的書籍和資料,以便更好地體現圖書館的服務功能。
3高校圖書館應用數據挖掘的可行性分析
雖然數據挖掘已經是一種成熟的技術,但是如果想應用到圖書館服務中,還需要從技術、經濟、實際運行等方面進行可行性分析。如果數據挖掘技術難以獲得或者不成熟,數據挖掘技術實施的成本高而收益低,實際運行會產生不好的影響,則高校圖書館沒有實施該技術的必要。
3.1技術可行性目前,數據挖掘技術已經應用到通信、零售、金融、制造等多個領域,大量企業在其經營管理過程中使用了該技術。在這些企業的使用過程中,基本上沒有出現因為技術本身缺陷造成損失的情況,因此,數據挖掘技術較為成熟,應用該技術的技術風險較小。另一方面,由于目前社會對大數據分析極為重視,所以數據挖掘的各種應用發展較快。有相當多的軟件或者系統已經可以實現對大量數據的挖掘[7],也有一些企業提供數據挖掘的相關服務。高校圖書館可以根據自身情況,選擇由自己完成或者外包數據挖掘工作。因此,高校圖書館獲得數據挖掘技術并不困難。
3.2經濟可行性在成本方面,應用數據挖掘必然會導致高校圖書館成本上升。如果高校圖書館選擇自己實施數據挖掘,則需要購買相應功能軟件或者升級原有系統;如果圖書館選擇購買第三方的數據挖掘服務,則需要支付相當的購買費用,這些都會帶來額外的成本。另外,數據挖掘會增加高校圖書館系統的計算量,圖書館可能需要對原有硬件進行升級或者購買新的硬件,這會增加硬件成本。數據挖掘的執行和挖掘結果的應用不同于圖書館傳統業務,所以需要對相關人員進行有關數據挖掘方面業務的培訓,以保證有足夠的人員支持日常的數據挖掘業務。相關培訓會帶來時間和資金方面的損耗。數據挖掘是基于大量數據的,高校圖書館必須向數據挖掘服務提供充足的、符合其要求的數字化信息[8]。因此,高校圖書館可能需要將獲得的各種數據進行分析和轉換,以滿足數據挖掘的要求。但是應該看到,由于目前高校圖書館信息化水平較高,各種信息資源的數字化程度較高,所以在這方面的成本上升可能并不明顯。在成本上升的同時,應用數據挖掘能夠從多方面為高校圖書館帶來收益。首先由于數據挖掘對圖書館用戶進行了有效分類,同時還提供了各類用戶最真實的需求,所以圖書館能夠有針對性地采購紙質資源和電子資源,避免了采購各種資源后無人使用的現象,從而有效地降低圖書館采購成本,提高采購資源的有效性。由于數據挖掘對每一類用戶進行定義性描述、分類與預測、關聯性分析,所以高校圖書館能夠針對每一類用戶,甚至每一位用戶提供定制服務。定制服務能夠過濾掉用戶不需要的服務和資源,提供對于用戶來說最適合的服務形式和服務內容,使用戶使用圖書館服務更為便捷,使用的效率和效果也有顯著提高。高校圖書館是學生必須使用的一種教輔工具,但是因為種種原因,很多學生對圖書館服務使用較少,實際上影響了學習的效果。數據挖掘通過聚類分析、分類與預測等方法對這些潛在用戶群進行分析,能夠提供關于潛在用戶的相關知識,有利于圖書館采取相對應的措施,吸引潛在用戶,提高他們對圖書館的使用率。綜上所述,實施數據挖掘會在短期內提高圖書館的成本,但是能夠長期提高圖書館的服務質量,有利于圖書館服務于教學、科研目標的實現。所以,如果高校圖書館能夠負擔初期的成本,則實施數據挖掘在經濟上是十分可行的。
3.3運行可行性在高校圖書館服務中應用數據挖掘,是為了更詳細地定義用戶的各種特征,以方便圖書館在資源采購和服務等方面的決策。數據挖掘實際上是在原有決策過程中,增加了一些決策的支撐材料,對決策過程本身影響不大,不會產生流程的重構。因此,應用數據挖掘對組織和流程的影響較小,不會有太大的實施阻力。應用數據挖掘會對部分圖書館員產生新的知識要求,這些館員需要進行相應的培訓。但是無論是自我開發數據挖掘應用、購買數據挖掘軟件還是數據挖掘服務,對館員的培訓都只是操作流程的更新或者操作技能的提高,對理論知識要求極少,培訓的難度較低。因此,人員能夠很快地適應含有數據挖掘的新環境,應用數據挖掘人員方面的阻力較小。因此,在圖書館服務中實施數據挖掘的運行可行性較高。
4結語
基于大數據分析的服務,是提高高校圖書館服務水平的重要途徑。數據挖掘一方面能夠使圖書館的服務更加有針對性,另一方面又不會對現有的流程產生太大的影響。因此在高校圖書館服務中應用數據挖掘,是一種收益大、風險小的改進方法。在實施數據挖掘的過程中,高校圖書館應該注意在原始數據的清洗、挖掘方法的選擇以及挖掘結果的應用等方面加以控制,追求最優,以保證實施的最終效果。
參考文獻:
[1]陳雙飛.大數據時代圖書館基于服務生命周期的客戶關系管理研究[J].現代情報,2014,34(5):91-93.
[2]遲春佳,毛志勇.基于數據挖掘的高校圖書館圖書采購計劃輔助決策研究[J].現代情報,2009,(7):108-110.
[3]顧倩.數據挖掘應用于高校圖書館個性化服務的探討[J].圖書館雜志,2013,32(8):63-65.
[4]王慧敏,賀興時,牛四強.數據挖掘在高校圖書館中的應用[J].西安工程大學學報,2014,28(2):241-245.
[5]張月琴,陳彩棠.基于新相異度量的模糊K—Modes聚類算法[J].電腦開發與應用,2012,25(5):32-34.
[6]朱明.數據挖掘[M].合肥:中國科學技術出版社,2002:68-69.
[7]楊建明,劉芳.基于數據挖掘的高校圖書館服務優化研究[J].情報探索,2014,198(4):25-28.
[8]楊江麗,高凡,董若劍.基于數據挖掘的高校圖書館讀者行為研究———以西南交通大學圖書館為例[J].圖書館研究,2013,43(3):106-110.
作者:陳潔 單位:安徽大學