本站小編為你精心準備了數據挖掘與圖書館用戶資源分析參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:人類利用圖書館產生信息活動時所表現出的最基礎、最平常、最通用的一種關系,便是用戶資源和圖書館之間的關系。從這種關系出發,分析嫁接起這一簡單聯系的規律,便是數據挖掘技術。本文認為對圖書館用戶資源分析研究應以數據挖掘技術為邏輯起點,從云計算、信息共享、數據排查、智能搜索、大數據存儲等對圖書館用戶資源進行整合和建設。面對信息資源日益豐富的今天,數據挖掘技術對管理圖書館信息資源技術提供了巨大便利。
關鍵詞:數據挖掘;用戶資源
數據挖掘,即數據系統中的信息發現。隨著計算機技術,特別是云計算、大數據記憶技術的快速發展,傳統的手動查找信息模式被大數據智能檢索替代。數據挖掘技術廣泛應用于市場、工業、金融行業、科學界、互聯網行業以及醫療業。數據挖掘技術在圖書館的應用,可以將海量的用戶資源進行聚類、關聯、整合,可以對用戶搜索記錄、圖書流通記錄、用戶借閱信息等數據進行精確預判,發現一些隱蔽的聯系,為圖書館采購圖書、淘汰文獻資料提供科學建議,也可以為用戶提供個性化訂閱服務,創新用戶服務模式,為圖書館建設整個信息網絡提供有力支撐。
1大數據下的圖書館用戶資源特征
圖書館用戶資源是通過數字技術進行組織和管理的:(1)經過數據關聯分析,把數據庫中存在的兩個或兩個以上用戶之間的相同性提取出來,提高支持度和說服力;(2)把用戶信息按照相似性歸納成幾個類別,建立宏觀概念,發現其間的相互關系;其次定義這些相互關系,概念產生以后,即等同于這些相互關系的整體信息,用于建構分類規則或者數據模型;其次利用以上數據找出變化規律,對此規律進行模型化處理,并由數據模型對未知信息進行預判;(3)把用戶資源進行時序排序,檢索出高重復率的模型;(4)進行偏差比對,檢查數據之中的異常情況。圖書館利用大量的用戶訪問信息獲取用戶興趣,發現用戶群體,為不同的群體定制信息,還可以建立一個共享信息平臺,讓不同用戶建立網絡交流。
1.1數據量大并且分布更廣
大數據形勢下,圖書館可以獲取的用戶資源不僅限于用戶個人信息和搜索記錄,也包括檔案、學術研究、教學模式、用戶評價和反饋等,數據豐富。同時,數據分布廣泛,在互聯網時代,可從圖書館應用系統、數據系統記錄以及各種網頁、移動終端的信息獲取,顯示出用戶資源的分散性。
1.2數據內容多元化,形式靈活化
數據系統里的存儲方式不同,服務器不同,系統開發平臺不同,致使許多用戶資源無法交流互換。圖書館用戶資源有半模型化、模型化和非模型化之分。傳統的圖書館用戶資源中,用戶只是圖書資源的使用者,與圖書館之間只是點對點單線互動,用戶之間不存在交流,而在大數據網絡平臺下,用戶之間可以建立內容共享互動平臺,使得用戶資源的內容更加多元化。
2圖書館用戶資源利用
2.1有助于利用數據挖掘技術建立用戶資源圖書館
用戶資源圖書館具備信息量大的特點,用戶可獲得各方各面的信息,且從服務的個性化和全方位化而言,圖書館可根據社會熱點或用戶需求定制服務。一方面,建立用戶資源圖書館,使各類用戶信息在同一界面統一呈現,方便用戶的選擇和檢索。另一方面,利用數據挖掘技術建立的用戶資源圖書館,服務器眾多,具有較強的計算能力和存儲能力,擁有較高的數據處理能力,能同時容納多數用戶。因數據量大所導致的硬件費用和后期運行費用劇增,可通過構建用戶資源圖書館平臺以及應用服務得到解決。為應付不斷提高的用戶資源存儲方面的壓為,目前亟需的就是投入大量資金以擴容存儲設備,無疑,建立用戶資源平臺可以解決此問題。
2.2加速圖書館資源的數字化
強大的互聯網呈現功能和用戶信息保存的可靠性功能,用戶資源存儲的復雜性問題可得到很好的解決。其次,數據挖掘技術對于資源整合方面具有優勢,通過分布式的存儲模式整合大量信息資源提供給用戶檢索。不同的數據之間的互相操作以及全方位的互聯網服務得以實現,很好的解決了資源重復建設的問題。因此,利用數據挖掘使得圖書館資源數字化具備可行性。從這個意義上來看,資源的館藏數字化將會加快發展,而不只是圖書書目的劇增。
2.3降低人力資源成本,使圖書館各類資源得以整合和優化
隨著各類用戶資源利用步伐的加快,加之依賴因特網的用戶對服務的可行性和效率性要求更高,大量不同體系的服務器布置在機房,系統維護人員的壓力也相應増大。通過數據挖掘技術,可有效進行資源整合和優化,無需通過人力進行。
2.4有利于分析用戶心理和提升用戶體驗
數據挖掘技術能夠利用用戶資源計算出用戶模型,這是研究用戶需求、偏好、行為的一種常規方式,一般認為用戶模型是對用戶在某段時間內相對穩定的信息需求的記錄。用戶模型反過來對獲取用戶資源有十分重要的作用,建構用戶模型,能夠使圖書館更加精深、準確地掌握當前用戶資源。通過對用戶資源的處理來預測用戶需求,進而達到持續提高服務質量和用戶滿意度的目的。一方面,預判用戶心理是利用圖書館用戶資源更加深入的表現。隨著用戶環境與圖書館環境的不斷變化,這種預判力覆蓋范圍已經不單單是用戶信息行為的某個過程或某幾個過程,相反,用戶心理能夠對用戶需求的強弱、層次、方向產生極為重要的影響,同時也能夠對獲取用戶資源全部過程產生重要影響。另一方面,最先研究用戶體驗研究當屬企業營銷活動,主要用來研究用戶與企業、產品或服務之間的互動。數據挖掘技術能夠更精準預測用戶的實際感受,通過研究用戶情感體驗與用戶行為動作,提高用戶的滿意度,滿足用戶需求。
3結語
在數據大爆發時代,重視圖書館用戶資源,通過多渠道、多方式匯聚用戶資源,采用數據挖掘、數據歸檔分析等技術,掌握用戶資源特征,有助于圖書館精準定位用戶群體,對調整圖書館運營策略有重要前置作用,更能創新圖書館服務的內容和形式,實現圖書館資源的有效利用。
參考文獻
[1]陳文偉等.數據挖掘技術[M].北京:北京工業出版社,2002.
[2]郭崇慧等.北京數據挖掘教程[M].北京:清華大學出版社,2005.
[3]徐永麗等.網絡環境中用戶信息需求障礙分析[J].圖書館理論與實踐,2004.
作者:蔣鵬 單位:南陽醫學高等專科學校