本站小編為你精心準(zhǔn)備了借閱數(shù)據(jù)的圖書推薦研究參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
【摘要】本文以哈爾濱商業(yè)大學(xué)圖書館為例,通過(guò)對(duì)圖書管理系統(tǒng)借閱數(shù)據(jù)進(jìn)行聚類分析,揭示讀者群體的需求結(jié)構(gòu),了解其文獻(xiàn)利用情況,歸納其用戶偏好模型,以提高推薦策略的準(zhǔn)確度,有針對(duì)性地為讀者提供個(gè)性化服務(wù)。
【關(guān)鍵詞】數(shù)據(jù)處理;聚類分析;讀者群;個(gè)性推薦
隨著數(shù)字化信息量的成倍增長(zhǎng),圖書館服務(wù)質(zhì)量也受到影響。讀者面對(duì)海量的信息,需要花費(fèi)更多時(shí)間找到自己真正所需。怎樣高效、迅速、主動(dòng)地為讀者提供其所需信息,已成為當(dāng)今圖書館建設(shè)過(guò)程中亟待解決的問(wèn)題。數(shù)字圖書館的個(gè)性化推薦是通過(guò)主動(dòng)服務(wù)的方式,根據(jù)讀者的不同需求,有針對(duì)性地提供服務(wù),使讀者能夠快速、準(zhǔn)確地發(fā)現(xiàn)自己所需要的圖書[1]。它主要通過(guò)跟蹤和分析讀者的行為記錄,建立讀者的借閱偏好模型,并區(qū)分讀者群,有針對(duì)性地進(jìn)行書籍推薦,這樣既能幫助讀者快速、準(zhǔn)確地找到所需信息,同時(shí)也提高了圖書館的館藏利用率,增加了讀者對(duì)圖書館的滿意度[2]。
1研究方法
1.1數(shù)據(jù)預(yù)處理在進(jìn)行數(shù)據(jù)挖掘之前,需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)數(shù)據(jù)進(jìn)行清洗,把數(shù)據(jù)中不正確的、不完整的、不一致的、格式不同的進(jìn)行處理,處理成為標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)和格式,如圖1為原始數(shù)據(jù)需要做預(yù)處理的流程[3]。數(shù)據(jù)預(yù)處理是構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的第一步,在數(shù)據(jù)挖掘過(guò)程中是非常重要的步驟。它可以改進(jìn)數(shù)據(jù)質(zhì)量,有效提高數(shù)據(jù)挖掘的精準(zhǔn)度。
1.2聚類分析方法聚類分析主要是根據(jù)讀者的共同偏好劃分讀者群,清晰掌握讀者群體的信息需求,把資源進(jìn)行合理優(yōu)化。利用讀者群,能夠更好地為讀者開展個(gè)性化推薦服務(wù);根據(jù)讀者群可以很好地了解讀者對(duì)信息資源利用狀況的活躍度,為圖書館信息資源的宣傳與培訓(xùn)提供依據(jù)[4-5]。讀者群聚類可以分別基于圖書類型和圖書借閱頻次進(jìn)行[6]。基于借閱圖書類型聚類是從讀者需求角度進(jìn)行細(xì)分,基于借閱頻次聚類是從讀者活躍度的角度來(lái)實(shí)現(xiàn)讀者細(xì)分。
2實(shí)例分析
本文樣本是哈爾濱商業(yè)大學(xué)圖書館借閱數(shù)據(jù),包含讀者數(shù)據(jù)、圖書數(shù)據(jù)、借閱情況等,是反映讀者信息的重要依據(jù)。
2.1讀者數(shù)據(jù)預(yù)處理讀者數(shù)據(jù)包含姓名、年級(jí)、院系、專業(yè)等屬性,這些屬性是對(duì)讀者劃分的重要依據(jù),可以將讀者區(qū)分為不同群體。
2.2聚類分析我們把讀者信息數(shù)據(jù)和借閱信息數(shù)據(jù)作為對(duì)象,利用上面模型進(jìn)行讀者聚類分析。經(jīng)統(tǒng)計(jì),哈爾濱商業(yè)大學(xué)圖書館從2016年3月到2017年3月借閱人次13686,提取原始借閱記錄248491條,有效讀者29842人。圖書館圖書管理系統(tǒng)數(shù)據(jù)庫(kù)為ORACLE,依據(jù)聚類分析流程圖,將預(yù)處理后的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)數(shù)據(jù)結(jié)構(gòu),然后利用SPSSClementine平臺(tái)進(jìn)行聚類分析[9]。
2.3圖書推薦可以清楚地看出每類書籍的熱門排行。依據(jù)聚類分析結(jié)果,每位讀者的類屬關(guān)系和興趣,進(jìn)行相應(yīng)圖書的批量推薦。
3結(jié)論
隨著信息量的劇增,為了給讀者提供更加精確的個(gè)性化推送服務(wù),本文以圖書管理系統(tǒng)數(shù)據(jù)為研究目標(biāo),利用聚類的方法對(duì)讀者群體進(jìn)行劃分;建立用戶偏好模型,根據(jù)數(shù)據(jù)庫(kù)中讀者的借閱、續(xù)借和歸還等操作行為所產(chǎn)生的記錄,對(duì)這些記錄信息進(jìn)行綜合分析,了解讀者的圖書借閱喜好,建立不同的讀者群,按照興趣度,根據(jù)各類圖書排名進(jìn)行相應(yīng)的圖書推薦。通過(guò)聚類分析結(jié)果,哈爾濱商業(yè)大學(xué)的讀者群體以文學(xué)類、社科類、經(jīng)濟(jì)管理類書籍需求量為最大,其中文學(xué)類書籍利用率最高。通過(guò)此種推薦策略,能夠更好地為讀者提供個(gè)性化服務(wù)。
參考文獻(xiàn)
[3]柴彥.基于共詞聚類分析方法的知識(shí)管理國(guó)內(nèi)研究述評(píng)[J].情報(bào)科學(xué),2015(4):149-153.
[4]閔超,孫建軍.學(xué)科交叉研究熱點(diǎn)聚類分析———以國(guó)內(nèi)圖書情報(bào)學(xué)和新聞傳播學(xué)為例[J].圖書情報(bào)工作,2014(1):109-116.
[5]熊海濤.面向復(fù)雜數(shù)據(jù)的推薦分析研究[M].北京:北京理工大學(xué)出版社,2015:15-16.
[6]郭秋萍.企業(yè)數(shù)據(jù)挖掘理論與實(shí)踐[M].鄭州:黃河水利出版社,2005:54-56.
[7]騰廣青,畢強(qiáng).基于概念格的數(shù)字圖書館用戶市場(chǎng)細(xì)分———數(shù)字圖書館用戶的概念聚類分析數(shù)字圖書館[J].現(xiàn)代圖書情報(bào)技術(shù),2010(2):7-11.
[8]朱東郡,等.基于標(biāo)簽聚類和興趣劃分的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)工程,2017(11):146-151,160.
[9]李新廣.?dāng)?shù)字圖書館的用戶偏好模型及個(gè)性化推薦研究[D].武漢:武漢大學(xué),2011.
作者:閆俊霞 單位:哈爾濱商業(yè)大學(xué)圖書館