在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網 資料文庫 面向繼續教育學生的圖書推薦算法探討范文

面向繼續教育學生的圖書推薦算法探討范文

本站小編為你精心準備了面向繼續教育學生的圖書推薦算法探討參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

面向繼續教育學生的圖書推薦算法探討

[摘要]圖書是繼續教育過程中不可或缺的、重要的學習資源。如何讓圖書館豐富的圖書資源更好地為繼續教育學生服務,針對其職業(專業)及興趣愛好進行高質量個性化的圖書推薦,有效引導其高效優質閱讀,從而提高這一特殊群體的閱讀興趣,培養其終身學習的習慣已成為擺在圖書工作者面前的一個課題。文章應用用戶活躍度進行數據預處理,進而以用戶節點的職業(專業)信息、興趣愛好(借閱記錄、薦購記錄和書評)兩個主要屬性為參數,計算度量繼續教育學生用戶節點的相似度,并通過相似用戶為圖書打分的方法,有針對性地為繼續教育學生推薦其感興趣的圖書,進而更好地為繼續教育學生服務。實驗證明,該算法能更精準地向目標借閱者推薦其感興趣并有利于其職業(專業)發展和終身學習的圖書。

[關鍵詞]繼續教育學生;圖書推薦;用戶相似性;多屬性度量

繼續教育是面向學校教育之后所有社會成員特別是成人的教育活動,是終身學習體系的重要組成部分,是專業進修及普通教育后的教育進階。這個階段的教育從年齡上講大多數學生已步入成年。繼續教育過程更主要依靠的是學生自學來汲取對職業(專業)有益的知識。圖書已經成為繼續教育學生在受教育過程中不可或缺的學習工具。而在圖書選擇的過程中,絕大多數學生的圖書選擇存在盲目性、跟從性,圖書選擇的科學性不高,利用效率低下。如何準確地向繼續教育學生進行圖書推薦成為科學選擇圖書和提高圖書利用率的關鍵。[1]隨著大數據技術的廣泛應用,針對特定群體的多特征的個性化圖書推薦算法也逐步出現,協同過濾推薦算法是其中一種比較成功的推薦算法,但其計算范圍過大,算法復雜性高,同時,這一算法沒有考慮借閱時段、評價等具體情感因素。[2-4]比如在自學考試備考過程中,學生借閱圖書的真實目的是突擊備考;在課程結束前,學生大量借閱與某一課程相關的圖書是為了結課論文的寫作,這些借閱記錄本身無法準確表達讀者的真實愛好,因此僅從讀者的借閱記錄來推薦圖書,其準確率并不高。[5-6]可見,有效的圖書推薦需要通過用戶活躍程度過濾掉隨機因素,挖掘出讀者的真實興趣,還需要綜合考慮用戶節點的不同屬性信息來計算度量用戶相似性,進而推薦給目標用戶其可能感興趣的圖書。這些用戶節點的不同屬性主要包括兩個方面,一是用戶的職業屬性;二是用戶的興趣愛好屬性,用戶興趣愛好屬性的描述依據主要是用戶持續感興趣的類別的新書書目、用戶潛在有興趣的新類別的圖書書目和對職業(專業)發展有益的圖書書目、圖書薦購記錄和書評信息等。

一、繼續教育學生作為讀者用戶屬性分析

1.職業(專業)屬性繼續教育學生作為特殊的讀者群體其顯著特征是具有職業(專業)的固定性。一般而言,繼續教育學生在繼續教育階段學習的專業是為其當前從事的工作或意向性工作服務的,這種強目的性使得職業(專業)屬性成為面向繼續教育學生做為讀者區別其他讀者的一個顯著特征。而這個特征對繼續教育學生的圖書借閱導向性十分明顯,因此,我們將繼續教育學生的職業(專業)作為針對這一特殊讀者群圖書推薦算法的主屬性。學生的職業(專業)是其主要特征,其相當一部分圖書借閱會與職業(專業)相關。基于此,職業(專業)屬性是選擇圖書的一個潛在屬性。根據《國民經濟行業分類和代碼》可構建職業(專業)分類樹(如圖1所示)。門類代碼用一位拉丁字母表示,即用字母A、B、C……依次代表不同門類;大類代碼用兩位阿拉伯數字表示,打破門類界限,從01開始按順序編碼;中類代碼用三位阿拉伯數字表示,前兩位為大類代碼,第三位為中類順序代碼;小類代碼用四位阿拉伯數字表示,前三位為中類代碼,第四位為小類順序代碼。記職業(專業)相似度為Cs(u,v),則在同一小類相似度最高,同一中類次之,不同門類相似度為零。

2.興趣愛好屬性繼續教育學生一般不再過多涉獵其他學科,其興趣愛好相對固定并且一般和專業有關聯。在這樣的背景下,分析繼續教育學生的興趣愛好屬性有利于提高圖書推薦的準確性。用戶興趣愛好屬性的描述依據除了用戶一直感興趣的類別的新書書目、用戶潛在有興趣的新類別的圖書書目和對職業(專業)發展有益的圖書書目外,能更大程度反映用戶興趣愛好的是圖書薦購記錄和書評信息。圖書館對所薦購圖書受到廣泛歡迎的薦購者進行獎勵,因此那些薦購明星的興趣愛好可以很容易得到,同時,所薦購圖書的借閱者們也一定是該興趣組的成員。同樣,對同一本書做過書評的用戶我們也認為其具有相同的愛好,其相似程度很高,當然,這里忽略了情感傾向分析,即書評中對圖書的評價好壞之分。3.用戶活躍度屬性用戶活躍度特指在一定時間內圖書借閱相對較多的讀者,這類用戶是圖書館的忠實用戶,為其推薦圖書更有價值。因此,用戶活躍度屬性是面向繼續教育學生圖書推薦算法的一個重要屬性,可以用來對原始數據集進行數據清洗,在降低算法復雜度的同時能有效提高推薦精準度。

二、圖書推薦策略

基于上文分析,面向繼續教育學生作為特殊讀者群體的圖書推薦需要應用用戶活躍度屬性進行數據預處理,進而綜合考慮讀者的職業(專業)相似性和用戶興趣相似性來完成。1.用戶綜合相似性本文認為向一個愛讀書的人推薦圖書會有更好的效果。采用職業(專業)度量和興趣相似性度量相結合的方法來進行。2.用戶節點相似性度量算法輸入:每個讀者的圖書證信息,包括姓名M、職業(專業)C、班級G、性別S,每位讀者借閱記錄、薦購記錄和書評記錄等,以及圖書館館藏圖書數據信息。3.準確度度量方法對于本文提取的忠實讀者r,按照用戶相似性度量方法進行圖書推薦,具體推薦集合為N本圖書,如果推薦集合中的某本圖書出現在了測試數據集里,說明這是一次成功的推薦。

三、實驗與仿真

1.數據預處理與忠實讀者挖掘數據來源于哈爾濱市圖書館真實數據集,時間跨度2015-03-01到2015-12-31,共包含93142條記錄,主要包含借閱、還書、續借、薦購、預約、評論等基本操作。本文采用前7個月的數據為實驗分析數據并進行圖書推薦預測,后3個月的數據作為測試數據集。為了分析數據特征,需要統計讀者的平均借閱數量等基本信息的分布情況。圖2為讀者借閱圖書數量分布圖,可見占比53%的讀者借閱圖書在12本以內,因此原始數據集中有大量讀者并不熱衷于圖書館借閱,應用用戶活躍度指數有效挖掘圖書的忠實讀者是數據預處理的重要工作。2.讀者相似性度量及圖書推薦算法在忠實讀者數據范圍內來度量節點相似性,采用職業(專業)度量和興趣相似性度量相結合的方法來進行。按公式(3)對讀者進行兩兩交叉匹配可以發現相似度超過0.2的節點有11032對。3.算法評價對實驗數據集分析后為每位忠實用戶推薦top-5本圖書,并用測試數據集來驗證其準確性。對不同的參數值進行分析得到基于參數的推薦精度如圖6所示。可見,職業(專業)精度在本數據集中作用較大,在取值0.6時達到最高推薦精度,即算法的推薦效果最好。

四、結論

本文基于更好地為繼續教育學生提供有利其職業(專業)發展、幫助其養成終身學習習慣的相關圖書為宗旨,為提高圖書推薦的準確率和有效性而提出一種基于用戶節點相似性的圖書推薦算法。算法應用用戶活躍度屬性進行數據預處理,利用用戶節點的職業(專業)信息和興趣愛好(借閱記錄、薦購記錄和書評等)兩個基本屬性計算度量用戶節點的相似度,進而有針對性地為繼續教育學生推薦其感興趣的圖書。實驗證明,本文算法能更精準地向目標借閱用戶推薦其感興趣的圖書、潛在有興趣的新類別圖書和行業內有利于其發展的高質量圖書。

[參考文獻]

[1]李克潮,梁正友.基于多特征的個性化圖書推薦算法[J].計算機工程,2012,(11).

[2]馬炎.一種自適應的協作過濾圖書推薦系統研究[J].情報雜志,2008,(5).

[3]武建偉,俞曉紅,陳文清.基于密度的動態協同過濾圖書推薦算法[J].計算機應用研究,2010,(8).

[4]王茜,王均波.一種改進的協同過濾推薦算法[J].計算機科學,2010,(6).

[5]田野,祝忠明.關聯數據驅動的數字圖書推薦模型[J].圖書情報工作,2013,(17).

作者:李曉光;孫洪慶;周雪妍 單位:哈爾濱學院

主站蜘蛛池模板: 夜精品a一区二区三区 | 四虎永久在线精品免费观看地址 | 两性视频网 | 香蕉视频在线观看男女 | 亚洲毛片在线免费观看 | 99热国产这里只有精品99 | 四虎影院一区二区 | 一区欧美 | 在线你懂得 | 一级午夜视频 | 色婷婷激情五月 | 亚洲国产精品久久久久网站 | 四虎在线最新永久免费播放 | 久久精品久 | 亚洲国产精品一区二区三区 | 羞羞视频免费观 | 亚洲天码中文字幕第一页 | 国产高清免费在线观看 | 欧美精品在线视频 | 中文字幕在线不卡精品视频99 | 白云精品视频国产专区 | 亚洲精品视频久久 | www亚洲欲色成人久久精品 | 久久狠狠丁香婷婷综合 | 日本在线一区 | 国产精品久久久久久免费 | 高清性色生活片欧美 | 伊人狠狠色丁香婷婷综合下载 | 一区二区三区不卡在线 | 亚欧成人一区二区 | 久久久精品久久久久久 | 中文字幕永久在线视频 | 最近国语免费看 | 欧美色婷婷| 亚洲视频在线观看地址 | 高清在线不卡 | 国产美女自拍 | 一区二区国产精品 | 欧美亚洲日本视频 | 在线观看精品视频一区二区 | 久久精品网站免费观看 |