前言:我們精心挑選了數篇優質數據挖掘學習計劃文章,供您閱讀參考。期待這些文章能為您帶來啟發,助您在寫作的道路上更上一層樓。
關鍵詞: E-learning應用平臺; Web數據挖掘; 個性化學習; 個性化搜索引擎
中圖分類號:TP392;G434 文獻標志碼:A 文章編號:1006-8228(2013)09-05-03
0 引言
計算機通信技術的日益強大支撐了建設學習型社會的需求,遠程教育借助它的靈活性與選擇性漸漸走進人們身邊,成為學習的一種普遍方式。自1996年我國開通了“中國教育與科研計算機網”,開放、靈活的E-learning便迅速被人們所接受并應用于各種網絡學校和遠程教育之中。
隨著時間的推移,人們要求不僅僅只是遠距離的教學,更多的是個性化的學習。個性化教育理論認為,學習過程應是針對學生個性特點和發展潛能而采取恰當的方法、手段、內容、起點、進程、評價方式等,促使學生各方面獲得充分、自由、和諧發展的過程[1]。但是目前的遠程教育學習系統并不令人滿意,首先是系統缺乏智能性,學習系統面對的用戶并非是一類人,而是不同背景、不同目的、不同時期的一系列請求,面對這些請求,缺乏智能化的系統就難以實現因材施教;其次是缺乏有效的監督機制和有效的學習幫助支持,導致學生偏離學習目標、遇到困難時不能及時得到幫助;再者是有用的教學資源沒有被有效利用,造成了資源的極大浪費。“以人為本”的教育理念的逐漸普及,個性化學習方案總體上應該做到學習資源的多維性、學習價值追求的多重性、學習風格的獨特性、學習過程的終身性和學習方式的自主性。
基于Web智能的網絡教育是現代遠程教育的一種重要手段,其可以通過網絡來營造虛擬的學習環境,在一個平臺上向學生提供豐富的學習資源,從而幫助學生開展基于資源的探究式學習;在虛擬的學習環境中,教師和學生、學生與學生間可以方便地進行同步或異步的交互。數據挖掘便是實現Web智能網絡教育的重要方法,主要是通過獲取學習者在Web上的學習過程行為數據,如訪問信息、時間、次數及喜好等,經過挖掘流程處理,得到學習者的模式規律,從而給學習者提供良好的個性化服務[2]。
1 Web數據挖掘相關分析
1.1 Web數據挖掘基本過程
Web是一個強大的交互環境,所以Web事務度量就需要數據的獲取與處理,Web數據挖掘指的是從大量的、不完全的、蘊含的、模糊的WWW資源上提取隱含在其中有用的信息和知識的過程。其處理對象是大量的業務數據,目的是為了提取有價值的知識,提高信息利用率。Web數據挖掘又被稱為資料探勘或者數據采礦,是數據庫知識發現中的一個步驟。根據大量業務數據的不同類型,Web數據挖掘可以分為:Web內容挖掘、Web結構挖掘、Web使用挖掘[3]。其中,Web內容挖掘是挖掘Internet的頁面和后臺交易數據庫,包括結構化的數據挖掘與非結構化的數據挖掘。無論是哪種數據挖掘,都是為了尋找隱藏著的、大量的、有價值的信息,并且為Web提供更好的服務。
以下給出Web數據挖掘的基本流程。
⑴ 目標數據采集:數據采集就是要記錄用戶訪問行為。數據來源包括服務器端、客戶端和端。為了有效地實施挖掘算法,僅僅采集數據是不夠的,還需要進行下一步操作:預處理。
⑵ 預處理:目標數據經過預處理才能有效的實施挖掘算法,也就是從目標數據集中除去明顯錯誤數據和冗余的數據,進一步精簡所選數據的有效部分,并將數據轉化為有效形式。數據的預處理的質量與Web挖掘的效率是緊密相關的。內容包括數據凈化、用戶識別、會話識別、事務識別及路徑補充等。
⑶ 模式發現與分析:模式發現就是對預處理后的數據實施具體的、合理的挖掘算法或綜合應用不同的算法。其最終目的是發現用戶的訪問模式,預先為用戶設定學習內容類別。模式分析的目的是根據實際應用,通過觀察和選擇,將模式發現的統計結果、規則和模型轉換為知識,經過篩選后用來指導實際應用,也就是在預先的類別中再次為用戶提供個性化資源和學習支持服務。
⑷ 用戶反饋:利用數據挖掘與學習內容綁定等各種技術,學習者的學習過程會是以可視化方式進行指導。
1.2 相關算法分析
協同過濾這一概念最早出現在1992年,由Goldberg、Nicols、Oki及Terry提出,隨著大大小小系統的應用,協同過濾推薦迅速成為Web數據挖掘中一種很受歡迎的技術。該技術分析用戶興趣,在用戶群中找到指定用戶的相似用戶,綜合這些相似用戶對某一信息的評價,形成系統對該指定用戶對此信息的喜好程度預測[4-6]。
相似性計算是協同過濾推薦算法中最關鍵的一步,傳統的相似度計算方法有三種。
⑴ 余弦相似性
把用戶評分看做n維項目空間的向量,用戶間的相似性通過向量間的余弦夾角度量,設用戶i和用戶j在n維項目空間上的評分分別表示為向量k,e,則用戶i和用戶j之間的相似性為:
Sin(i,j)=cos(k,e)= ⑴
⑵ 修正的余弦相似性
余弦相似性度量方法中沒有考慮不同用戶的評分尺度問題,修正的余弦相似性度量方法通過減去用戶對項目的平均評分來改善上述缺陷,設經用戶i和用戶j共同評分的項目集合,則用戶i和用戶j用戶之間的相似性為:
Sin= ⑵
其中,Rij代表用戶i對項目c的評分,和分別表示用戶i和j對項目的平均評分。
⑶ 相關相似性
設經用戶i和用戶j共同評分的項目集合用Iij表示,則用戶i和用戶j之間的相似性sin(i,j),通過Pearson相關系數度量:
歸根結底,三種相似方法均為基于向量的相似度計算方式,進行對象屬性之間的嚴格匹配。
余弦相似性度量方法把用戶評分看作一個向量,用向量的余弦夾角度量用戶間的相似性,然而沒有包含用戶評分的統計特征;修正的余弦相似性方法在余弦相似性基礎上,減去了用戶對項目的平均評分,然而該方法更多體現的是用戶之間的相關性而非相似性。相關性和相似性是兩個不同的概念,相似性反應的是聚合特點,而相關性反映的是組合特點;相似相關性方法,依據雙方共同評分的項目進行用戶相似性評價,如果用戶間的所有評分項目均為共同評分項目,那么相似相關性和修正的余弦相似性是等同的,用戶對共同評分的項目集稀少,使得相似相關性評價方法實際不可行。
2 基于Web數據挖掘的個性化學習系統模型
基于Web數據挖掘的個性化學習系統采用的是三層B/S模型,如圖1所示。
個性化與智能化功能模塊的實現都是以Web為基礎的。服務器是一個核心,用戶通過客戶端發送一系列請求,Web服務器作出相應的響應,也就是在后臺數據庫中查詢信息,查詢到的信息再返回給Web服務器,最后服務器通過網頁的形式呈現及反饋給用戶。
2.1 主要功能模塊分析與設計
基于Web數據挖掘的個性化學習系統主要是由學習者、學習者個人秘書、管理員、個性化推薦引擎及教學資源等模塊構成。其中系統的核心部分是“學習者個人秘書”。當學習者通過身份驗證后,便會進入個人的學習頁面。“學習者個人秘書”根據學習者的訪問習慣和學習者提交的要求等信息進行自動整合(這里主要是由用戶信息收集和用戶信息建模兩個模塊來實現),并進行內部建模,形成一套完整的學習方案,并對此方案進行資源調度,進而反饋給學習者所需的資源信息。“學習者個人秘書”也就是所謂的個性化處理引擎,它主要由四個模塊組成:用戶信息收集、用戶信息建模、個性化學習方案、學習資源調度。該個性化學習系統方案構建如圖2所示。
⑴ 用戶信息收集模塊
信息收集模塊是實現在線學習個性化服務的基礎,它收集用戶請求,跟蹤用戶的行為,結合用戶數據庫中事先存放的用戶個性化特征數據,經過預處理,對用戶信息建模提供個性化的策略。
⑵ 用戶信息建模模塊
信息建模模塊則是運用數據挖掘技術對這些信息進行分析,不斷更新或者初始化用戶數據庫中動態部分,以生成個性化推薦策略并發送給個性化學習方案模塊。
⑶ 個性化學習方案模塊
學習方案模塊是“學習者個人秘書”的核心模塊,它結合前面提供的一系列用戶特征信息,并進行整合后自動生成一套教學方案,把教學方案中所需要調度的資源傳遞給資源調度模塊。
⑷ 資源調度模塊
資源調度模塊是根據教學方案中需要調度的資源從視頻庫、作業庫、試題庫等資源庫中調度并反饋給用戶。其中,資源庫中保存學習者的基本信息、學習歷史、訪問歷史、對知識的掌握情況、學習喜好等個性特征。學生的個性特征也分為靜態信息與動態信息。如學生的姓名、性別、年齡、ID、密碼等都屬于靜態信息,如學習歷史、學生做過的練習和測試題的答案、學習者的知識結構等都屬于動態信息。學生的個性化特征信息是實施個性化教學策略的基礎。
總之,整個個性化在線學習系統就是通過數據挖掘技術,把用戶在學習過程的所有行為記錄下來,并結合用戶數據庫,從中挖掘出用戶個性化學習特征,為個性化教學策略的產生提供可靠的依據。在本文,學習者個人秘書個性化引擎的加入,主要是實現個性化學習系統中視頻主導、測驗穿插、在線交流、引導學習等功能。其中視頻能提取該集視頻所具有的知識點,作為關鍵字在知識樹中進行串聯。知識樹是惟一呈現給用戶的學習接口,讓用戶不再注重于選擇何種視頻、哪位老師所教,達到最快的學習效率。再就是測驗穿插,是在用戶不主動去做測驗的時候,類似強制于用戶做測驗,否則無法進入下階段測試。概括來說,學習者個人秘書模型設計實現以下功能:記錄學習者進行的所有學習活動;定時給予用戶學習建議與誤區糾正;能主動與其他學習者的學習秘書進行交流;記錄每次學習周期,學習者的學習路線。
2.2 Web數據挖掘在系統中的應用
數據挖掘是開發Web智能的學習系統的關鍵所在,它對個性化學習模型的構建、個性化的學習資源的提供、個性化學習的指導、系統性能的改進等方面應用非常多。
⑴ 個性化學習模型的構建
學習者模型的構建本就是根據學習者不同的個性特征參數,對學生學習活動進行跟蹤,并且記錄學生學習的相關信息,如:學生經常訪問的URL的次數、停留時間、訪問的課程數等等。Web數據挖掘用去噪和模式進行“模式發現”,得到學生學習的個性特征,建立、完善學生學習模型,建立學生個性數據庫,為不同的學生提供智能、個性的學習策略。
⑵ 個性化學習資源的提供
在系統進行模式發現后,需要為學生從后臺數據庫中調度學習資源,這時候就需要系統將學生無關及學生不感興趣的資源進行篩選。Web數據挖掘中的統計分析技術可以根據學生經常訪問的頁面推測學生下一步的行為,推測出其感興趣的相關資源,從而減少學生的搜索時間,合理提供備用資源。
⑶ 個性化學習的指導
一個好的學習系統能適應的并不只是一類人,而是不同背景,不同能力,不同目的的人,因為每個人的學習能力、興趣、習慣以及基礎都有很大的差異。若采取進入系統平臺前讓用戶提交測試用戶屬性信息的一些表單,初始化學生學習特征,但是其中的屬性卻是時刻變動的,普通的學習系統無法做到隨機應變。利用Web數據挖掘技術,挖掘用戶的使用數據日志,分析用戶的瀏覽趨勢,從而形成一組按時間排序的會話,預測用戶未來的訪問模式并做及時的指導。這樣針對不同類型的用戶,系統可以安排特定的內容,做到真正意義上的“因材施教”。
⑷ 系統性能的改進
Web數據挖掘技術提供網站構架及用戶的使用信息,管理員可以根據這些信息,控制Web緩存、負載平衡和網絡構架等問題,從而做到了系統的安全性與穩定性。
3 結束語
基于Web數據挖掘的個性化學習系統研究,以“個性化E-learning系統研究與實現”課題為背景,實現了Web數據挖掘技術的應用、學習知識點概念相關性的算法分析與設計、且構建一個基于Web的學習者模型,闡述系統研究思路,并完成了系統設計與實現應用。在一定基礎上為在線學習系統的個性化應用提供理論與推廣參考價值。同時,本文雖取得了具體的應用效果,但在個性化學習資源的組織與動態呈現上未能與學習者模型聯系,以呈現針對不同用戶的個性化學習內容頁面。這將是今后需要進一步研究的問題。
參考文獻:
[1] 陶劍文.基于多Agent的協作式網絡學習系統模型研究[J].計算機時代,2006.7:64-66
[2] 單蓉.一種基于用戶瀏覽行為更新的興趣模型[J].電子設計工程,20l0.4:61-62
[3 唐遠洋,黃爾嘉.知識挖掘技術與網絡教育資源的組織[J]. 情報資料工作,2005.4:107-109
[4] 游文,葉水生.電子商務推薦系統中的協同過濾推薦[J].計算機技術與發展,2006.9:97-99
[5] 邱明虹,何躍.從Web日志中挖掘用戶興趣路徑算法改進[J].計算機工程與應用,2008.26:129-131
關鍵詞:高職教育;個性化學習;數據挖掘;商業智能
中圖分類號:TP311.13
作為我國高等教育一支重要生力軍――高等職業教育近幾年來的發展可謂迅猛,無論是學校數還是學生人數,高職專科的規模已是我國高等教育的半壁江山。高職教育對人才的培養目標是為國家和地方經濟的發展輸送適應生產、建設服務等一線急需的應用型高素質人才,《國務院關于大力發展職業教育的決定》中就提出了“堅持以就業為導向,深化職業教育教學改革”,要求加強職業院校對學生實踐能力和職業技能的培養。
1 現狀
目前,高職學生在學校完成系統的課程學習依然是高職教育教學的主要方式,在此過程中,由于學生個體特性、就業意向、專業方向等各種因素的影響,獲取的知識無論從方式方法、內容結構,還是真正掌握的程度來說都因人而異,而這其中有相當大的部分是學生主動性選擇的結果;此外,在高職教育教學改革的嘗試中,大類招生、拓展專業等多項措施在很多職業院校中已然試行,這就給予學生更多的自和選擇的機會。
然而,在自主選擇的過程中,由于沒有一個可參照的、適合自己的挑選標準,高職學生進行各項選擇時在很大程度上有著“扎堆隨大流”、“哪個課能混好過”的心理,這就導致主動選擇的課程,其學習過程并不順暢、學習效果也不理想,沒有提升自身知識結構的質量。這種高職教育中教與學環節的脫節會對高職學生的能力培養產生有著不可忽視的影響。
2 研究思路
隨著教育信息化的深入發展,先進的信息技術手段在教育教學的方方面面都得以有效利用,這也為學生綜合能力培養的探索與嘗試提供了新的途徑,數據挖掘技術就是其中很重要的一種。數據挖掘指的是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。在此過程中,數據源必須是真實的、大量的、含噪聲的,而從中發現的是用戶所感興趣的知識內容,這些知識應該是可以接受和理解、并且能加以進一步運用的。
數據挖掘技術之所以在教育行業有更為廣泛、實際的應用,這是由于各個學校都會有自己的一整套數據庫系統,用于記錄學生的學籍信息、課程教學過程等歷史數據,這樣,就可以嘗試運用先進的數據挖掘技術和智能分析工具,通過對高職教育研究和教學過程中積累的海量數據進行采集分類、挖掘和分析,從多角度、多層次出發,構建識別個體特點、知識構成和獲取方式等要素之間關聯模式的數據模型。數據挖掘是一門交叉學科,其理論和方法有很多,包括K-最近鄰分類器、判別分析、人工神經網絡和分類樹等,它把人們對數據的應用從低層次的簡單查詢,提升到從數據中挖掘知識,提供決策支持。在這里就是要將數據挖掘方法與高職教育教學研究相結合,設計實際的分析應用系統,具體來說:
(1)數據挖掘技術面向高職教育這一特定領域中的主體――高職學生,針對專門的指標,包括個體特性、專業要求、就業意向等,著眼于課程這個知識載體,對它們之間的關系進行深層次、智能化的挖掘、分析;
(2)數據挖掘的應用會具體到建模、變量篩選和導入等方面,而不只是一些抽象的挖掘算法的研究;
(3)數據分析采用先進的商業智能工具,同樣,數據的展現手段基于平臺,具有開放化、模塊化、網絡化特點。
3 系統框架
系統定位于個性化學習分析,其框架結構參見圖1,主要由數據集成、數據建模、數據分析及展現等部分構成。具體來說,數據集成模塊完成定義數據結構、裝載、清洗、合并數據的功能;數據建模是指建立數據分析OLAP及數據挖掘模型;數據分析旨在分析和比較各種不同算法得出的結果,尋找最為匹配的算法,而數據展現的作用是根據分析結構靈活創建數據報告。
圖1 系統框架結構
在此架構下,各個子系統的功能如下所述:
(1)數據集成。分析和歸納課程教學過程中產生的系列數據,根據其特征和行為設計及定義便于分析和挖掘的數據結構,然后并進行數據集成。數據集成的工作包括從異構數據源獲取數據,將其進行清洗、轉換、合并,然后加載到數據倉儲中。數據集成執行的時間、相互的順序、成敗對將來的分析結果的有效性則至關重要。
(2)數據建模。典型的數據挖掘工具將在構建了數據倉庫后進行分析并生成結果,一些工具也可以使用關系型數據進行分析,數據分析的結果獨立于數據倉庫中使用的數據。數據挖掘核心的部分就是選擇挖掘算法并建立數據模型,這樣就可以根據學生個體信息、學生成績等數據之間的關系將這些學生劃分成分析有意義的組群并預測他們的行為;當把這些組發送回分析過程時,數據挖掘引擎允許分析人員和用戶根據這些簇進行劃分和細化。
(3)數據分析與展示。以學生個體信息和課程數據為輸入,利用所篩選出的最佳建模方法,逐步提出一個可實現個性化學習分析的數據模型,以衡量及提高模型預測的準確度。將分析結果以特定的客戶端或Web方式進行展現,以建立的分析結果展示平臺,具有高度的開放性、通用性和可擴展性。通過建模創建了正確的模型,數據挖掘的重點就從分析轉到結果上,數據報告的展現方式有多種,可通過專業的報告工具,也可自行編寫Web網站進行。
4 結束語
在高職教育教學研究中運用先進的數據挖掘技術手段,針對各項課程教學、學生管理數據進行深度挖掘、分析,研究個性化學習模式,為學生的自我學習規劃提供具體化、智能化分析結果以供參照,在此情況下,先進技術手段的支持,對教與學都有著不可忽視的影響。同時,也為人才培養的探索與嘗試提供新途徑。
參考文獻:
[1]趙云鵬,石麗,劉瑩.基于數據挖掘的高校規模分析及應用研究.第九屆全國信息獲取與處理學術會議論文集[C].2011.
[2].數據挖掘在高職院校教學管理中的應用[J].清遠職業技術學院學報,2010(12).
[3]干娟.基于決策樹算法的學生綜合測評系統的設計[J].安徽電子信息職業技術學院學報,2011(04).
>> 從家庭視角探究中西方文化價值觀的差異 動畫片《功夫熊貓》中的中西方文化價值觀的異同研究 從中西方文化價值觀的差異性看公益廣告的翻譯 中西方文化價值觀交融的絕對性與相對性分析 中西方網絡廣告的文化價值觀比較 高中英語中西方文化對學生價值觀的影響分析 淺談中西方文化背景及價值觀差異 大學生文化價值觀及其班級旅游研究 中西方文化背景下的大學生心理健康教育研究 淺談大學生外語教學中中西方價值觀有效融合途徑 《紅字》中的西方文化價值觀解析 從《當幸福來敲門》看西方文化價值觀 《特洛伊》中的西方文化價值觀解析 中西方核心價值觀比較研究 中西方體育價值觀比較研究 淺論大學生文化價值觀的培育 大學生文化價值觀調查與分析 高等教育模式中的大學生多元文化價值觀 淺談新疆大學生文化價值觀教育 大學生文化價值觀的培育與優化 常見問題解答 當前所在位置:l.
[3]任友群,鄭旭東,吳F瑜.深度推進信息技術與教育的融合創新――《教育信息化“十三五”規劃》(2016)解讀[J].現代遠程教育研究,2016(5):3-9.
[4]楊現民,唐斯斯,李冀紅.發展教育大數據:內涵、價值和挑戰[J].現代遠程教育研究,2016(1):50-61.
[5]余鵬,李艷,呂鵬.高等院校大數據挖掘與決策分析體系的應用研究[J].現代教育技術,2016,26(8):102-108.
[6]朱漢民.中國傳統文化導論[M].長沙:湖南大學出版社,2010.
[7]歐陽劍波.中國傳統文化、、西方文化碰撞的當代審視[J].青海社會科學,2011(6):17-21.
[8]楊玲.從網絡流行語看大眾文化特征[D].武漢:華中師范大學,2006.
[9]郭志剛.社會統計分析方法:SPSS軟件應用[M].北京:中國人民大學出版社,1999.
[10]安興茹.我國詞頻分析法的方法論研究(I)――統計分析要素的界定、分類及問題[J].情報雜志,2016,35(2):75-80.
[11]程樹銘,呂亞萍.試論語義特征分析法[J].江蘇理工學院學報, 2015(3):25-30.
[12]張敏.數據挖掘技術及應用[J].信息技術,2010,34(8):167-169.
[13]齊英艷,李建國.當代西方思想文化對中國青年知識分子的影響[J].中國青年研究,2008(9):25-30.
[14]閔會軒.中國社交網絡中的文化價值觀分析[J].東南傳播,2015(1):34-36.