在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網(wǎng) 資料文庫(kù) 基于數(shù)據(jù)挖掘技術(shù)的學(xué)生成績(jī)研究范文

基于數(shù)據(jù)挖掘技術(shù)的學(xué)生成績(jī)研究范文

本站小編為你精心準(zhǔn)備了基于數(shù)據(jù)挖掘技術(shù)的學(xué)生成績(jī)研究參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫(xiě)作靈感。歡迎深入閱讀并收藏。

基于數(shù)據(jù)挖掘技術(shù)的學(xué)生成績(jī)研究

摘要:信息技術(shù)的發(fā)展及應(yīng)用以及如何利用信息技術(shù)提高高校的管理水平,是高職院校面臨的重大課題。在學(xué)習(xí)和工作的過(guò)程中接觸到數(shù)據(jù)挖掘這一先進(jìn)的概念,力圖通過(guò)數(shù)據(jù)挖掘從學(xué)生成績(jī)中找到隱含在其中的有效信息,這樣既可以幫助老師了解學(xué)生的學(xué)習(xí)情況,又可以幫助學(xué)生了解學(xué)習(xí)重點(diǎn),達(dá)到教學(xué)相長(zhǎng)的目的。利用數(shù)據(jù)挖掘技術(shù)中的決策樹(shù)的相關(guān)知識(shí)和方法,以多屆學(xué)生的《計(jì)算機(jī)應(yīng)用基礎(chǔ)》成績(jī),對(duì)學(xué)生的成績(jī)進(jìn)行分析。主要使用數(shù)據(jù)挖掘中的決策樹(shù)知識(shí)將決策樹(shù)應(yīng)用在學(xué)生成績(jī)數(shù)據(jù)挖掘的模型上,使用SPSSModeler軟件利用C5.0算法分析出哪些因素對(duì)于《計(jì)算機(jī)應(yīng)用基礎(chǔ)》考試的影響最大,揭示其中規(guī)律,為今后教學(xué)工作及教學(xué)安排提供有效的科學(xué)的指導(dǎo)依據(jù)。

關(guān)鍵詞:數(shù)據(jù)挖掘;考試成績(jī);決策樹(shù);關(guān)聯(lián)規(guī)則

1決策樹(shù)的基本概念

在已有的大量源數(shù)據(jù)中得到有效的分類(lèi)器有許多種辦法,決策樹(shù)就是其中一種有效的辦法。他在數(shù)據(jù)挖掘中尤其在數(shù)據(jù)分類(lèi)領(lǐng)域中應(yīng)用十分廣泛。決策樹(shù)算法主要是通過(guò)一組輸入樣本數(shù)據(jù)然后對(duì)樣本進(jìn)行決策樹(shù)歸納的一種方法。決策樹(shù)的表現(xiàn)形式是一個(gè)倒樹(shù)狀結(jié)構(gòu)圖,并且在樹(shù)枝的節(jié)點(diǎn)上一般還附帶概率結(jié)果,它是一種是直觀的使用統(tǒng)計(jì)概率來(lái)分析對(duì)象的圖表示方法。

2幾種常用的決策

樹(shù)算法常見(jiàn)的算法有CHAID、CART、Quest和C5.0。判斷決策樹(shù)算法是否合適,就看每一個(gè)決策樹(shù)分組的組之間的差別是否夠大,屬性差別越大就是算法越合適。決策樹(shù)算法擅長(zhǎng)處理離散型數(shù)據(jù),并且處理非數(shù)值性數(shù)據(jù)時(shí)效率的方面也有不錯(cuò)的表現(xiàn)。

3決策樹(shù)的評(píng)價(jià)標(biāo)準(zhǔn)

建立了決策樹(shù)模型后需要給出該模型的評(píng)估值,這樣才可以來(lái)判斷模型的優(yōu)劣。學(xué)習(xí)算法模型使用訓(xùn)練集(trainingset)建立模型,使用校驗(yàn)集(testset)來(lái)評(píng)估模型。經(jīng)過(guò)校驗(yàn)集評(píng)估后決策樹(shù)進(jìn)行評(píng)價(jià)。評(píng)估指標(biāo)有分類(lèi)的準(zhǔn)確度,描述的簡(jiǎn)潔性和計(jì)算的復(fù)雜程度等指標(biāo)。

4決策樹(shù)在計(jì)算機(jī)成績(jī)分析中的應(yīng)用

4.1確定挖掘?qū)ο?/p>

本次挖掘的對(duì)象是以《計(jì)算機(jī)基礎(chǔ)》為基礎(chǔ)信息,之所以選擇這門(mén)課程,是因?yàn)樗切律雽W(xué)的第一門(mén)與計(jì)算機(jī)相關(guān)的課程,也是今后繼續(xù)學(xué)習(xí)計(jì)算機(jī)相關(guān)課程的基礎(chǔ)。《計(jì)算機(jī)基礎(chǔ)》包含平時(shí)成績(jī)及期末考試成績(jī)。考試在新生入學(xué)的第一學(xué)期的期末,即每年的1月份進(jìn)行期末考試,期末考試總分為40分,占總成績(jī)的40%。期末考試的形式為上機(jī)操作,其中包括Word,Excel和powerpoint分別占總成績(jī)的40%,40%,20%。在平時(shí)成績(jī)中有3次隨堂測(cè)驗(yàn)同樣分別是Word,Excel和powerpoint,將其成績(jī)匯總作為平時(shí)成績(jī),總分為60分,平時(shí)成績(jī)占總成績(jī)的60%。本論文決定使用決策樹(shù)方法研究《計(jì)算機(jī)基礎(chǔ)》考試中word,Excel和powerpoint幾個(gè)部分對(duì)最終成績(jī)的影響程度。通過(guò)構(gòu)造決策樹(shù)可以更容易找到哪些因素對(duì)最終成績(jī)影響更大。同時(shí)采用關(guān)聯(lián)規(guī)則中的Apriori算法研究《計(jì)算機(jī)基礎(chǔ)》和后續(xù)課程《fireworks》的關(guān)聯(lián)。

4.2數(shù)據(jù)的預(yù)處理

本文用到的2013至2015級(jí)學(xué)生的《計(jì)算機(jī)基礎(chǔ)》成績(jī)及《fireworks》成績(jī),是在學(xué)校教務(wù)部門(mén),使用我校教務(wù)部門(mén)的教務(wù)管理軟件下載得到,由于學(xué)校的管理軟件的功能有限,所以下載的成績(jī)是以班級(jí)為單位的。(1)數(shù)據(jù)的預(yù)處理。數(shù)據(jù)的預(yù)處理對(duì)與數(shù)據(jù)挖掘有著重要的作用,在本文研究的目標(biāo)模型是多界學(xué)生的《計(jì)算機(jī)基礎(chǔ)》及其后續(xù)學(xué)習(xí)課程的成績(jī),并且這些成績(jī)是以Excel文件的形式保存的。其中包含的屬性包含學(xué)號(hào)、姓名、平時(shí)成績(jī)、期末成績(jī)、總成績(jī)、專(zhuān)業(yè)名稱(chēng)、課程名稱(chēng)、任課教師等。現(xiàn)在需要做的就是對(duì)這些數(shù)據(jù)進(jìn)行集成和預(yù)處理。(2)數(shù)據(jù)清理。數(shù)據(jù)預(yù)處理的第一步就是處理缺失數(shù)據(jù)。通常情況下對(duì)于缺失值的處理方法包括:人工填寫(xiě),使用最有可能的數(shù)值,忽略數(shù)值,平均值填充等方法。在處理《計(jì)算機(jī)基礎(chǔ)》考試成績(jī)的過(guò)程中發(fā)現(xiàn)大部分缺失值產(chǎn)生的原因是由于缺考造成的,所以對(duì)于缺失值的處理方法是忽略條目的方法。由計(jì)算機(jī)基礎(chǔ)是第一學(xué)期的考試科目,所以缺考學(xué)生沒(méi)有,得到有效數(shù)據(jù)2397條。(3)數(shù)據(jù)集成。我們需要將《計(jì)算機(jī)基礎(chǔ)》,《fireworks》等科目的成績(jī)集成在一個(gè)成績(jī)表中,也就是數(shù)據(jù)集成。集成后數(shù)據(jù)表格包含《計(jì)算機(jī)應(yīng)用基礎(chǔ)》,《fire-works》考試成績(jī),每門(mén)課程包括平時(shí)成績(jī),期末成績(jī)及總成績(jī),任課教師等屬性。其中原始樣本為2397個(gè),經(jīng)過(guò)預(yù)處理可以進(jìn)行數(shù)據(jù)挖掘的樣板數(shù)為2253個(gè)。本次數(shù)據(jù)挖掘樣本有效率為94%。(4)數(shù)據(jù)的歸約。經(jīng)過(guò)數(shù)據(jù)集成后,我們還需要對(duì)數(shù)據(jù)進(jìn)行歸約,對(duì)數(shù)據(jù)進(jìn)行離散化處理把連續(xù)型數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù),可以使數(shù)據(jù)挖掘的結(jié)果更加直觀簡(jiǎn)潔。在本文中我們通過(guò)數(shù)據(jù)集成,將學(xué)生的成績(jī)數(shù)據(jù)集成到一個(gè)包含學(xué)號(hào)、姓名、專(zhuān)業(yè)類(lèi)別、平時(shí)成績(jī)、期末成績(jī)、總成績(jī)等屬性的數(shù)據(jù)文件。首先我們研究的課題是利用決策樹(shù)研究平時(shí)成績(jī)與期末成績(jī)和影響考試通過(guò)率因素。所以首先剔除《fireworks》的考試成績(jī),以及專(zhuān)業(yè)類(lèi)別、任課教師屬性。還因?yàn)樾彰c學(xué)號(hào)兩個(gè)屬性是屬于相關(guān)屬性,也就是說(shuō)姓名與學(xué)號(hào)是對(duì)應(yīng)的關(guān)系,相互可以替代,但是姓名還有重名的可能,而學(xué)號(hào)是唯一的,所以將姓名的屬性剔除。只保留學(xué)號(hào),平時(shí)成績(jī),期末成績(jī),總成績(jī)這些屬性。對(duì)于決策樹(shù)的構(gòu)成最好使用離散型數(shù)值,這樣可以使結(jié)果簡(jiǎn)潔,減少計(jì)算量。所以,我們需要將成績(jī)庫(kù)中的數(shù)據(jù)進(jìn)行離散化處理。

目前,期末考試的總成績(jī)?yōu)?00分,而評(píng)價(jià)學(xué)生通過(guò)考試的分?jǐn)?shù)線(xiàn)為60分,所以,將總成績(jī)屬性離散化為兩個(gè)部分,即:將高于60分的學(xué)生成績(jī)轉(zhuǎn)換為“yes”,分?jǐn)?shù)低于60分的成績(jī)轉(zhuǎn)換為“no”。平時(shí)成績(jī)占總成績(jī)60%,滿(mǎn)分為60分,按照平時(shí)成績(jī)大于54分,小于等于60分;大于47分,小于等于53分;大于41分,小于等于47分;大于35分,小于等于41分;小于等于35分五個(gè)層次,將平時(shí)成績(jī)分為“Super”“Hi”,“Mid”,“Low”,“No”五個(gè)等級(jí)。平時(shí)成績(jī)分為Word,Excel,powerpoint及平時(shí)表現(xiàn)分?jǐn)?shù)四個(gè)部分,其滿(mǎn)分分別是20,20,10,10。將這些成績(jī)按照滿(mǎn)分的90%,80%,70%,60%分成“Super”“Hi”,“Mid”,“Low”,“No”五個(gè)等級(jí)。與此同時(shí),期末成績(jī)占總成績(jī)的40%,共40分,按照期末成績(jī)分?jǐn)?shù)大于35分,小于等于40分;大于31分,小于等于35分;大于27分,小于等于31分;大于23分小于等于27分;小于等于23分,分為“Super”“Hi”,“Mid”,“Low”,“No”五個(gè)等級(jí)。

4.3利用決策樹(shù)做成績(jī)分析

使用SPSSModeler軟件中C5.0模型,得到運(yùn)算結(jié)果。通過(guò)對(duì)結(jié)果的查看得到對(duì)于考試成績(jī)影響最大的是“平時(shí)”部分,預(yù)測(cè)變量的重要性=0.36;然后是pow-erpoint和word部分,預(yù)測(cè)變量的重要性=0.23;而“出勤”部分對(duì)于是否通過(guò)考試的影響重要性為0.18。由此得出結(jié)論:對(duì)于判斷一個(gè)學(xué)生是否通過(guò)考試的幾個(gè)因素中平時(shí)成績(jī)最重要,word,powerpoint和出勤情況的占比差不多,但是對(duì)于Excel部分的相關(guān)性卻不是很強(qiáng),但是由于對(duì)于學(xué)生來(lái)說(shuō)word與Excel和power-point的重要性在學(xué)習(xí)和以后的應(yīng)用中是同等重要的,所以應(yīng)該加強(qiáng)考試出題中Excel的難度比重。5總結(jié)信息化技術(shù)的發(fā)展,對(duì)于高校這既是機(jī)遇又是挑戰(zhàn),筆者所在的學(xué)校的各個(gè)管理部門(mén)也在引入先進(jìn)的管理系統(tǒng),完善各自部門(mén)的管理。比如近些年學(xué)校陸續(xù)上了教務(wù)管理系統(tǒng)、學(xué)生管理系統(tǒng)、人事管理系統(tǒng)等等。這樣使得筆者所在學(xué)校的管理水平上了一個(gè)臺(tái)階。升級(jí)新的管理系統(tǒng)為我校積累了大量數(shù)據(jù)資源。如何利用先進(jìn)管理系統(tǒng)帶來(lái)的寶貴的數(shù)據(jù)資源也為學(xué)校各界人士提出了問(wèn)題。筆者嘗試?yán)脭?shù)據(jù)挖掘這樣一個(gè)新興的學(xué)科來(lái)對(duì)學(xué)校的數(shù)據(jù)進(jìn)行一些分析,力圖從中挖掘出一些隱藏在數(shù)據(jù)中的一些信息,為學(xué)校的建設(shè)提供科學(xué)的理論依據(jù)。

參考文獻(xiàn)

[1]范佳鳳,袁娟,許艷敏.基于成績(jī)分析的大學(xué)教與學(xué)現(xiàn)狀思考[J].現(xiàn)代商貿(mào)工業(yè),2013,(03).

[2]戎荷婷,王瑞玲,武晶,楊秋白.學(xué)生行為對(duì)學(xué)生成績(jī)的影響探究[J].現(xiàn)代商貿(mào)工業(yè),2016,(23).

[3]臧琛,李景平,劉海亮,王景磊.工程訓(xùn)練學(xué)生成績(jī)考核體系探討與設(shè)計(jì)[J].現(xiàn)代商貿(mào)工業(yè),2017,(09).

作者:狄曉嬌 單位:遼寧廣告職業(yè)學(xué)院

主站蜘蛛池模板: 制服丝袜 自拍偷拍 | 亚洲免费在线视频播放 | 成人区精品一区二区不卡亚洲 | 国产小视频精品 | 精品成人久久 | 欧美日韩中文一区二区三区 | 国产一级视频在线 | 久久精品最新免费国产成人 | 久久综合一本 | 中文线码中文高清播放中 | 亚洲免费视频网站 | 选择影院在线观看 | 在线精品免费视频 | 永久在线视频 | 欧洲在线 | 欧美国产日韩综合 | 麻豆精品久久精品色综合 | 免费电视剧在哪里看 | 亚洲欧美久久婷婷爱综合一区天堂 | 成人首页| www.男人的天堂| 欧美成人伊人久久综合网 | 亚洲欧美精品一中文字幕 | 九月婷婷开心九月 | 欧美在线观看第一页 | 91久久精品一区二区三区 | 欧美日韩免费大片 | 亚洲日韩图片专区第1页 | 一级大片免费看 | 中文字幕不卡一区 二区三区 | 中文字幕乱码视频32 | 欧美五月婷婷 | 亚洲国产成人久久笫一页 | 成人四虎 | 国产电影网 | 男男羞羞视频网站国产 | 亚洲国产成人久久综合野外 | 亚洲国产综合自在线另类 | 午夜视频精品 | 婷婷丁香视频 | 91精品乱码一区二区三区 |