本站小編為你精心準(zhǔn)備了高等教育事業(yè)統(tǒng)計(jì)數(shù)據(jù)挖掘分析參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
摘要:基于目前我國高等教育統(tǒng)計(jì)分析中存在數(shù)據(jù)更新速度緩慢、數(shù)據(jù)分析滯后、數(shù)據(jù)反饋率低等問題,運(yùn)用大數(shù)據(jù)思維,將大數(shù)據(jù)思維與小數(shù)據(jù)研究相結(jié)合,重點(diǎn)關(guān)注數(shù)據(jù)挖掘技術(shù)在高等教育統(tǒng)計(jì)數(shù)據(jù)中的運(yùn)用。對比國內(nèi)外研究現(xiàn)狀,提出我國高校存在對數(shù)據(jù)挖掘重視度不高、數(shù)據(jù)挖掘技術(shù)在高等教育統(tǒng)計(jì)數(shù)據(jù)中的運(yùn)用不充分、適應(yīng)于高等教育教師與學(xué)生特點(diǎn)的數(shù)據(jù)挖掘技術(shù)應(yīng)用欠缺等問題,并提出了解決的方案。
關(guān)鍵詞:教育統(tǒng)計(jì);大數(shù)據(jù);數(shù)據(jù)挖掘
目前,我國每年教育事業(yè)統(tǒng)計(jì)工作要求調(diào)查指標(biāo)1.6萬項(xiàng),涵蓋范圍為全國50多萬所各級各類學(xué)校和機(jī)構(gòu),數(shù)據(jù)量高達(dá)55億條[1]。其中,高等教育統(tǒng)計(jì)是我國教育事業(yè)統(tǒng)計(jì)工作的重要組成部分之一,每年10月份開始通過單位收集、層層上報的方式匯總[2]。面對采集的海量數(shù)據(jù),如何將其有效利用,轉(zhuǎn)化為指導(dǎo)高校建設(shè)、高等教育管理的參考依據(jù)是亟待解決的問題。
一、我國高等教育統(tǒng)計(jì)數(shù)據(jù)分析現(xiàn)狀
2015年教育部對1991年的《中國教育監(jiān)測與評價統(tǒng)計(jì)指標(biāo)體系(試行)》進(jìn)行了修訂和完善,修訂后的指標(biāo)體系分為綜合教育程度、國民接受學(xué)校教育狀況、學(xué)校辦學(xué)條件、教育經(jīng)費(fèi)、科學(xué)研究等5類共102項(xiàng)指標(biāo),其中涉及高校的指標(biāo)為54項(xiàng)[3]。教育主管部門和各學(xué)校力求管理好數(shù)據(jù)、分析好數(shù)據(jù)、利用好數(shù)據(jù),覆蓋采集、統(tǒng)計(jì)、分析、診斷、決策等全流程,以便更好地為領(lǐng)導(dǎo)決策服務(wù)、為學(xué)校發(fā)展服務(wù)。從拍腦袋決策到用數(shù)據(jù)說話,統(tǒng)計(jì)數(shù)據(jù)在教育管理中意義重大。但各高校在具體統(tǒng)計(jì)過程中,普遍存在機(jī)械上報的情況,缺乏適應(yīng)性微觀統(tǒng)計(jì)指標(biāo)設(shè)計(jì)。同時,對已統(tǒng)計(jì)數(shù)據(jù)缺乏深入分析,大部分僅停留在簡單描述和說明上,并未真正發(fā)揮統(tǒng)計(jì)數(shù)據(jù)的反饋?zhàn)饔茫瑪?shù)據(jù)利用率較差。其主要表現(xiàn)在以下幾個方面:一是高校的教育統(tǒng)計(jì)多數(shù)是被動地完成報表任務(wù),數(shù)據(jù)統(tǒng)計(jì)人員多是兼職的,服務(wù)方向依然是以為上級服務(wù)為主,教育統(tǒng)計(jì)仍以搜集整理內(nèi)部數(shù)據(jù)為主,未能主動地根據(jù)教育管理需要進(jìn)行采集,把統(tǒng)計(jì)與學(xué)校工作相結(jié)合,把統(tǒng)計(jì)信息自覺地用于決策和日常工作。二是目前統(tǒng)計(jì)的口徑較多,每年度都有高等教育事業(yè)統(tǒng)計(jì)、教學(xué)基本狀態(tài)數(shù)據(jù)采集、固定資產(chǎn)投資報表等各級各類報表,上級下達(dá)的歸口部門不同,時間節(jié)點(diǎn)的要求也不一樣。這導(dǎo)致學(xué)校不同部門給出的數(shù)據(jù)出入很大,也有學(xué)校為了應(yīng)對檢查和評估,捏造數(shù)據(jù),使得統(tǒng)計(jì)數(shù)據(jù)失真。三是數(shù)據(jù)統(tǒng)計(jì)之后基本上停留在數(shù)據(jù)階段,分析數(shù)據(jù)、利用數(shù)據(jù)進(jìn)行決策的意識和能力很弱。
二、大數(shù)據(jù)思維導(dǎo)入
2012年聯(lián)合國的《大數(shù)據(jù)發(fā)展:機(jī)遇與挑戰(zhàn)》中明確指出,大數(shù)據(jù)時代已經(jīng)來臨,大數(shù)據(jù)的出現(xiàn)將會對社會各個領(lǐng)域產(chǎn)生重要的影響[4]。近年來,我國高度重視大數(shù)據(jù)研究,2015年,中共十八屆五中全會首次提出“實(shí)施國家大數(shù)據(jù)戰(zhàn)略”,將大數(shù)據(jù)戰(zhàn)略正式上升為國家戰(zhàn)略;2016年,“十三五”規(guī)劃綱要對大數(shù)據(jù)戰(zhàn)略進(jìn)行進(jìn)一步細(xì)化,提出方向性目標(biāo)和任務(wù);2017年,中共報告提出要“推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實(shí)體經(jīng)濟(jì)深度融合”。簡單來說,大數(shù)據(jù)思維就是把一切可記錄的事實(shí)都作為數(shù)據(jù)并從中尋找有價值信息的思維[5]。主要體現(xiàn)在以下四個方面。第一,非結(jié)構(gòu)化數(shù)據(jù)也是數(shù)據(jù)。大數(shù)據(jù)的數(shù)據(jù)來源更為多樣,相比傳統(tǒng)統(tǒng)計(jì)學(xué)中數(shù)據(jù)通過簡單測量記錄的方式采集,大數(shù)據(jù)的“數(shù)據(jù)化”方式使得非結(jié)構(gòu)化數(shù)據(jù)提取成為可能,為更加客觀分析反饋結(jié)果提供有力支撐。第二,數(shù)據(jù)是動態(tài)變化的。不同于一次性的靜態(tài)數(shù)據(jù),大數(shù)據(jù)會因數(shù)據(jù)更新而發(fā)生動態(tài)變化。例如,我國每年的教育統(tǒng)計(jì)工作會得到大量的數(shù)據(jù),但其作為一次性調(diào)查,無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時更新和跟蹤比較,使得數(shù)據(jù)分析存在滯后性,無法精確給予政策支持和建議。第三,數(shù)據(jù)樣本等于數(shù)據(jù)總體。大數(shù)據(jù)強(qiáng)調(diào)要分析與事物相關(guān)的所有數(shù)據(jù)[6],增大數(shù)據(jù)覆蓋面,將“假設(shè)—驗(yàn)證”轉(zhuǎn)變?yōu)椤鞍l(fā)現(xiàn)—總結(jié)”[7],實(shí)現(xiàn)數(shù)據(jù)全面匯總,不遺漏個體化特征數(shù)據(jù)。第四,數(shù)據(jù)通過挖掘才有價值。大數(shù)據(jù)的數(shù)據(jù)容量大且繁雜,并非所有數(shù)據(jù)都是有效數(shù)據(jù)、都能直觀呈現(xiàn)出相關(guān)性。故需要根據(jù)分析目的,運(yùn)用數(shù)據(jù)挖掘技術(shù),剔除無用、虛假、錯誤的數(shù)據(jù),從而獲取有價值的信息。將大數(shù)據(jù)思維運(yùn)用到我國高等教育統(tǒng)計(jì)數(shù)據(jù)分析中,可有效解決數(shù)據(jù)更新速度緩慢、數(shù)據(jù)分析滯后、數(shù)據(jù)反饋率低等問題,但并不代表大數(shù)據(jù)就完全取代小數(shù)據(jù)研究。首先,大數(shù)據(jù)體現(xiàn)的相互關(guān)系就是由眾多小數(shù)據(jù)綜合而成的;其次,加強(qiáng)小數(shù)據(jù)研究,能較好地篩除無效數(shù)據(jù),從而促使大數(shù)據(jù)研究結(jié)論更為準(zhǔn)確。因此,我們要基于大數(shù)據(jù)研究小數(shù)據(jù),基于小數(shù)據(jù)挖掘大數(shù)據(jù)[5]。
三、我國高等教育數(shù)據(jù)挖掘現(xiàn)狀
(一)教育數(shù)據(jù)挖掘數(shù)據(jù)挖掘(DM)指的是從大量數(shù)據(jù)中提取出隱含的、具有潛在價值的信息與模式的過程[8][9]。數(shù)據(jù)挖掘研究主要分為基礎(chǔ)理論研究和應(yīng)用研究,基礎(chǔ)理論研究的重點(diǎn)是數(shù)據(jù)挖掘的方法、功能以及系統(tǒng)和軟件的建設(shè)等[10],而應(yīng)用研究則更傾向于成果應(yīng)用,教育數(shù)據(jù)挖掘(EDM)指的就是數(shù)據(jù)挖掘在教育領(lǐng)域的應(yīng)用。利用數(shù)據(jù)挖掘技術(shù),可以使教育領(lǐng)域中的大量原始數(shù)據(jù)的潛在價值得到有效開發(fā),在理論數(shù)據(jù)和實(shí)踐應(yīng)用中建立緊密聯(lián)系,實(shí)現(xiàn)透過繁雜的數(shù)據(jù),提取價值信息,進(jìn)而合理預(yù)測、有針對性地實(shí)施決策的良性循環(huán)。
(二)我國高等教育數(shù)據(jù)挖掘研究方法Romero和Ventura通過分析1995~2005年教育數(shù)據(jù)挖掘的相關(guān)研究文獻(xiàn),基于網(wǎng)絡(luò)教育系統(tǒng)的特定方法主要包括統(tǒng)計(jì)和可視化、Web挖掘,其中,Web挖掘分為文本挖掘,關(guān)系規(guī)則挖掘和序列模式挖掘、聚類、分類和偏差檢測三組[11]。Bak-er[12]將教育數(shù)據(jù)挖掘方法分為預(yù)測、聚類、關(guān)系挖掘、人類的判斷和模式發(fā)現(xiàn)等5大類。對比2008~2009年國家教育數(shù)據(jù)挖掘會議文章,發(fā)現(xiàn)隨著關(guān)系挖掘研究的減少,預(yù)測研究大幅提升,模式發(fā)現(xiàn)研究逐步展開[12]。孫志梅通過查閱2010~2016年教育數(shù)據(jù)挖掘相關(guān)論文信息,指出目前國內(nèi)教育數(shù)據(jù)挖掘常用方法是分類、聚類、預(yù)測和關(guān)系挖掘,模型構(gòu)建、可視化呈現(xiàn)則處于起步階段[13]。由此可見,針對教育數(shù)據(jù)挖掘的研究,國外的研究方法以及項(xiàng)目反映理論的結(jié)構(gòu)方程模型和貝葉斯網(wǎng)絡(luò)等的運(yùn)用,更具有前瞻性和應(yīng)用價值。
(三)我國高等教育數(shù)據(jù)挖掘研究應(yīng)用國外開展數(shù)據(jù)挖掘研究較早,在高等教育領(lǐng)域逐漸形成“渴望學(xué)習(xí)”“適應(yīng)性學(xué)習(xí)”“希維塔斯學(xué)習(xí)”等成熟應(yīng)用[14]。近年來,我國學(xué)者針對高等教育的各個方面正在進(jìn)行數(shù)據(jù)挖掘分析的嘗試。例如:周國福提出一種基于數(shù)據(jù)挖掘技術(shù)的高校學(xué)生成績分析算法,通過收集學(xué)生課程表現(xiàn)數(shù)據(jù),對學(xué)生未來成績作出預(yù)測[15]。董瀟瀟等根據(jù)高校各種校園數(shù)據(jù),構(gòu)建大學(xué)生行為畫像,通過聚類分析,挖掘大學(xué)生學(xué)習(xí)生活的潛在規(guī)律,為教育管理部門提供決策依據(jù)[16]。胡水星基于Moodle網(wǎng)絡(luò)日志和微視頻教學(xué)應(yīng)用案例,對教育數(shù)據(jù)挖掘的具體應(yīng)用進(jìn)行實(shí)證分析,從而為進(jìn)一步優(yōu)化教學(xué)提供教育支持[17]。孫曙輝等提出了智慧課堂數(shù)據(jù)挖掘分析的四類應(yīng)用模式,并結(jié)合真實(shí)數(shù)據(jù)研究學(xué)生主觀行為對成績的影響[18]。整體研究比較零散,缺乏對高校系統(tǒng)性的應(yīng)用研究和探索,未形成在我國高等教育領(lǐng)域普遍認(rèn)可和推廣的應(yīng)用模式。
四、美國教育數(shù)據(jù)統(tǒng)計(jì)、分析及應(yīng)用理念
美國國家教育統(tǒng)計(jì)中心(NCES)作為國家教育數(shù)據(jù)的統(tǒng)計(jì)與研究機(jī)構(gòu),是美國教育部教育科學(xué)院的直屬機(jī)構(gòu),其主要職能是采集、分析、評估和本國及其他國家教育統(tǒng)計(jì)數(shù)據(jù)。為美國各級各類教育政策制定提供豐富的數(shù)據(jù)資源和分析報告,有效地提高了美國教育的管理、協(xié)調(diào)、評價和監(jiān)督能力。關(guān)于數(shù)據(jù)如何轉(zhuǎn)化成信息、知識及智能,美籍華人科學(xué)家張小彥博士這樣介紹:“數(shù)據(jù)是對一個物體、事件、現(xiàn)象的記錄,原始數(shù)據(jù)只要經(jīng)過去重、清洗、篩選、加工才能成為有用的數(shù)字信息,經(jīng)過分析,同樣的數(shù)字信息不斷重復(fù)顯現(xiàn),事物的本質(zhì)規(guī)律才能凸顯,才會被揭示,這時的信息才可以成為知識。知識的重要性在于利用規(guī)律預(yù)測未來,當(dāng)知識被應(yīng)用于實(shí)踐解決實(shí)際問題后會產(chǎn)生智慧:知識和經(jīng)驗(yàn)的結(jié)晶。智能對特定事物有著直接行動的指導(dǎo)意義,實(shí)踐性強(qiáng)。因此,智能首先在軍事和商業(yè)上得到應(yīng)用和發(fā)展。數(shù)據(jù)、信息、知識、和智能是決策過程中不同層次的理念”。在現(xiàn)代社會,科學(xué)是占主導(dǎo)地位的認(rèn)知手段,而以數(shù)據(jù)為依據(jù)的智能決策發(fā)揮著越來越大的作用。美國明尼蘇達(dá)大學(xué)校務(wù)研究辦公室(OIR)為學(xué)校校務(wù)的規(guī)劃、政策的形成以及決策的制定收集數(shù)據(jù)并進(jìn)行分析。對于提供給學(xué)校決策層、政府機(jī)構(gòu)和其他內(nèi)外部贊助者的數(shù)據(jù),確保其完整性。在從事尖端研究、探索新的分析方法、設(shè)計(jì)并實(shí)施調(diào)查及其他數(shù)據(jù)收集工具等方面發(fā)揮領(lǐng)導(dǎo)作用。在全國范圍內(nèi)與其他高等教育院校、政策與研究中心以及政府機(jī)構(gòu)合作,以推廣最佳做法、促進(jìn)學(xué)術(shù)水平的提高。其數(shù)據(jù)來源主要有三:一是來自于學(xué)術(shù)參與,自我意識與認(rèn)知,與學(xué)生、教師的互動,學(xué)術(shù)成功的障礙,校園氛圍的調(diào)查報告;二是學(xué)校采集的內(nèi)部數(shù)據(jù);三是來自教育綜合數(shù)據(jù)系統(tǒng)、交流、第三方的外部數(shù)據(jù)。建立用于衡量方案進(jìn)程的基準(zhǔn)線,通過數(shù)據(jù)分析確定可行的、有幫助的項(xiàng)目和政策,滿足戰(zhàn)略計(jì)劃目標(biāo)、責(zé)任和認(rèn)證標(biāo)準(zhǔn)。
五、教育統(tǒng)計(jì)數(shù)據(jù)挖掘與分析方式的思考
目前,國內(nèi)外部分高校對教育統(tǒng)計(jì)數(shù)據(jù)的挖掘與分析進(jìn)行了有益的探索,為我們不斷完善創(chuàng)新數(shù)據(jù)統(tǒng)計(jì)方法、來源、存儲等,為數(shù)據(jù)的采集、梳理、分析系統(tǒng)化提供了研究基礎(chǔ)與實(shí)踐成果。接下來,高校可以在以下幾個方面加強(qiáng)統(tǒng)計(jì)數(shù)據(jù)的研究與實(shí)踐。一是建立教育大數(shù)據(jù)人才培養(yǎng)和協(xié)同創(chuàng)新中心,發(fā)揮好學(xué)校教育學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)、管理學(xué)、數(shù)學(xué)等方面的基礎(chǔ)和優(yōu)勢,整合優(yōu)化資源,推進(jìn)學(xué)科交叉融合,加強(qiáng)政校、校企、校校之間的合作,聯(lián)合打造協(xié)同創(chuàng)新平臺,開展教育大數(shù)據(jù)的科學(xué)研究以及創(chuàng)新型人才培養(yǎng)。二是充分發(fā)揮好數(shù)據(jù)中心對教育事業(yè)的智庫作用。借鑒和引進(jìn)國內(nèi)外教育大數(shù)據(jù)研究的方法、成果及經(jīng)驗(yàn),充分運(yùn)用數(shù)據(jù)挖掘與分析技術(shù),開展針對性強(qiáng)、有前瞻性的數(shù)據(jù)研究工作,為教育事業(yè)發(fā)展、學(xué)校的辦學(xué)決策提供參考。三是申報建設(shè)教育數(shù)據(jù)平臺,探索教育數(shù)據(jù)分析研究成果的應(yīng)用機(jī)制和轉(zhuǎn)化機(jī)制,圍繞教育行業(yè)和教育服務(wù)周邊領(lǐng)域,瞄準(zhǔn)行業(yè)領(lǐng)域需求,充分發(fā)揮研究平臺優(yōu)勢,將教育數(shù)據(jù)研究成果轉(zhuǎn)化為生產(chǎn)力。
六、結(jié)語
目前國內(nèi)關(guān)于教育事業(yè)統(tǒng)計(jì)的研究范圍、方法等仍有較大提升空間。首先,目前高校已經(jīng)認(rèn)識到大數(shù)據(jù)對高等教育發(fā)展的重要意義,但對于具體的高等教育數(shù)據(jù)如何挖掘還未高度重視;其次,數(shù)據(jù)挖掘技術(shù)在高等教育統(tǒng)計(jì)數(shù)據(jù)中的運(yùn)用不充分,在高等教育的諸多領(lǐng)域還未涉及;最后,還未形成適應(yīng)于高等教育教師與學(xué)生特點(diǎn)的推廣模式,針對性不強(qiáng)。在我國持續(xù)深入推進(jìn)大數(shù)據(jù)戰(zhàn)略的背景下,我國高等教育數(shù)據(jù)挖掘分析具有良好的發(fā)展前景,其不僅需要計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)領(lǐng)域的研究者精進(jìn)技術(shù)算法,還需要教育學(xué)、心理學(xué)等多領(lǐng)域研究者通力合作。立足高校實(shí)際,完善專業(yè)人才隊(duì)伍建設(shè),搭建系統(tǒng)化研究平臺,充分發(fā)揮一線教師、管理人員的作用,為早日形成適應(yīng)于高等教育數(shù)據(jù)挖掘分析的系統(tǒng)技術(shù)體系奠定堅(jiān)實(shí)基礎(chǔ)。
作者:余亞輝 高敏 夏新顏 單位:洛陽理工學(xué)院