淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用教育論文
關(guān)鍵詞:數(shù)據(jù)挖掘 高校教學(xué) 教育信息化
摘要:數(shù)據(jù)挖掘技術(shù)目前在商業(yè)、金融業(yè)等方面都得到了廣泛的應(yīng)用,而在教育領(lǐng)域應(yīng)用較少。本文通過時(shí)數(shù)據(jù)挖掘在高校教學(xué)中的應(yīng)用分析,認(rèn)為數(shù)據(jù)挖掘技術(shù)可以幫助教學(xué)人員合理安排教學(xué)工作,協(xié)助輔導(dǎo)員對(duì)學(xué)生的管理,對(duì)提高學(xué)校的教學(xué)管理水平起到指導(dǎo)作用 。
1引言
隨著12世紀(jì)信息化時(shí)代的到來,整個(gè)社會(huì)的信息總量呈幾何級(jí)數(shù)迅速增長,人們利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,積累的數(shù)據(jù)越來越多,但缺乏挖掘數(shù)據(jù)中隱藏知識(shí)的手段,導(dǎo)致了“數(shù)據(jù)爆炸但知識(shí)貧乏”的現(xiàn)象。隨著數(shù)據(jù)庫技術(shù)的成熟和數(shù)據(jù)應(yīng)用的普及,在過去的若干年中,人們積累了大量的數(shù)據(jù)資料,但數(shù)據(jù)庫中隱藏豐富的知識(shí)及有價(jià)值信息遠(yuǎn)遠(yuǎn)沒有得到充分地發(fā)掘和利用,隨著數(shù)據(jù)量以指數(shù)速度激增,人們渴求從數(shù)據(jù)汪洋中出現(xiàn)一個(gè)去粗存精、去偽存真的技術(shù),越來越希望系統(tǒng)能夠提供更高層次的數(shù)據(jù)分析功能,從中找出規(guī)律和模式,幫助決策者發(fā)現(xiàn)數(shù)據(jù)間重要但被忽略的因素,從而更好地支持決策或科研工作。正是為了滿足這種要求,從數(shù)據(jù)庫中發(fā)現(xiàn)知識(shí)(KDD)及其核心技術(shù)—數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。
2數(shù)據(jù)挖掘介紹
2.1概念及其特點(diǎn)
數(shù)據(jù)挖掘(DtaaMniing)是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的,人們事先不知道的但又潛在有用的信息和知識(shí)的過程,提取的知識(shí)表示為概念、規(guī)則、模式等。根據(jù)數(shù)據(jù)挖掘的目標(biāo),采用人工智能、集合論、統(tǒng)計(jì)學(xué)等方法,應(yīng)用相應(yīng)的數(shù)據(jù)挖掘算法,分析數(shù)據(jù)并通過可視化工具表述所獲得的模式或規(guī)則。
數(shù)據(jù)挖掘有以下特點(diǎn):(1)能發(fā)現(xiàn)反映系統(tǒng)局部特征和規(guī)律的模型;(2)自動(dòng)趨勢預(yù)測,能發(fā)現(xiàn)“新”的知識(shí);(3)比較容易獲得很多規(guī)則,并能及時(shí)更新。數(shù)據(jù)挖掘方法具有開放性思維方法,它可以及時(shí)借鑒和引用模型法的很多成果,比如神經(jīng)網(wǎng)絡(luò)、粗糙集、樸素貝葉斯算法等方法都已被利用在數(shù)據(jù)挖掘方法中。
2.2數(shù)據(jù)挖掘目的及其過程
2.2.1目的
數(shù)據(jù)挖掘期望發(fā)現(xiàn)的知識(shí)有如下幾類:(1)反映同類事物共同性質(zhì)的泛化知識(shí);(2)反映一事物和其他事物之間依賴或關(guān)聯(lián)的關(guān)聯(lián)型知識(shí);(3)分類、聚類知識(shí),是反映同類事物共同性質(zhì)的特征型知識(shí)和不同事物之間的差異型知識(shí);(4)根據(jù)歷史和當(dāng)前的數(shù)據(jù)推測未來的預(yù)測型知識(shí)。
2.2.2挖掘的過程
挖掘過程是從大型庫中挖掘未知的、有效的、可實(shí)用的信息,并使用這些信息做出決策。通?梢苑譃闇(zhǔn)備、數(shù)據(jù)挖掘、評(píng)價(jià)階段以及運(yùn)用階段等四個(gè)階段。
(1)數(shù)據(jù)準(zhǔn)備階段。數(shù)據(jù)準(zhǔn)備階段是消除數(shù)據(jù)噪聲和與挖掘主題明顯無關(guān)的數(shù)據(jù),完成對(duì)數(shù)據(jù)的篩選、變換和預(yù)處理。經(jīng)處理過的數(shù)據(jù)一般存儲(chǔ)在數(shù)據(jù)倉庫中。數(shù)據(jù)準(zhǔn)備是否做得充分將影響到數(shù)據(jù)挖掘的效率和準(zhǔn)確度以及最終模式的有效性。包括:①數(shù)據(jù)的選擇:選擇相關(guān)的數(shù)據(jù);②數(shù)據(jù)的預(yù)處理:消除噪音、冗余數(shù)據(jù);③數(shù)據(jù)的推測:推算缺失數(shù)據(jù);④數(shù)據(jù)的轉(zhuǎn)化:離散值數(shù)據(jù)與連續(xù)值數(shù)據(jù)之間的相互轉(zhuǎn)換、數(shù)據(jù)值的分組分類、數(shù)據(jù)項(xiàng)之間的計(jì)算組合等;⑤數(shù)據(jù)的縮減:減少數(shù)據(jù)量。
(2)挖掘階段。該階段是數(shù)據(jù)挖掘的核心步驟,也是技術(shù)難點(diǎn)所在。根據(jù)數(shù)據(jù)挖掘的目標(biāo),采用人工智能、集合論、統(tǒng)計(jì)學(xué)等方法,應(yīng)用相應(yīng)的數(shù)據(jù)挖掘算法,分析數(shù)據(jù)并通過可視化工具表述所獲得的模式或規(guī)則。
(3)評(píng)價(jià)階段。在數(shù)據(jù)挖掘中得到的模式可能是沒有實(shí)際意義或沒有使用價(jià)值的,也有可能不能準(zhǔn)確反映數(shù)據(jù)的真實(shí)意義,因此需要評(píng)估,確定有效的、有用的模式。評(píng)估可以根據(jù)用戶多年的經(jīng)驗(yàn),有些模式也可以直接用數(shù)據(jù)來檢驗(yàn)其準(zhǔn)確性。如何將挖掘出的有用知識(shí)清楚易懂地提供給教育和管理工作者也是一項(xiàng)非常重要的工作,選擇合適的可視化工具,將結(jié)果以關(guān)系表或用量化特征規(guī)則表示給用戶。
(4)運(yùn)用階段。用戶理解的、并被認(rèn)為是符合實(shí)際和有價(jià)值的模式形成了知識(shí)。同時(shí)還要對(duì)知識(shí)進(jìn)行一致性檢查,解決與以前得到的知識(shí)互相沖突、矛盾的地方,使知識(shí)得到鞏固。運(yùn)用知識(shí)有兩種方法:一種是只需看知識(shí)本身所描述的關(guān)系或結(jié)果,就可以對(duì)決策提供支持;另一種是要求運(yùn)用知識(shí)對(duì)新的數(shù)據(jù)進(jìn)行分析,由此可能產(chǎn)生新的問題,而需要對(duì)知識(shí)作進(jìn)一步的優(yōu)化。
2.2.3數(shù)據(jù)挖掘的方法
在數(shù)據(jù)挖掘算法的理論基礎(chǔ)上,數(shù)據(jù)挖掘中的常用方法有:①生物學(xué)方法,包括人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等;②信息論方法包括決策樹等;③集合論方法包括約略集、模糊集、最鄰近技術(shù)等;④統(tǒng)計(jì)學(xué)方法;⑤可視化技術(shù)等方法。數(shù)據(jù)挖掘的各類算法包括預(yù)測模型、關(guān)聯(lián)規(guī)則挖掘算法、分類規(guī)則挖掘算法、序列模式分析算法、聚類分析算法、WEB數(shù)據(jù)挖掘等。
3數(shù)據(jù)挖掘在高等學(xué)校教學(xué)中的應(yīng)用
3.1學(xué)生的基本信息
利用數(shù)據(jù)挖掘技術(shù),比如可以對(duì)學(xué)生訪問情況進(jìn)行分析,跟蹤、了解學(xué)生出勤情況。還可對(duì)學(xué)生年齡等個(gè)人情況進(jìn)行分析,了解學(xué)生的組成、結(jié)構(gòu),為合理地安排課程設(shè)置提供依據(jù)。通過對(duì)學(xué)生考試情況的分析,并結(jié)合出勤情況,可作為考查學(xué)生學(xué)習(xí)的情況,為合理地評(píng)估學(xué)生綜合素質(zhì)提供依。對(duì)于挖掘出來的規(guī)則信息可以利用可視化技術(shù),以圖表或曲線等形式提供給教師,以使教師能充分利用學(xué)生的問題資源,從而提高教學(xué)質(zhì)量。另外,數(shù)據(jù)挖掘可以應(yīng)用于網(wǎng)上的考試系統(tǒng),對(duì)考生情況和他取得的成績進(jìn)行挖掘,以幫助教師在以后的教學(xué)中更好地讓學(xué)生掌握知識(shí)。
3.2學(xué)生的學(xué)習(xí)特征
學(xué)生特征包括兩個(gè)方面:一是學(xué)習(xí)準(zhǔn)備,一是學(xué)習(xí)風(fēng)格。學(xué)習(xí)準(zhǔn)備包括初始能力和一般特征兩個(gè)方面。學(xué)生的初始能力是指學(xué)生在學(xué)習(xí)某一特定的課程內(nèi)容時(shí),已經(jīng)具備的有關(guān)知識(shí)與技能的基礎(chǔ),以及他們對(duì)這些學(xué)習(xí)內(nèi)容的認(rèn)識(shí)和態(tài)度。學(xué)生的一般特征則是指在學(xué)習(xí)過程中影響學(xué)生的心理、生理和社會(huì)的`特點(diǎn),包括年齡、性別、年級(jí)、認(rèn)知成熟度、智力才能、學(xué)習(xí)動(dòng)機(jī)、個(gè)人對(duì)學(xué)習(xí)的期望、生活經(jīng)驗(yàn)、文化、社會(huì)、經(jīng)濟(jì)等背景因素。學(xué)生的學(xué)習(xí)風(fēng)格與學(xué)習(xí)活動(dòng)有著密切的關(guān)系。對(duì)學(xué)生感知不同事物、并對(duì)不同事物做出反應(yīng)這兩方面產(chǎn)生影響的所有心理特征構(gòu)成了學(xué)習(xí)風(fēng)格。
利用數(shù)據(jù)挖掘功能分析學(xué)生特征,并在此基礎(chǔ)上組織學(xué)習(xí)內(nèi)容、闡明學(xué)習(xí)目標(biāo)、確定教學(xué)策略、選擇教學(xué)媒體,為學(xué)生創(chuàng)造出一個(gè)適合其內(nèi)部條件的外部學(xué)習(xí)環(huán)境,使有效學(xué)習(xí)發(fā)生在每個(gè)學(xué)生的身上。
3.3預(yù)測學(xué)生和教師行為發(fā)生
管理信息系統(tǒng)中記錄著有關(guān)學(xué)生與教師在教學(xué)中發(fā)生的各種教學(xué)事故以及典型教學(xué)事例等教學(xué)運(yùn)行信息,利用數(shù)據(jù)挖掘的關(guān)聯(lián)分析與演變分析等功能,尋找?guī)熒鞣N行為活動(dòng)之間的內(nèi)在聯(lián)系。如“當(dāng)存在A,B時(shí)可以推出’C,這樣的規(guī)則,即當(dāng)有A行為和B行為發(fā)生時(shí),還會(huì)有C行為。在教學(xué)過程中,如果發(fā)現(xiàn)學(xué)生或教師已有A,B行為時(shí),馬上可以分析其產(chǎn)生C行為的可能性,及時(shí)制定策略促進(jìn)或制止C行為的發(fā)生。
3.4合理設(shè)置課程
在學(xué)校,學(xué)生的課程學(xué)習(xí)是循序漸進(jìn)的,而且課程之間有一定的關(guān)聯(lián)與前后順序關(guān)系。在學(xué)一門較高級(jí)課程之前必須先修一些先行課程,如果先行課程沒有學(xué)好,勢必會(huì)影響后續(xù)課程的學(xué)習(xí)。另外,同一年級(jí)學(xué)習(xí)同一課程的不同班級(jí),由于授課教師、班級(jí)文化的不同,班內(nèi)學(xué)生的總體成績相差有時(shí)會(huì)很大。利用學(xué)校教學(xué)數(shù)據(jù)庫中存放的歷屆學(xué)生各門學(xué)科的考試成績,結(jié)合數(shù)據(jù)挖掘的關(guān)聯(lián)分析與時(shí)間序列分析等相關(guān)功能,就能從這些海量數(shù)據(jù)中挖掘出有用的信息,幫助分析這些數(shù)據(jù)之間的相關(guān)性、回歸性等性質(zhì),得出一些具有價(jià)值的規(guī)則和信息,最終找到影響學(xué)生成績的原因。在此基礎(chǔ)上,對(duì)課程設(shè)置做出合理安排。
3.5評(píng)價(jià)學(xué)生學(xué)習(xí)情況
學(xué)習(xí)評(píng)價(jià)是教育工作者的重要職責(zé)之一。評(píng)定學(xué)生的學(xué)習(xí)行為,既對(duì)學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動(dòng)機(jī)的作用,又是檢查課程計(jì)劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個(gè)別差異,便于因材施教的途徑。
特別是對(duì)成績管理數(shù)據(jù)庫進(jìn)行挖掘,其數(shù)據(jù)來源于成績管理數(shù)據(jù)庫,挖掘的任務(wù)就是從用戶指定的數(shù)據(jù)庫中以不同的角度或不同的層次上采掘出一系列的統(tǒng)計(jì)結(jié)果,如分布情況、關(guān)系,對(duì)比、顯著性檢驗(yàn)等,采掘結(jié)果用交叉表,特征規(guī)則,關(guān)聯(lián)規(guī)則,統(tǒng)計(jì)的曲線、圖表等表示,所以采用統(tǒng)計(jì)分析方法具有簡單、方便、直觀等優(yōu)點(diǎn),最為合適。
因此對(duì)學(xué)生學(xué)習(xí)行為和綜合素質(zhì)進(jìn)行評(píng)價(jià),一般采用模糊論中的模糊綜合評(píng)判及模糊聚類的方法,對(duì)評(píng)價(jià)結(jié)果采用了對(duì)定性和定量指標(biāo)加權(quán)平均算出綜合素質(zhì)評(píng)價(jià)得分并排名的方法,而且由于學(xué)生綜合素質(zhì)的評(píng)價(jià)指標(biāo)是動(dòng)態(tài)變化的,往往選用動(dòng)態(tài)聚類法對(duì)評(píng)判結(jié)果進(jìn)行動(dòng)態(tài)聚類分析。
3.6評(píng)價(jià)教學(xué)質(zhì)里
教學(xué)評(píng)價(jià)是根據(jù)教育目標(biāo)的要求,按一定的規(guī)則對(duì)教學(xué)效果做出描述和確定,是教學(xué)各環(huán)節(jié)中必不可少的一環(huán)。教學(xué)評(píng)價(jià)可以通過校園網(wǎng)收集學(xué)生對(duì)任課教師所講授、輔導(dǎo)課程的意見、評(píng)價(jià)。有關(guān)學(xué)生座談意見、學(xué)生打分評(píng)價(jià)、平時(shí)各項(xiàng)教學(xué)檢查、相應(yīng)課程期末考試班級(jí)成績匯總等都是教學(xué)評(píng)價(jià)的內(nèi)容,把這些數(shù)據(jù)要作為教師教授相應(yīng)課程的檔案數(shù)據(jù)全部存人數(shù)據(jù)庫。
利用數(shù)據(jù)挖掘?qū)?shù)據(jù)庫中有關(guān)教學(xué)的各項(xiàng)評(píng)價(jià)進(jìn)行分析處理,可以確定教師的教學(xué)內(nèi)容的范圍和深度是否合適;選擇的教學(xué)媒體是否適合所選的教學(xué)內(nèi)容和教學(xué)對(duì)象;講解的時(shí)間是否恰到好處;教學(xué)策略是否得當(dāng)?shù)。從而可以及時(shí)的將挖掘出的規(guī)則信息反饋給教師,以期更好地提高其教學(xué)水平,更好地服務(wù)于學(xué)生。
4結(jié)束語
總之,隨著信息量的急劇增長和對(duì)信息提取的更高要求,現(xiàn)在我們很難再依照傳統(tǒng)方法在海量數(shù)據(jù)中尋找決策的依據(jù),這就必須借助數(shù)據(jù)挖掘去發(fā)掘數(shù)據(jù)中隱藏的規(guī)律或模式,為決策提供更有效的支持。雖然數(shù)據(jù)挖掘作為一種工具,它永遠(yuǎn)也不能替代教師的地位,但是它可以為教師的決策提供科學(xué)的依據(jù)。數(shù)據(jù)挖掘技術(shù)本身就是人們大量實(shí)踐的結(jié)晶,它為建立傳統(tǒng)教學(xué)中很難獲取或不可能獲取的模型提供了捷徑。
【淺談數(shù)據(jù)挖掘技術(shù)及其在高等學(xué)校教學(xué)中的應(yīng)用教育論文】相關(guān)文章:
科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文10-21
數(shù)據(jù)挖掘在CRM中的應(yīng)用論文04-10
網(wǎng)絡(luò)營銷中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文07-07
高校管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用途徑論文10-28
數(shù)據(jù)挖掘在培訓(xùn)管理中的應(yīng)用論文12-19
分析在課程教學(xué)中數(shù)據(jù)挖掘技術(shù)的選擇論文10-15
數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情危機(jī)管理中的應(yīng)用論文10-20